modèles/AlbedoBase XL - v1.3

AlbedoBase XL - v1.3

7/22/2025

1:28:20 PM

Mots-clés et tags associés

2d,3d,albedobase xl,tout en un,anime,modèle de base,point de contrôle,cinématographique,design,jeu,modèle de génération d'image,loras fusionnés,photo,photorealiste,sdxl,sdxl 1.0,stable diffusion xl,v1.3

Portrait hyperréaliste d'une femme âgée ressemblant à Amelia Earhart, vêtue à la mode des années 1970, faisant un clin d'œil à la caméra tout en tenant une tasse de café blanche dans un cadre intérieur confortable.

Une jeune pom-pom girl brune dansant en jupe verte et haut blanc avec bordure rouge sur un terrain de stade de football, ambiance vibrante

Jeune pom-pom girl brune dansant en tenue de sport bleu vif et rouge dans un stade de football avec une foule en arrière-plan

Une pom-pom girl en maillot de sport rouge et jupe plissée blanche danse sur un terrain de football avec une foule dans les tribunes en arrière-plan.

Peinture réaliste d'une jeune femme aux longs cheveux portant une minijupe blanche et un haut bleu clair, debout dans une salle de bowling avec des boules de bowling sur le côté.

Prompts négatifs recommandés

strabismus

Paramètres recommandés

samplers

DPM++ 2M SDE Heun Exponential

steps

cfg

resolution

720x1280, 1024x1024

vae

included VAE

Conseils

Si la génération d'image ne produit aucun résultat, essayez de passer à CLIP SKIP 2 ou modifiez légèrement le prompt en changeant l'ordre ou les mots.

L'utilisation de prompts sous forme de phrases tend à améliorer la qualité d'image plus que les listes de balises.

Laisser le champ de prompt négatif vide donne souvent de meilleurs résultats.

Consultez le spec grid pour des réglages optimaux avant utilisation.

Expérimentez avec quelques prompts négatifs spécifiques comme « strabisme » pour traiter des problèmes tels que les yeux asymétriques ou la pixellisation.

Points forts de la version

v1.3

Pour illustrer la qualité liée à l'aléa du modèle, j'ai standardisé la valeur de seed à '9' pour toutes les images de démonstration destinées à l'échantillonnage et procédé à leur génération immédiate.
Particulièrement avec cette version, en raison de l'impact important des prompts négatifs, laisser le champ prompt négatif vide produit probablement la meilleure qualité.

Le spec grid(438,7 MB) : télécharger

Comme vous pouvez le constater, à mesure que le nombre de steps augmente, il devient disponible pour tous les samplers, et la qualité s'améliore également.
Grâce à l'effet de la LoRA que j'ai développée et fusionnée, comme décrit ci-dessous, utiliser des prompts sous forme de phrases plutôt que des balises (liste de mots) est directement lié à l'amélioration de la qualité.

J'ai fusionné 45 checkpoints et 7 LoRAs. Ensuite, j'ai fusionné AlbedoBase v0.4 et v0.3 dans l'ordre, moins de 0~5%, pour réveiller les modèles fusionnés dilués et devenus obsolètes.
Parmi les 7 LoRAs, une a été créée par moi. Elle consiste à analyser et annoter les légendes d'un total de 174 photos picturales de haute qualité avec GPT4-V. La fusion de cette LoRA a donné des images étonnamment claires et une compréhension des prompts particulièrement excellente.

Mes LoRAs auto-créées sont exclusivement disponibles à l'achat pour mes soutiens Ko-fi au niveau Créatif ou supérieur. Je prévois de publier de plus en plus de mises à jour à l'avenir. Les prix vont de 10 à 50 $.

Sponsors du créateur

Si vous avez trouvé de la valeur dans ce modèle, veuillez considérer offrir votre soutien. Votre contribution sera entièrement dédiée à l'avancement de la communauté SDXL.

🙋🏼‍♂️ rejoignez-nous (discord) ㅤ|ㅤ 🛒 achetez ㅤ|ㅤ 🌱 faites un don

Si vous avez trouvé de la valeur dans ce modèle, veuillez considérer offrir votre soutien. Votre contribution sera entièrement dédiée à l'avancement de la communauté SDXL.

🙋🏼‍♂️ rejoignez-nous (discord) ㅤ|ㅤ 🛒 achetezㅤ |ㅤ 🌱 faites un don

AlbedoBase XL (SFW&NSFW)

Le raffineur n'est pas nécessaire, et le VAE est inclus.

OBJECTIF

Stable Diffusion XL dispose de 3,5 milliards de paramètres (hors Raffineur), ce qui est environ 3,6 fois plus que la version SD v1.5. Je crois que ce n'est pas qu'un simple chiffre, mais un nombre qui peut mener à une amélioration significative des performances.

Il y a longtemps que nous avons réalisé que les performances globales de SD v1.5 se sont améliorées au-delà de l'imagination grâce aux contributions explosives de notre communauté. Par conséquent, je travaille à compléter ce modèle AlbedoBase XL afin de reproduire de façon optimale l'amélioration de performance survenue en v1.5 dans cette version XL également.

Mon objectif est de tester directement les performances de tous les Checkpoints et LoRAs publiquement disponibles sur Civitai, et de fusionner uniquement les ressources jugées optimales après plusieurs filtres. Ceci surpassera les performances des IA génératrices d'images de sociétés telles que Midjourney.

À ce jour, AlbedoBase XL v3.1 Large a fusionné environ 200 checkpoints sélectionnés et 251 LoRAs.

JOURNAL

v3.1-Large

• Fusion de plus de 50 versions récentes sélectionnées de modèles SDXL avec le script récursif utilisé en V3.

Le spec grid(370,7 MB) : télécharger

v3-mini

Je m'excuse sincèrement de vous avoir fait attendre aussi longtemps.

J'ai dû gérer des affaires personnelles, et pendant que je travaillais sur la nouvelle version, j'ai aussi rencontré des problèmes de santé. Même en écrivant ceci, je suis encore confronté à ces difficultés.

J'ai estimé qu'un simple bref message ne suffirait pas, je vous demande donc votre compréhension en partageant ce message plus détaillé.

Depuis la sortie de la version 2.0, je me suis consacré à étudier le deep learning de façon autodidacte. Je n'ai pas de diplôme formel, et hormis une aptitude modeste en programmation, ma formation est dans les arts. Par conséquent, je manque des bases mathématiques et scientifiques nécessaires pour des avancées majeures, malgré le temps et les efforts investis. Néanmoins, cette expérience d'étude et de recherche autonome a été un trésor inestimable dans ma vie.

Récemment, j'ai découvert une idée pouvant être une percée significative. Après avoir retravaillé des centaines de formules et méthodes depuis la version 2.0, j'ai réussi à développer un algorithme plutôt intrigant et performant. Le processus de fusion des modèles se base sur SDXL1.0 et SD1.5, ainsi que d'autres modèles sélectionnés. Ceux-ci ont été classés en cinq catégories principales : « ANIME », « RÉALISME », « ARTISTIQUE », « NSFW » et « BASE », utilisés comme jeux de données dans l'algorithme de fusion. Cette approche a donné des résultats fascinants.

Cependant, aussi difficile que fut le développement de l'algorithme, rien n'a été aussi éprouvant que la phase de test des performances. Ma santé physique et mentale s'est fortement détériorée durant cette période, au point où j'ai réalisé que je ne pouvais plus continuer seul. Cela m'a finalement conduit à décider de publier cette version.

Et maintenant, je suis ravi d'annoncer la sortie tant attendue de la version AlbedoBaseXL V3 Mini. Bien que ce modèle soit une fusion à plus petite échelle, il n'est limité à aucun domaine spécifique et fonctionne remarquablement bien dans divers domaines. Il a le potentiel de servir de nouveau modèle de base pour SDXL1.0. (Pour référence, mon algorithme de fusion n’est pas une « fusion linéaire », donc il peut être considéré comme un nouveau modèle affiné.)

Ce modèle, ainsi que les modèles AlbedoBase existants, est polyvalent et surpasse toutes les versions précédentes sur tous les aspects. (Le contenu NSFW, bien que non extrême, offre une gamme d'expression plus large que les versions antérieures comme v2.1. Un modèle de fusion NSFW dédié sera publié ultérieurement.)

D'autre part, j’ai remarqué que de nombreux modèles partagés adoptent récemment des licences interdisant la fusion ou la commercialisation externe. C’est une déception, car cela m'a empêché d'utiliser certains excellents modèles pour la fusion.

Je tiens à exprimer ma gratitude sincère aux développeurs de modèles qui ont fourni des licences gratuites, permettant à leurs modèles de haute qualité — fruits de temps et d’efforts considérables — d’être utilisés pour la fusion.

Je reviendrai bientôt.

J'attends avec impatience vos tests de performances dans un large éventail de domaines, y compris ANIME, RÉALISME, ARTISTIQUE, 2.5D, 3D, et NSFW.

En tant que développeurs de modèles, nous plantons juste les graines. C’est finalement vous, utilisateurs et artistes, qui les cultivez et faites pousser les fleurs et les fruits.

Merci, comme toujours.

Pour ceux qui souhaitent soutenir mon travail par une petite contribution financière, veuillez envisager d’utiliser les liens ci-dessous. Je suis actuellement dans l’incapacité de trouver un emploi et mon avenir financier est incertain.

🌱 faites un don

Le spec grid(380,5 MB) : télécharger

v2.1
Refusion et ajustement de v0.1 à 2.0 en utilisant un nouvel algorithme et formule de fusion.

Le spec grid(424,5 MB) : télécharger

v2.0

Je tiens à remercier tous ceux qui m'ont aidé du côté de AlbedoBase XL Pre. Sans vous, la date de sortie aurait probablement été bien plus tardive. Merci beaucoup !

J'ai écrit un script personnalisé pour converger les modèles AlbedoBase XL existants en un seul. Alignant minutieusement les poids des lignes et colonnes de tous les blocs U-NET et CLIP selon une formule unique de ma conception.
Si vous rencontrez un bug lors de la génération d'image (si rien ne se génère), veuillez passer à CLIP SKIP 2 ou modifier légèrement le prompt ! Il peut y avoir des combinaisons de prompts non reconnues par CLIP. Dans ce cas, vous pouvez changer l'ordre des mots, utiliser d'autres mots, ou simplement modifier le CLIP SKIP. Je travaillerai progressivement à résoudre ces problèmes à l'avenir comme en v1.3.

Le spec grid(403,5 MB) : télécharger

v1.3

Pour illustrer la qualité liée à l'aléa du modèle, j'ai standardisé la valeur de seed à '9' pour toutes les images de démonstration destinées à l'échantillonnage et procédé à leur génération immédiate.
Particulièrement avec cette version, en raison de l'impact important des prompts négatifs, laisser le champ prompt négatif vide produit probablement la meilleure qualité.

Le spec grid(438,7 MB) : télécharger

Comme vous pouvez le constater, à mesure que le nombre de steps augmente, il devient disponible pour tous les samplers, et la qualité s'améliore également.
Grâce à l'effet de la LoRA que j'ai développée et fusionnée, comme décrit ci-dessous, utiliser des prompts sous forme de phrases plutôt que des balises (liste de mots) est directement lié à l'amélioration de la qualité.

J'ai fusionné 45 checkpoints et 7 LoRAs. Ensuite, j'ai fusionné AlbedoBase v0.4 et v0.3 dans l'ordre, moins de 0~5%, pour réveiller les modèles fusionnés dilués et devenus obsolètes.
Parmi les 7 LoRAs, une a été créée par moi. Elle consiste à analyser et annoter les légendes d'un total de 174 photos picturales de haute qualité avec GPT4-V. La fusion de cette LoRA a donné des images étonnamment claires et une compréhension des prompts particulièrement excellente.

Mes LoRAs auto-créées sont exclusivement disponibles à l'achat pour mes soutiens Ko-fi au niveau Créatif ou supérieur. Je prévois de publier de plus en plus de mises à jour à l'avenir. Les prix vont de 10 à 50 $.

v1.2

Fusion des 22 derniers checkpoints.

Le spec grid(565,6 MB) : télécharger

v1.1

Stabilisé.
Plus détaillé.
Si vous pensez être un utilisateur avancé, je recommande la version 1.0. Si cette version trouve les bons réglages, elle peut produire des œuvres beaucoup plus vives.

Le spec grid(349,7 MB) : télécharger

v1.0

Fusion de 106 LoRAs.
Fusion de 19 Checkpoints.

Le modèle peut produire des résultats différents selon les réglages choisis, il est donc important de consulter la spec grid avant utilisation.
- J'ai constaté que l'utilisation de quelques prompts négatifs spécifiques peut aider à résoudre les problèmes d'yeux asymétriques ou d'images pixellisées. Le Spec Grid peut varier selon votre processeur ou GPU, donc veuillez l'utiliser comme référence générale. Expérimentez avec quelques prompts négatifs (ex : strabisme) pour améliorer la qualité. J'ai constaté qu'il est difficile de satisfaire tous les réglages également avec un nombre croissant de LoRA fusionnées. Cependant, je souhaite que vous vous concentriez sur cet avantage en version 1.0, car elle peut produire des œuvres d'une qualité incroyable sur divers aspects avec les bons réglages. Je reviendrai avec une version plus stable à l'avenir.
Vous pouvez trouver des valeurs de réglages utiles dans la vitrine ou en cherchant auprès d'autres utilisateurs.
Comme toujours, il est préférable de laisser le prompt négatif vide pour de meilleurs résultats.
Cette version 1.0 a demandé beaucoup de travail, donc je prends une pause. J'espère que vous apprécierez le modèle, et si vous fusionnez des modèles, veuillez les partager gratuitement sur Civitai. Ainsi, nous pourrons tous continuer à l'améliorer.

Le spec grid(479,4 MB) : télécharger

v0.4

Fusion de 132 LoRAs.
Fusion de 4 Checkpoints.

Le spec grid : télécharger

v0.3

Amélioré pour tous les samplers.
Rendu réaliste très vivant.
Stabilisé.

Le spec grid: télécharger

v0.2

Améliorations significatives en clarté et détails.
Amélioration de la représentation des mains et des pieds.
Améliorations esthétiques majeures : composition, abstraction, fluidité, lumière et couleur, etc.

v0.1

Après un affinage approprié sur le modèle SDXL1.0, fusion méticuleuse et délibérée de plus de 40 modèles de haute qualité disponibles publiquement sur Civitai.
Les tests se sont principalement concentrés sur l'assurance d'une qualité maximale avec un minimum de jetons de prompt, et il n'a pas été confirmé combien la qualité peut s'améliorer avec un grand nombre de jetons. (Merci de faire vos propres tests et partager les résultats)
Typiquement, les résultats les plus beaux sont obtenus à mi-chemin entre réalisme et animation.
Néanmoins, avec un prompt approprié, il n’y a généralement rien qu’il ne puisse exprimer. (Je soutiens qu’il possède une grande valeur comme modèle fondamental surpassant les autres en fusion. Toutefois, notez qu'il s'agit actuellement de la v0.1)

Contributeur

Camille Dubois

Bonjour ! Je m’appelle Camille Dubois. Passionnée d’art visuel, j’orchestre des galeries numériques pour révéler toute la poésie des images générées par l’IA.

🥂🎆SDXL FaeTastic🎆🥂 - v24

Photo Factory - V1

Utiliser ce modèle