modèles/AlbedoBase XL - v2.0

AlbedoBase XL - v2.0

7/31/2025

1:15:12 PM

Mots-clés et tags associés

2d,3d,albedobase xl,albedobond,tout en un,anime,modèle de base,point de contrôle,cinématographique,jeu,lora,fusion de modèles,photorealiste,sdxl 1.0,sdxl1.0,stable diffusion xl,ultime,unifier,v2.0

Noyau bioluminescent brillant à l’intérieur des débris d’une planète détruite flottant de manière inquiétante au-dessus d’un paysage rocheux sombre dans l’espace.

Une figure photoréaliste ressemblant à un champignon amanite tue-mouches avec un grand chapeau rouge, debout dans une forêt magique au coucher de soleil bleu, entourée de petits champignons et d'un feuillage vibrant.

Une femme en combinaison spatiale bleue se tient à l'intérieur d'une station spatiale, les mains levées expressivement près d'une grande fenêtre montrant la Terre en arrière-plan, capturée avec des couleurs profondes et un grain subtil.

Robot endosquelette T800 portant un t-shirt blanc déchiré et un pantalon de survêtement bleu tenant un panier contenant de la peau humaine dans une laverie intérieure avec un éclairage cinématographique et un grand niveau de détail.

Forêt exotique vibrante style LEGO avec une rivière cristalline traversant, sous un ciel bleu lumineux et un éblouissement solaire, détaillée avec une verdure luxuriante en LEGO.

Prompts négatifs recommandés

strabismus,asymmetrical eyes,pixelated images

amateur quality, vague shapes, vague texture, wrong perspective, ugly, dowdy style

Paramètres recommandés

samplers

DPM++ 2M SDE Heun Karras

steps

cfg

clip skip

resolution

1024x1024, 720x1280

vae

Included VAE - default

Conseils

Si vous rencontrez un bug où rien ne se génère, passez à CLIP SKIP 2 ou modifiez légèrement le prompt.

L'utilisation de prompts sous forme de phrases plutôt qu'une liste de tags améliore la qualité de l'image.

Laisser le champ de prompt négatif vide produit souvent les meilleures images en qualité.

Consultez la grille des spécifications pour les réglages recommandés avant utilisation.

Testez quelques prompts négatifs pour résoudre les problèmes comme les yeux asymétriques ou la pixellisation.

Points forts de la version

J'ai écrit un script personnalisé pour converger les modèles AlbedoBase XL existants en un seul. Alignant minutieusement les poids des lignes et colonnes de tous les blocs U-NET et CLIP selon une formule unique de ma conception.

Sponsors du créateur

Si vous avez trouvé de la valeur dans ce modèle, veuillez envisager de soutenir. Votre contribution sera entièrement dédiée à l'avancement de la communauté SDXL.

🙋🏼‍♂️ rejoignez-nous (discord) ㅤ|ㅤ 🛒 acheterㅤ |ㅤ 🌱 faire un don

Si vous avez trouvé de la valeur dans ce modèle, veuillez envisager de soutenir. Votre contribution sera entièrement dédiée à l'avancement de la communauté SDXL.

🙋🏼‍♂️ rejoignez-nous (discord) ㅤ|ㅤ 🛒 acheterㅤ |ㅤ 🌱 faire un don

AlbedoBase XL (SFW&NSFW)

Le raffineur n'est pas nécessaire, et le VAE est inclus.

OBJECTIF

Stable Diffusion XL compte 3,5 milliards de paramètres (hors Raffineur), soit environ 3,6 fois plus que la version SD v1.5. Je crois que ce n'est pas qu'un chiffre, mais un nombre capable de mener à une amélioration significative des performances.

Il y a un moment que nous avons réalisé que les performances globales de SD v1.5 se sont améliorées au-delà de l'imagination grâce aux contributions explosives de notre communauté. Par conséquent, je travaille à compléter ce modèle AlbedoBase XL afin de reproduire de manière optimale l'amélioration des performances survenue en v1.5 dans cette version XL également.

Mon objectif est de tester directement les performances de tous les Checkpoints et LoRAs publiquement téléversés sur Civitai, puis de fusionner uniquement les ressources jugées optimales après plusieurs filtres. Cela dépassera les performances des IA génératrices d'images d'entreprises comme Midjourney.

À ce jour, AlbedoBase XL v3.1 Large a fusionné environ 200 checkpoints sélectionnés et 251 LoRAs.

JOURNAL

v3.1-Large

• Fusion de plus de 50 dernières versions sélectionnées de modèles SDXL en utilisant le script récursif employé dans V3.

La grille des spécifications (370,7 Mo) : télécharger

v3-mini

Je m'excuse sincèrement de vous avoir fait attendre aussi longtemps.

J'ai été confronté à des problèmes personnels et, tout en travaillant sur la nouvelle version, j'ai aussi souffert de soucis de santé. Même en écrivant ceci, je lutte encore avec ces défis.

J'ai ressenti que fournir simplement une mise à jour brève ne suffirait pas, alors je vous demande votre compréhension alors que je partage ce message plus détaillé.

Depuis la sortie de la version 2.0, je me consacre à l'étude autodidacte du deep learning. Je n'ai pas de diplôme formel et, à part une aptitude modeste à la programmation, mon background est surtout artistique. Je manque donc des bases mathématiques et scientifiques nécessaires pour réaliser des avancées majeures, vu le temps et les efforts investis. Malgré cela, l'expérience de cette immersion en auto-apprentissage et recherches a été un trésor inestimable dans ma vie.

Récemment, j'ai découvert une idée qui pourrait être une percée importante. Après avoir retravaillé des centaines de formules et méthodes depuis la v2.0, j'ai réussi à développer un algorithme à la fois intrigant et réussi. Le processus de fusion des modèles était basé sur SDXL1.0 et SD1.5 ainsi que d'autres modèles soigneusement sélectionnés. Ceux-ci ont été catégorisés en cinq classifications principales : « ANIME », « REALISM », « ARTISTIC », « NSFW » et « BASE », et introduits dans l'algorithme de fusion sous forme de jeux de données. Cette approche a donné des résultats fascinants.

Cependant, aussi difficile que fût le développement de l'algorithme, rien n'a été aussi ardu que la phase de test des performances. Ma santé physique et mentale a beaucoup décliné pendant cette période, au point où j'ai réalisé que je ne pouvais plus continuer ce travail seul. C'est finalement cette situation qui m'a poussé à décider de publier cette version.

Maintenant, je suis ravi d'annoncer la sortie de la très attendue version AlbedoBaseXL V3 Mini. Bien que ce modèle soit une fusion à plus petite échelle, il n'est limité à aucun domaine spécifique et offre d'excellentes performances dans divers secteurs. Il pourrait servir de nouveau modèle de base pour SDXL1.0. (Pour référence, mon algorithme de fusion n'est pas une « fusion linéaire », donc on peut essentiellement le considérer comme un nouveau modèle affiné.)

Ce modèle, ainsi que les modèles AlbedoBase existants, est polyvalent et dépasse toutes les versions précédentes sur tous les aspects. (Le contenu NSFW, bien que non extrême, offre une gamme d'expression plus large comparé aux versions antérieures comme la v2.1. Un modèle de fusion NSFW dédié sera publié ultérieurement.)

D'ailleurs, j'ai remarqué que de nombreux modèles partagés ont récemment adopté des licences interdisant la fusion ou la commercialisation externe. Cela a été décevant car cela m'a empêché d'utiliser certains modèles vraiment excellents pour la fusion.

Je tiens à exprimer ma profonde gratitude aux développeurs de modèles qui ont fourni des licences gratuites, permettant ainsi d'utiliser leurs modèles de haute qualité—produits d'un travail conséquent—pour la fusion.

Je reviendrai bientôt.

J'attends avec impatience vos tests de performances dans un large éventail de domaines, incluant ANIME, REALISM, ARTISTIC, 2.5D, 3D, et NSFW.

En tant que développeurs de modèles, nous ne faisons que planter les graines. Ce sont finalement vous, utilisateurs et artistes, qui cultivez ces graines et faites fleurir les fleurs et les fruits.

Merci, comme toujours.

Pour ceux qui souhaitent soutenir mon travail par une petite contribution financière, veuillez envisager d'utiliser les liens ci-dessous. Je ne peux actuellement pas obtenir d'emploi et mon avenir financier est incertain.

🌱 faire un don

La grille des spécifications (380,5 Mo) : télécharger

v2.1
Refusion et ajustement de v0.1 à 2.0 avec un nouvel algorithme et formule de fusion.

La grille des spécifications (424,5 Mo) : télécharger

v2.0

Je tiens à remercier tous ceux qui m'ont aidé du côté AlbedoBase XL Pre. Sans vous, la date de sortie aurait probablement été bien plus tard. Merci beaucoup !

J'ai écrit un script personnalisé pour converger les modèles AlbedoBase XL existants en un seul. Alignant minutieusement les poids des lignes et colonnes de tous les blocs U-NET et CLIP selon une formule unique de ma conception.
Si vous rencontrez un bug dans la génération d'images (rien ne se génère), veuillez passer à CLIP SKIP 2 ou modifier légèrement le prompt ! Il peut y avoir des combinaisons de prompts que CLIP ne reconnaît pas. Dans ce cas, vous pouvez changer l'ordre des mots, utiliser des mots différents ou, plus simplement, changer le CLIP SKIP. Je travaillerai progressivement pour résoudre ces problèmes à l'avenir comme en v1.3.

La grille des spécifications (403,5 Mo) : télécharger

v1.3

Pour illustrer la qualité liée à l'aléa du modèle, j'ai standardisé la valeur du seed à '9' pour toutes les images de démonstration destinées à l'échantillonnage et les ai générées immédiatement.
Particulièrement avec cette version, en raison de l'impact significatif des prompts négatifs, laisser le champ de prompt négatif vide produit probablement la meilleure qualité.

La grille des spécifications (438,7 Mo) : télécharger

Comme vous pouvez le voir, à mesure que le nombre de Steps augmente, il devient compatible avec tous les samplers, et la qualité s'améliore aussi.
Suite à l'effet du LoRA que j'ai développé et fusionné, comme décrit ci-dessous, utiliser des prompts sous forme de phrases plutôt qu'une liste de tags améliore directement la qualité.

J'ai fusionné 45 checkpoints et 7 LoRAs. Ensuite, j'ai fusionné AlbedoBase v0.4 et v0.3 dans l'ordre, à hauteur de moins de 0~5%, afin de réveiller les modèles fusionnés dilués devenus obsolètes.
Parmi les 7 LoRAs, un a été créé par moi. Il implique l'analyse et l'annotation de légendes pour un total de 174 photos picturales de haute qualité avec GPT4-V. La fusion de ce LoRA a donné lieu à des images étonnamment nettes et une compréhension des prompts impressionnante.

Mes LoRAs auto-créés sont exclusivement disponibles à l'achat pour mes supporters Ko-fi au niveau Creative ou supérieur.

v1.2

Fusion des 22 derniers checkpoints.

La grille des spécifications (565,6 Mo) : télécharger

v1.1

Stabilisé.
Plus détaillé.
Si vous pensez être un utilisateur avancé, je recommande la version 1.0. Si la version 1.0 trouve les bons réglages, elle peut produire des œuvres beaucoup plus vivantes.

La grille des spécifications (349,7 Mo) : télécharger

v1.0

Fusionné 106 LoRAs.
Fusionné 19 Checkpoints.

Le modèle peut produire des résultats différents selon les réglages choisis, il est donc important de consulter la grille des spécifications avant utilisation.
- J'ai constaté que l'utilisation de quelques prompts négatifs spécifiques peut aider à résoudre le problème des yeux asymétriques ou des images pixellisées. La grille des spécifications peut varier selon votre CPU ou GPU, donc utilisez-la comme référence générale. Testez quelques prompts négatifs pour améliorer la qualité (ex : strabisme). Il est difficile de satisfaire toutes les configurations également à mesure que le nombre de LoRAs fusionnés augmente. Cependant, je souhaite que vous vous concentriez sur cet avantage en version 1.0, car elle peut produire des œuvres de qualité étonnante sur plusieurs aspects avec les bons réglages. Je reviendrai avec une version plus stable à l'avenir.
Vous pouvez trouver des valeurs de réglage utiles dans la vitrine ou en recherchant d'autres utilisateurs.
Comme toujours, il est préférable de laisser le prompt négatif vide pour de meilleurs résultats.
Cette v1.0 a demandé beaucoup de travail, donc je prends une pause. J'espère que vous apprécierez ce modèle, et si vous le fusionnez, merci de le partager gratuitement sur Civitai. Ainsi, nous pourrons tous continuer à l'améliorer.

La grille des spécifications (479,4 Mo) : télécharger

v0.4

Fusionné 132 LoRAs.
Fusionné 4 Checkpoints.

La grille des spécifications : télécharger

v0.3

Amélioré pour tous les samplers.
Rendu réaliste très vivant.
Stabilisé.

La grille des spécifications : télécharger

v0.2

Améliorations significatives en clarté et détails.
Meilleure modélisation des mains et pieds.
Améliorations esthétiques majeures : composition, abstraction, flux, lumière et couleur, etc.

v0.1

Après un affinage approprié du modèle SDXL1.0, fusion méticuleuse et ciblée de plus de 40 modèles de haute qualité publiquement disponibles sur Civitai.
Les tests se sont principalement concentrés sur l'assurance de la qualité maximale avec un minimum de jetons de prompt, et il n'a pas été confirmé à quel point la qualité peut s'améliorer avec un grand nombre de jetons. (Veuillez effectuer vos propres tests et partager les résultats)
Généralement, les résultats les plus beaux sont obtenus entre réalité et animation.
Néanmoins, avec un prompt approprié, il n'y a généralement rien qu'il ne puisse exprimer. (J'affirme qu'il possède une valeur abondante comme modèle fondamental surpassant les autres en fusion. Mais veuillez garder à l'esprit qu'il s'agit actuellement de la v0.1)

Contributeur

Camille Dubois

Bonjour ! Je m’appelle Camille Dubois. Passionnée d’art visuel, j’orchestre des galeries numériques pour révéler toute la poésie des images générées par l’IA.

SocaRealism XL - 1.3

Photo d'archive réaliste - v2.0

Utiliser ce modèle