modèles/AlbedoBase XL - v3.1-Large

AlbedoBase XL - v3.1-Large

Camille Dubois

7/27/2025

1:14:07 AM

| Discussion|

Mots-clés et tags associés

Homme de dessin animé avec une expression choquée, cheveux sauvages et bouclés, lunettes, et barbe de quelques jours portant une chemise jaune à carreaux avec une cravate rouge et des bretelles bleues sur un fond vert texturé.

Une figurine miniature d’alpaga blanc et duveteux avec de grands yeux noirs debout à côté d’une petite maison marron imprimée en 3D.

Une œuvre digitale vectorielle vibrante dans le style de William Wray montrant un éléphant décontracté en forme de ballon coloré avec un manchot loufoque perché dessus, entouré de ballons multicolores sur un fond de ciel.

Gravure impressionniste représentant la silhouette d'une femme en robe et chapeau debout près d'une rivière, regardant un petit chien, avec un pont londonien classique et Big Ben en arrière-plan.

Une silhouette en style découpage de papier d'une femme dansant le tango, finement réalisée en art d'acier avec une influence kirigami, entourée de formes abstraites tourbillonnantes.

Une illustration colorée de style roman graphique montrant d'énormes requins de sable aux dents acérées attaquant de petits bateaux de pêche naviguant dans une mer désertique avec de minuscules figures humanoïdes autour.

Prompts recommandés

(incredibly ultra lifelike, perfect professional precise, masterpiece, extremely beautiful, light and shadow

Prompts négatifs recommandés

strabismus

(worst quality, normal quality, score_3, score_4

Paramètres recommandés

samplers

Euler a, DPM++ 2M SDE Heun

steps

24 - 72

cfg

3 - 9.5

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Conseils

Si la génération d’image ne produit aucun résultat, essayez de passer à CLIP SKIP 2 ou modifiez légèrement l’ordre ou le contenu de l’invite.

Utiliser des invites sous forme de phrase tend à améliorer la qualité des images plus que les listes de tags.

Laisser le champ de prompt négatif vide produit souvent de meilleurs résultats.

Consultez la grille des spécifications pour les réglages optimaux avant usage.

Expérimentez avec quelques prompts négatifs spécifiques comme "strabismus" pour corriger des problèmes comme des yeux asymétriques ou des pixels.

Points forts de la version

• Fusionné plus de 50 dernières versions sélectionnées de modèles SDXL en utilisant le script récursif employé dans V3.

Sponsors du créateur

Si ce modèle vous est utile, merci de considérer apporter votre soutien. Votre contribution sera intégralement dédiée à faire avancer la communauté SDXL.

🙋🏼‍♂️ rejoignez-nous (discord) ㅤ|ㅤ 🛒 acheter ㅤ|ㅤ 🌱 faire un don

Si ce modèle vous est utile, merci de considérer apporter votre soutien. Votre contribution sera intégralement dédiée à faire avancer la communauté SDXL.

🙋🏼‍♂️ rejoignez-nous (discord) ㅤ|ㅤ 🛒 acheterㅤ |ㅤ 🌱 faire un don

AlbedoBase XL (SFW&NSFW)

Le raffineur n’est pas nécessaire et le VAE est inclus.

OBJECTIF

Stable Diffusion XL possède 3,5 milliards de paramètres (hors Raffineur), soit environ 3,6 fois plus que la version SD v1.5. Je crois que ce n’est pas simplement un nombre, mais un chiffre pouvant conduire à une amélioration significative des performances.

Nous constatons depuis un certain temps déjà que les performances globales de SD v1.5 se sont améliorées de manière inimaginable grâce aux contributions massives de la communauté. C’est pourquoi je travaille à compléter ce modèle AlbedoBase XL afin de reproduire de façon optimale l’amélioration des performances obtenues dans v1.5 également dans cette version XL.

Mon objectif est de tester directement la performance de tous les Checkpoints et LoRAs publiquement disponibles sur Civitai, et de fusionner uniquement les ressources jugées optimales après plusieurs filtres. Cela dépassera les performances des IA de génération d’image d’entreprises telles que Midjourney.

À ce jour, AlbedoBase XL v3.1 Large a fusionné environ 200 checkpoints sélectionnés et 251 LoRAs.

JOURNAL

v3.1-Large

• Fusionné plus de 50 dernières versions sélectionnées de modèles SDXL en utilisant le script récursif employé dans V3.

Grille des spécifications (370,7 MB): télécharger

v3-mini

Je vous présente mes excuses sincères pour l’attente.

J’ai été confronté à des problèmes personnels et, tout en travaillant sur la nouvelle version, j’ai également eu des soucis de santé. Même en écrivant ceci, je lutte encore contre ces défis.

J’ai estimé qu’une simple mise à jour brève ne suffisait pas, aussi je vous demande compréhension en partageant ce message plus détaillé.

Depuis la sortie de la version 2.0, j’ai étudié l’apprentissage profond de manière autodidacte. Je n’ai pas de diplôme formel et, hormis une aptitude modeste pour la programmation, mon parcours est essentiellement artistique. Par conséquent, je manque des bases mathématiques et scientifiques pour réaliser des avancées majeures, malgré le temps et l’effort investis. Néanmoins, cette expérience d’étude et de recherche autodirigée a été un trésor inestimable dans ma vie.

Récemment, j’ai eu une idée qui pourrait être une percée notable. Après avoir retravaillé des centaines de formules et méthodes depuis la version 2.0, j’ai développé un algorithme assez intriguant et performant. Le processus de fusion des modèles était basé sur SDXL1.0 et SD1.5, ainsi que d’autres modèles soigneusement sélectionnés. Ceux-ci ont été classés en cinq catégories principales : "ANIME", "REALISM", "ARTISTIC", "NSFW" et "BASE", et intégrés dans l’algorithme de fusion comme ensembles de données. Cette approche a donné des résultats fascinants.

Cependant, aussi difficile que fut le développement de l’algorithme, rien n’a été aussi éprouvant que la phase de test des performances. Ma santé physique et mentale s’est nettement détériorée durant cette période, au point que j’ai compris que je ne pouvais pas poursuivre ce travail seul. C’est ce qui m’a finalement conduit à décider de sortir cette version.

Et maintenant, je suis ravi d’annoncer la sortie tant attendue de la version AlbedoBaseXL V3 Mini. Bien que ce modèle soit une fusion à plus petite échelle, il n’est limité à aucun domaine spécifique et donne d’excellents résultats dans divers secteurs. Il a le potentiel de servir de nouveau modèle de base pour SDXL1.0. (Pour référence, mon algorithme de fusion n’est pas une "fusion linéaire", il peut donc être considéré comme un modèle nouvellement affiné.)

Ce modèle, avec les modèles AlbedoBase existants, est polyvalent et surpasse toutes les versions précédentes à tous points de vue. (Le contenu NSFW, sans être extrême, offre une gamme d’expression plus large comparé aux versions antérieures comme la v2.1. Un modèle de fusion dédié NSFW sera publié ultérieurement.)

D’autre part, j’ai remarqué que de nombreux modèles partagés ont récemment adopté des licences interdisant la fusion ou la commercialisation externe. C’est décevant, car cela m’a empêché d’utiliser certains modèles vraiment excellents pour la fusion.

Je tiens à exprimer ma profonde gratitude aux développeurs qui ont fourni des licences libres, permettant à leurs modèles de haute qualité — fruits d’un travail considérable — d’être utilisés pour la fusion.

Je reviendrai bientôt.

J’attends avec impatience vos tests de performances dans divers domaines, notamment ANIME, RÉALISME, ARTISTIQUE, 2.5D, 3D et NSFW.

En tant que développeurs de modèles, nous ne faisons que planter les graines. Finalement, ce sont vous, les utilisateurs et artistes, qui les cultivez et faites fleurir les fruits.

Merci, comme toujours.

Pour ceux qui souhaitent soutenir financièrement mon travail, merci de considérer l’usage des liens ci-dessous. Je suis actuellement sans emploi et mon avenir financier est incertain.

🌱 faire un don

Grille des spécifications (380,5 MB): télécharger

v2.1
Re-fusion et ajustement de v0.1 à 2.0 en utilisant un nouvel algorithme et formule de fusion.

Grille des spécifications (424,5 MB): télécharger

v2.0

Je voudrais remercier tous ceux qui m’ont aidé sur le projet AlbedoBase XL Pre. Sans vous, la date de sortie aurait probablement été bien plus tard. Merci infiniment !

J’ai écrit un script personnalisé pour fusionner les modèles AlbedoBase XL existants en un seul. Alignant minutieusement les poids des lignes et colonnes de tous les blocs U-NET et CLIP selon une formule unique conçue par moi.
Si vous rencontrez un bug lors de la génération d’image (aucun résultat généré), essayez de passer à CLIP SKIP 2 ou modifiez légèrement l’invite ! Il peut y avoir des combinaisons d’invites que CLIP ne reconnaît pas. Dans ce cas, vous pouvez changer l’ordre des mots, utiliser des synonymes, ou plus simplement modifier le CLIP SKIP. Je travaillerai progressivement à résoudre ces problèmes à l’avenir, comme dans la version 1.3.

Grille des spécifications (403,5 MB): télécharger

v1.3

Pour illustrer la qualité liée au caractère aléatoire du modèle, j’ai fixé la valeur de la seed à '9' pour toutes les images de démonstration destinées à l’échantillonnage, et procédé à leur génération immédiate.
Particulièrement avec cette version, en raison de l’impact important des prompts négatifs, laisser le champ des prompts négatifs vide permet souvent d’obtenir une bonne qualité.

Grille des spécifications (438,7 MB): télécharger

Comme vous pouvez le constater, à mesure que le nombre de Steps augmente, le modèle devient compatible avec tous les samplers et la qualité s’améliore également.
Grâce à l’effet du LoRA que j’ai développé et fusionné, comme indiqué ci-dessous, utiliser des invites en forme de phrase plutôt qu’une liste de mots (tags) est directement lié à une amélioration de la qualité.

J’ai fusionné 45 checkpoints et 7 LoRAs. Ensuite, j’ai fusionné AlbedoBase v0.4 et v0.3 dans cet ordre, à hauteur de moins de 0~5 %, pour raviver les modèles fusionnés dilués et devenus obsolètes.
Parmi les 7 LoRAs, un a été créé par moi. Il consiste à analyser et annoter les légendes de 174 photos picturales de haute qualité à l’aide de GPT4-V. L’intégration de ce LoRA a permis d’obtenir des images étonnamment nettes et une excellente compréhension des prompts.

Mes LoRAs créés personnellement sont exclusivement disponibles à l’achat pour mes soutiens Ko-fi au niveau Creative ou supérieur.

v1.2

Fusion des 22 derniers checkpoints.

Grille des spécifications (565,6 MB): télécharger

v1.1

Stabilisé.
Plus détaillé.
Si vous êtes un utilisateur avancé, je recommande la version 1.0. Si cette version trouve les bons réglages, elle peut produire des œuvres beaucoup plus vivantes.

Grille des spécifications (349,7 MB): télécharger

v1.0

Fusion de 106 LoRAs.
Fusion de 19 Checkpoints.

Le modèle peut produire différents résultats selon les réglages choisis, il est donc important de consulter la grille des spécifications avant de l’utiliser.
- J’ai constaté que l’utilisation de quelques prompts négatifs spécifiques peut aider à résoudre les problèmes d’yeux asymétriques ou d’image pixelisée. La grille des spécifications peut varier selon votre CPU ou GPU, utilisez-la donc comme référence générale. Essayez quelques prompts négatifs pour améliorer la qualité (ex : strabisme). Il est difficile de satisfaire tous les réglages également lorsque le nombre de LoRA fusionnés augmente. Toutefois, je souhaite que vous vous concentriez sur cet avantage en version 1.0, car elle peut produire des œuvres d’une qualité étonnante sur divers aspects avec les bons réglages. Je reviendrai avec une version plus stable à l’avenir.
Vous pouvez trouver des valeurs de réglage utiles dans la vitrine ou en recherchant auprès d’autres utilisateurs.
Comme toujours, il est préférable de laisser le prompt négatif vide pour de meilleurs résultats.
Cette v1.0 a demandé beaucoup de travail, je prends donc une pause. J’espère que vous apprécierez utiliser le modèle, et si vous le fusionnez, merci de le partager gratuitement sur Civitai. Ainsi, nous pourrons tous continuer à l’améliorer.

Grille des spécifications (479,4 MB): télécharger

v0.4

Fusion de 132 LoRAs.
Fusion de 4 Checkpoints.

Grille des spécifications: télécharger

v0.3

Amélioré sur tous les samplers.
Réalisme très réussi.
Stabilisé.

Grille des spécifications: télécharger

v0.2

Améliorations significatives de la clarté et des détails.
Amélioration de la représentation des mains et des pieds.
Améliorations esthétiques majeures : composition, abstraction, fluidité, lumière et couleur, etc.

v0.1

Après un affinage approprié sur le modèle SDXL1.0, fusionné méticuleusement et volontairement plus de 40 modèles de haute qualité
Les tests ont principalement visé à garantir une qualité maximale avec un minimum de tokens dans l’invite, et il n’a pas été confirmé dans quelle mesure la qualité s’améliore avec un grand nombre de tokens. (Merci de faire vos propres tests et de partager les résultats)
Typiquement, les résultats les plus beaux se situent entre le réalisme et l’animation.
Néanmoins, avec une invite appropriée, il n’y a généralement rien que ce modèle ne puisse exprimer. (Je prétends qu’il possède une grande valeur en tant que modèle fondamental surpassant les autres en fusion. Cependant, gardez à l’esprit que ceci est actuellement la v0.1)

Contributeur

Camille Dubois

Bonjour ! Je m’appelle Camille Dubois. Passionnée d’art visuel, j’orchestre des galeries numériques pour révéler toute la poésie des images générées par l’IA.

Shuttle 3 Diffusion - bf16

WaduStyle - V1

Utiliser ce modèle