modèles/AlbedoBase XL - v2.1

AlbedoBase XL - v2.1

Camille Dubois

7/7/2025

1:45:56 PM

| Discussion|

Mots-clés et tags associés

Une femme tenant une bougie allumée avec un fond noir profond illuminant la moitié de son visage d'une lumière chaleureuse de bougie.

Illustration détaillée d'une tornade tourbillonnante au-dessus d'un paysage rural avec des maisons et un pickup, représentée sur parchemin vieilli avec éclaboussures d'encre et effets de texture.

Figure de hacker numérisée à capuche en style cyberpunk avec câbles mécaniques et tenue sombre futuriste

Une figure mystérieuse et pâle en long manteau noir flottant tenant une arme se tient dans une rue de ville sombre et brumeuse avec une voiture rétro et un lampadaire en arrière-plan dans un style néo-noir.

Une scène fantastique kawaii mettant en vedette une fille rousse en robe blanche assise devant une grande créature verte à large bouche dentée, entourée de plusieurs petits animaux mignons ressemblant à des lapins.

Bateaux et palmiers en silhouette sur une rivière au coucher du soleil avec un ciel orange flamboyant dans un style collagraphie par William Wray.

Deux personnes dans la silhouette d'un bateau de pêche sur une eau calme avec un soleil éclatant reflété, œuvre en style collagraph par William Wray

Un canard anthropomorphe portant des lunettes rétro et un blouson en cuir conduisant une moto avec un canard blanc assis devant.

Portrait d'une belle jeune femme aux cheveux flottants et au look mode sexy, posant dans une cour de manoir toscan ensoleillée aux couleurs vives et vêtue de haute couture.

Véhicule de course de monocycle rétrofuturiste avec un pilote portant un casque et une veste en cuir, représenté dans le style d'une collagraphie de William Wray

Silhouette noire d'un homme debout aux cheveux en pics et portant une veste, sur un fond abstrait éclaboussé beige et blanc dans un style street art.

Trois individus punk avec cheveux en pics et tatouages vêtus de tenues preppy sur fond jaune, illustrés dans un style couteau à palette inspiré par Dave McKean.

Prompts négatifs recommandés

strabismus

lowres

Paramètres recommandés

samplers

DPM++ 2M SDE Heun Karras

steps

24 - 60

cfg

7.5 - 8

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Conseils

Si la génération d’image ne produit rien, essayez de passer à CLIP SKIP 2 ou modifiez légèrement le prompt en changeant l’ordre des mots ou en utilisant différents mots.

Laisser le champ de prompt négatif vide peut produire des images de bonne qualité, surtout en version 1.3.

Utiliser des prompts sous forme de phrases plutôt que des tags (liste de mots) peut améliorer la qualité des images grâce aux effets du LoRA.

Vérifiez la grille de spécifications avant d’utiliser le modèle pour les meilleurs réglages, disponible via les liens de téléchargement fournis.

Points forts de la version

Refusion et ajustement de v0.1 à 2.0 en utilisant le nouvel algorithme et la nouvelle formule de fusion.

Sponsors du créateur

Si vous avez trouvé de la valeur dans ce modèle, veuillez envisager de soutenir le projet. Votre contribution sera entièrement dédiée à l'avancement de la communauté SDXL.

🙋🏼‍♂️ rejoignez-nous (discord) ㅤ|ㅤ 🛒 achat ㅤ|ㅤ 🌱 don

Si vous avez trouvé de la valeur dans ce modèle, veuillez envisager de soutenir le projet. Votre contribution sera entièrement dédiée à l'avancement de la communauté SDXL.

🙋🏼‍♂️ rejoignez-nous (discord) ㅤ|ㅤ 🛒 achatㅤ |ㅤ 🌱 don

AlbedoBase XL (SFW&NSFW)

Le raffineur est inutile, et le VAE est inclus.

OBJECTIF

Stable Diffusion XL possède 3,5 milliards de paramètres (hors raffineur), soit environ 3,6 fois plus que la version SD v1.5. Je crois que ce n'est pas qu'un chiffre, mais un chiffre susceptible de conduire à une amélioration significative des performances.

Il y a quelque temps, nous avons réalisé que les performances globales de SD v1.5 s’étaient améliorées au-delà de l’imaginable grâce aux contributions explosives de notre communauté. Par conséquent, je travaille à finaliser ce modèle AlbedoBase XL pour reproduire de manière optimale l'amélioration des performances sur cette version XL également.

Mon objectif est de tester directement les performances de tous les Checkpoints et LoRAs publiquement disponibles sur Civitai et de fusionner uniquement les ressources jugées optimales après plusieurs filtres. Cela surpassera les performances des IA de génération d’images d’entreprises telles que Midjourney.

À ce jour, AlbedoBase XL v3.1 Large a fusionné environ 200 checkpoints sélectionnés et 251 LoRAs.

JOURNAL

v3.1-Large

• Fusion de plus de 50 dernières versions sélectionnées de modèles SDXL en utilisant le script récursif employé en V3.

La grille de spécifications (370,7 MB): téléchargement

v3-mini

Je m’excuse sincèrement pour l’attente prolongée.

J’ai eu à gérer des affaires personnelles et, en travaillant sur cette nouvelle version, j’ai aussi rencontré des problèmes de santé. Écrire ceci, c’est toujours faire face à ces défis.

Je sentais qu’un court résumé ne suffirait pas, alors je vous demande votre compréhension tandis que je partage ce message plus détaillé.

Depuis la sortie de la version 2.0, je me suis dévoué à l’étude autodidacte du deep learning. Je n’ai pas de diplôme formel, et en dehors d’une modeste aptitude à la programmation, seule ma formation artistique me soutient. Par conséquent, il me manque les bases mathématiques et scientifiques nécessaires pour réaliser des avancées majeures, malgré le temps investi. Pourtant, cette expérience d’apprentissage autonome reste un trésor inestimable dans ma vie.

Récemment, j’ai découvert une idée qui pourrait représenter une percée significative. Après avoir retravaillé des centaines de formules et méthodes depuis la version 2.0, j’ai développé un algorithme intriguant et performant. Le processus de fusion du modèle a été basé sur SDXL1.0 et SD1.5, ainsi que d’autres modèles sélectionnés. Ceux-ci ont été classés en cinq catégories principales : « ANIME », « REALISM », « ARTISTIC », « NSFW » et « BASE », et utilisés comme ensembles de données pour l'algorithme de fusion. Cette approche a donné des résultats fascinants.

Cependant, malgré la difficulté du développement de l’algorithme, rien n’a été aussi complexe que la phase de test de performance. Ma santé physique et mentale s’est fortement dégradée, au point que j’ai réalisé que je ne pouvais plus continuer seul. Cela m’a finalement conduit à décider de publier cette version.

Je suis donc ravi d’annoncer la sortie tant attendue de la version AlbedoBaseXL V3 Mini. Bien que ce modèle soit une fusion à plus petite échelle, il n’est limité à aucun domaine spécifique et réussit remarquablement bien dans plusieurs. Il peut servir de nouvelle base pour SDXL1.0. (Pour info, mon algorithme de fusion n’est pas une « fusion linéaire », il s’agit donc essentiellement d’un nouveau modèle fine-tuné.)

Ce modèle, avec les AlbedoBase existants, est polyvalent et surpasse toutes les versions précédentes. (Le contenu NSFW, bien que modéré, offre une gamme d'expressions plus large que les versions antérieures comme la v2.1. Un modèle spécialisé NSFW pour fusion sera publié ultérieurement.)

Par ailleurs, j'ai remarqué que beaucoup de modèles partagés adoptent récemment des licences interdisant la fusion ou la commercialisation externe. C’est décevant, car cela m’a empêché d’utiliser certains excellents modèles pour la fusion.

Je tiens à remercier sincèrement les développeurs de modèles qui ont offert des licences gratuites, permettant que leurs modèles de haute qualité — fruit d'un travail important — soient utilisés pour la fusion.

Je reviendrai bientôt.

J’attends avec impatience vos tests de performance dans divers domaines, notamment ANIME, REALISM, ARTISTIC, 2.5D, 3D et NSFW.

En tant que développeurs, nous ne faisons que planter des graines. Ce sont vous, utilisateurs et artistes, qui les cultivez et faites fleurir les fruits.

Merci, comme toujours.

Pour ceux qui souhaitent soutenir mon travail par une petite contribution financière, veuillez utiliser les liens ci-dessous. Je ne peux actuellement pas trouver d’emploi et fais face à un avenir incertain pour ma subsistance.

🌱 don

La grille de spécifications (380,5 MB): téléchargement

v2.1
Refusion et ajustement de v0.1 à 2.0 en utilisant le nouvel algorithme et la nouvelle formule de fusion.

La grille de spécifications (424,5 MB): téléchargement

v2.0

Je tiens à remercier tous ceux qui m'ont aidé sur la version AlbedoBase XL Pre. Sans vous, la date de sortie aurait probablement été beaucoup plus tard. Merci beaucoup !

J'ai écrit un script personnalisé pour fusionner les modèles AlbedoBase XL existants en un seul. Alignant minutieusement les poids des rangées et colonnes de tous les blocs U-NET et CLIP selon une formule unique de ma conception.
Si vous constatez un bug lors de la génération d’image (aucune image générée), veuillez passer à CLIP SKIP 2 ou modifier légèrement votre prompt ! Certaines combinaisons de prompts peuvent ne pas être reconnues par CLIP. Dans ce cas, changez l'ordre des mots, utilisez d'autres mots ou, plus simplement, changez le CLIP SKIP. Je travaillerai progressivement à résoudre ces problèmes dans le futur, comme avec la v1.3.

La grille de spécifications (403,5 MB): téléchargement

v1.3

Pour illustrer la qualité liée à l’aléatoire du modèle, j’ai standardisé la valeur de la seed à '9' pour toutes les images de démonstration destinées à l'échantillonnage et procédé à leur génération immédiate.
Particulièrement avec cette version, en raison de l'impact significatif des prompts négatifs, laisser le champ prompt négatif vide produit souvent une bonne qualité.

La grille de spécifications (438,7 MB): téléchargement

Comme vous pouvez le voir, à mesure que le nombre de Steps augmente, il devient compatible avec tous les samplers, et la qualité s’améliore également.
En raison de l’effet du LoRA que j’ai développé et fusionné, comme décrit ci-dessous, utiliser des prompts en forme de phrase plutôt que des tags (liste de mots) améliore directement la qualité.

J’ai fusionné 45 checkpoints et 7 LoRAs. Par la suite, j’ai fusionné AlbedoBase v0.4 et v0.3 dans l’ordre, à hauteur de 0~5 % environ, pour ressusciter les modèles fusionnés dilués et démodés.
Parmi les 7 LoRAs, un a été créé par mes soins. Il consiste à analyser et annoter les légendes de 174 photos picturales de haute qualité en utilisant GPT4-V. La fusion de ce LoRA a produit des images étonnamment claires et une compréhension impressionnante des prompts.

Mes LoRAs auto-créés sont exclusivement disponibles à l’achat pour mes soutiens Ko-fi au niveau Creative ou supérieur.

v1.2

Fusion des 22 derniers checkpoints.

La grille de spécifications (565,6 MB): téléchargement

v1.1

Stabilisé.
Plus détaillé.
Si vous êtes un utilisateur avancé, je recommande la version 1.0. Si les bons réglages sont trouvés en version 1.0, elle peut produire des œuvres beaucoup plus vivantes.

La grille de spécifications (349,7 MB): téléchargement

v1.0

Fusion de 106 LoRAs.
Fusion de 19 Checkpoints.

Le modèle peut produire des résultats différents selon les réglages choisis, il est donc important de vérifier la grille de spécifications avant utilisation.
- J’ai constaté que l’utilisation de certains prompts négatifs spécifiques peut aider à résoudre les problèmes d’yeux asymétriques ou d’images pixelisées. La grille de spécifications peut varier selon votre CPU ou GPU, utilisez-la donc à titre de référence générale. Expérimentez avec quelques prompts négatifs pour améliorer la qualité (ex : strabisme). Il est difficile de satisfaire tous les réglages également lorsque le nombre de LoRA fusionnés augmente. Cependant, concentrez-vous sur cet avantage de la version 1.0, qui peut produire des œuvres d’une qualité remarquable dans divers aspects avec les bons réglages. Je reviendrai avec une version plus stable dans le futur.
Vous pouvez trouver des valeurs de réglage utiles dans la vitrine ou en recherchant chez d'autres utilisateurs.
Comme toujours, il est préférable de laisser le prompt négatif vide pour les meilleurs résultats.
Cette version 1.0 a demandé beaucoup de travail, je prends donc une pause. J’espère que vous apprécierez le modèle, et si vous le fusionnez, partagez-le gratuitement sur Civitai. Ainsi, nous pourrons tous continuer à l’améliorer.

La grille de spécifications (479,4 MB): téléchargement

v0.4

Fusion de 132 LoRAs.
Fusion de 4 Checkpoints.

La grille de spécifications: téléchargement

v0.3

Amélioré dans tous les samplers.
Réalisme saisissant.
Stabilisé.

La grille de spécifications: téléchargement

v0.2

Améliorations significatives de la netteté et des détails.
Amélioration de la représentation des mains et des pieds.
Améliorations esthétiques majeures : composition, abstraction, fluidité, lumière et couleur, etc.

v0.1

Après une fine-tuning appropriée sur le modèle SDXL1.0, fusion méticuleuse et intentionnelle de plus de 40 modèles de haute qualité disponibles publiquement sur Civitai.
Les tests se sont principalement focalisés sur l’obtention d’une qualité maximale avec le nombre minimum de jetons de prompt, sans confirmation de l’amélioration possible avec un grand nombre de jetons. (Merci de faire vos propres tests et de partager les résultats)
Typiquement, les résultats les plus beaux se situent entre le réalisme et l’animation.
Néanmoins, avec un prompt approprié, il n’y a pratiquement rien qu’il ne puisse exprimer. (J’affirme qu’il possède une valeur abondante en tant que modèle de base surpassant les autres en fusion. Cependant, gardez à l’esprit qu’il en est actuellement à la v0.1)

Contributeur

Camille Dubois

Bonjour ! Je m’appelle Camille Dubois. Passionnée d’art visuel, j’orchestre des galeries numériques pour révéler toute la poésie des images générées par l’IA.

Fluxartis - Opus I

Embeddings Négatifs & Positifs par Stable Yogi - v1.0

Utiliser ce modèle