Portrait hyperréaliste d'une femme âgée ressemblant à Amelia Earhart, vêtue à la mode des années 1970, faisant un clin d'œil à la caméra tout en tenant une tasse de café blanche dans un cadre intérieur confortable.
Une jeune pom-pom girl brune dansant en jupe verte et haut blanc avec bordure rouge sur un terrain de stade de football, ambiance vibrante
Jeune pom-pom girl brune dansant en tenue de sport bleu vif et rouge dans un stade de football avec une foule en arrière-plan
Une pom-pom girl en maillot de sport rouge et jupe plissée blanche danse sur un terrain de football avec une foule dans les tribunes en arrière-plan.
Peinture réaliste d'une jeune femme aux longs cheveux portant une minijupe blanche et un haut bleu clair, debout dans une salle de bowling avec des boules de bowling sur le côté.

Prompts négatifs recommandés

strabismus

Paramètres recommandés

samplers

DPM++ 2M SDE Heun Exponential

steps

42

cfg

7

resolution

720x1280, 1024x1024

vae

included VAE

Conseils

Si la génération d'image ne produit aucun résultat, essayez de passer à CLIP SKIP 2 ou modifiez légèrement le prompt en changeant l'ordre ou les mots.

L'utilisation de prompts sous forme de phrases tend à améliorer la qualité d'image plus que les listes de balises.

Laisser le champ de prompt négatif vide donne souvent de meilleurs résultats.

Consultez le spec grid pour des réglages optimaux avant utilisation.

Expérimentez avec quelques prompts négatifs spécifiques comme « strabisme » pour traiter des problèmes tels que les yeux asymétriques ou la pixellisation.

Points forts de la version

v1.3

  • Pour illustrer la qualité liée à l'aléa du modèle, j'ai standardisé la valeur de seed à '9' pour toutes les images de démonstration destinées à l'échantillonnage et procédé à leur génération immédiate.

  • Particulièrement avec cette version, en raison de l'impact important des prompts négatifs, laisser le champ prompt négatif vide produit probablement la meilleure qualité.

Le spec grid(438,7 MB) : télécharger

  • Comme vous pouvez le constater, à mesure que le nombre de steps augmente, il devient disponible pour tous les samplers, et la qualité s'améliore également.

  • Grâce à l'effet de la LoRA que j'ai développée et fusionnée, comme décrit ci-dessous, utiliser des prompts sous forme de phrases plutôt que des balises (liste de mots) est directement lié à l'amélioration de la qualité.

  • J'ai fusionné 45 checkpoints et 7 LoRAs. Ensuite, j'ai fusionné AlbedoBase v0.4 et v0.3 dans l'ordre, moins de 0~5%, pour réveiller les modèles fusionnés dilués et devenus obsolètes. 

  • Parmi les 7 LoRAs, une a été créée par moi. Elle consiste à analyser et annoter les légendes d'un total de 174 photos picturales de haute qualité avec GPT4-V. La fusion de cette LoRA a donné des images étonnamment claires et une compréhension des prompts particulièrement excellente.

  • Mes LoRAs auto-créées sont exclusivement disponibles à l'achat pour mes soutiens Ko-fi au niveau Créatif ou supérieur. Je prévois de publier de plus en plus de mises à jour à l'avenir. Les prix vont de 10 à 50 $.

Sponsors du créateur

Si vous avez trouvé de la valeur dans ce modèle, veuillez considérer offrir votre soutien. Votre contribution sera entièrement dédiée à l'avancement de la communauté SDXL.

🙋🏼‍♂️ rejoignez-nous (discord) ㅤ|ㅤ 🛒 achetez ㅤ|ㅤ 🌱 faites un don


Si vous avez trouvé de la valeur dans ce modèle, veuillez considérer offrir votre soutien. Votre contribution sera entièrement dédiée à l'avancement de la communauté SDXL.

🙋🏼‍♂️ rejoignez-nous (discord)|ㅤ 🛒 achetezㅤ |ㅤ 🌱 faites un don


AlbedoBase XL (SFW&NSFW)

Le raffineur n'est pas nécessaire, et le VAE est inclus.


OBJECTIF

Stable Diffusion XL dispose de 3,5 milliards de paramètres (hors Raffineur), ce qui est environ 3,6 fois plus que la version SD v1.5. Je crois que ce n'est pas qu'un simple chiffre, mais un nombre qui peut mener à une amélioration significative des performances.

Il y a longtemps que nous avons réalisé que les performances globales de SD v1.5 se sont améliorées au-delà de l'imagination grâce aux contributions explosives de notre communauté. Par conséquent, je travaille à compléter ce modèle AlbedoBase XL afin de reproduire de façon optimale l'amélioration de performance survenue en v1.5 dans cette version XL également.

Mon objectif est de tester directement les performances de tous les Checkpoints et LoRAs publiquement disponibles sur Civitai, et de fusionner uniquement les ressources jugées optimales après plusieurs filtres. Ceci surpassera les performances des IA génératrices d'images de sociétés telles que Midjourney.

À ce jour, AlbedoBase XL v3.1 Large a fusionné environ 200 checkpoints sélectionnés et 251 LoRAs.


JOURNAL

v3.1-Large

• Fusion de plus de 50 versions récentes sélectionnées de modèles SDXL avec le script récursif utilisé en V3.

Le spec grid(370,7 MB) : télécharger


v3-mini

Je m'excuse sincèrement de vous avoir fait attendre aussi longtemps.

J'ai dû gérer des affaires personnelles, et pendant que je travaillais sur la nouvelle version, j'ai aussi rencontré des problèmes de santé. Même en écrivant ceci, je suis encore confronté à ces difficultés.

J'ai estimé qu'un simple bref message ne suffirait pas, je vous demande donc votre compréhension en partageant ce message plus détaillé.

Depuis la sortie de la version 2.0, je me suis consacré à étudier le deep learning de façon autodidacte. Je n'ai pas de diplôme formel, et hormis une aptitude modeste en programmation, ma formation est dans les arts. Par conséquent, je manque des bases mathématiques et scientifiques nécessaires pour des avancées majeures, malgré le temps et les efforts investis. Néanmoins, cette expérience d'étude et de recherche autonome a été un trésor inestimable dans ma vie.

Récemment, j'ai découvert une idée pouvant être une percée significative. Après avoir retravaillé des centaines de formules et méthodes depuis la version 2.0, j'ai réussi à développer un algorithme plutôt intrigant et performant. Le processus de fusion des modèles se base sur SDXL1.0 et SD1.5, ainsi que d'autres modèles sélectionnés. Ceux-ci ont été classés en cinq catégories principales : « ANIME », « RÉALISME », « ARTISTIQUE », « NSFW » et « BASE », utilisés comme jeux de données dans l'algorithme de fusion. Cette approche a donné des résultats fascinants.

Cependant, aussi difficile que fut le développement de l'algorithme, rien n'a été aussi éprouvant que la phase de test des performances. Ma santé physique et mentale s'est fortement détériorée durant cette période, au point où j'ai réalisé que je ne pouvais plus continuer seul. Cela m'a finalement conduit à décider de publier cette version.

Et maintenant, je suis ravi d'annoncer la sortie tant attendue de la version AlbedoBaseXL V3 Mini. Bien que ce modèle soit une fusion à plus petite échelle, il n'est limité à aucun domaine spécifique et fonctionne remarquablement bien dans divers domaines. Il a le potentiel de servir de nouveau modèle de base pour SDXL1.0. (Pour référence, mon algorithme de fusion n’est pas une « fusion linéaire », donc il peut être considéré comme un nouveau modèle affiné.)

Ce modèle, ainsi que les modèles AlbedoBase existants, est polyvalent et surpasse toutes les versions précédentes sur tous les aspects. (Le contenu NSFW, bien que non extrême, offre une gamme d'expression plus large que les versions antérieures comme v2.1. Un modèle de fusion NSFW dédié sera publié ultérieurement.)

D'autre part, j’ai remarqué que de nombreux modèles partagés adoptent récemment des licences interdisant la fusion ou la commercialisation externe. C’est une déception, car cela m'a empêché d'utiliser certains excellents modèles pour la fusion.

Je tiens à exprimer ma gratitude sincère aux développeurs de modèles qui ont fourni des licences gratuites, permettant à leurs modèles de haute qualité — fruits de temps et d’efforts considérables — d’être utilisés pour la fusion.

Je reviendrai bientôt.

J'attends avec impatience vos tests de performances dans un large éventail de domaines, y compris ANIME, RÉALISME, ARTISTIQUE, 2.5D, 3D, et NSFW.

En tant que développeurs de modèles, nous plantons juste les graines. C’est finalement vous, utilisateurs et artistes, qui les cultivez et faites pousser les fleurs et les fruits.

Merci, comme toujours.


Pour ceux qui souhaitent soutenir mon travail par une petite contribution financière, veuillez envisager d’utiliser les liens ci-dessous. Je suis actuellement dans l’incapacité de trouver un emploi et mon avenir financier est incertain.

🌱 faites un don

Le spec grid(380,5 MB) : télécharger


v2.1
Refusion et ajustement de v0.1 à 2.0 en utilisant un nouvel algorithme et formule de fusion.

Le spec grid(424,5 MB) : télécharger

v2.0

Je tiens à remercier tous ceux qui m'ont aidé du côté de AlbedoBase XL Pre. Sans vous, la date de sortie aurait probablement été bien plus tardive. Merci beaucoup !

  • J'ai écrit un script personnalisé pour converger les modèles AlbedoBase XL existants en un seul. Alignant minutieusement les poids des lignes et colonnes de tous les blocs U-NET et CLIP selon une formule unique de ma conception.

  • Si vous rencontrez un bug lors de la génération d'image (si rien ne se génère), veuillez passer à CLIP SKIP 2 ou modifier légèrement le prompt ! Il peut y avoir des combinaisons de prompts non reconnues par CLIP. Dans ce cas, vous pouvez changer l'ordre des mots, utiliser d'autres mots, ou simplement modifier le CLIP SKIP. Je travaillerai progressivement à résoudre ces problèmes à l'avenir comme en v1.3.

Le spec grid(403,5 MB) : télécharger

v1.3

  • Pour illustrer la qualité liée à l'aléa du modèle, j'ai standardisé la valeur de seed à '9' pour toutes les images de démonstration destinées à l'échantillonnage et procédé à leur génération immédiate.

  • Particulièrement avec cette version, en raison de l'impact important des prompts négatifs, laisser le champ prompt négatif vide produit probablement la meilleure qualité.

Le spec grid(438,7 MB) : télécharger

  • Comme vous pouvez le constater, à mesure que le nombre de steps augmente, il devient disponible pour tous les samplers, et la qualité s'améliore également.

  • Grâce à l'effet de la LoRA que j'ai développée et fusionnée, comme décrit ci-dessous, utiliser des prompts sous forme de phrases plutôt que des balises (liste de mots) est directement lié à l'amélioration de la qualité.

  • J'ai fusionné 45 checkpoints et 7 LoRAs. Ensuite, j'ai fusionné AlbedoBase v0.4 et v0.3 dans l'ordre, moins de 0~5%, pour réveiller les modèles fusionnés dilués et devenus obsolètes.

  • Parmi les 7 LoRAs, une a été créée par moi. Elle consiste à analyser et annoter les légendes d'un total de 174 photos picturales de haute qualité avec GPT4-V. La fusion de cette LoRA a donné des images étonnamment claires et une compréhension des prompts particulièrement excellente.

  • Mes LoRAs auto-créées sont exclusivement disponibles à l'achat pour mes soutiens Ko-fi au niveau Créatif ou supérieur. Je prévois de publier de plus en plus de mises à jour à l'avenir. Les prix vont de 10 à 50 $.


v1.2

  • Fusion des 22 derniers checkpoints.

Le spec grid(565,6 MB) : télécharger

v1.1

  • Stabilisé.

  • Plus détaillé.

  • Si vous pensez être un utilisateur avancé, je recommande la version 1.0. Si cette version trouve les bons réglages, elle peut produire des œuvres beaucoup plus vives.

Le spec grid(349,7 MB) : télécharger

v1.0

  • Fusion de 106 LoRAs.

  • Fusion de 19 Checkpoints.

  1. Le modèle peut produire des résultats différents selon les réglages choisis, il est donc important de consulter la spec grid avant utilisation.

    • J'ai constaté que l'utilisation de quelques prompts négatifs spécifiques peut aider à résoudre les problèmes d'yeux asymétriques ou d'images pixellisées. Le Spec Grid peut varier selon votre processeur ou GPU, donc veuillez l'utiliser comme référence générale. Expérimentez avec quelques prompts négatifs (ex : strabisme) pour améliorer la qualité. J'ai constaté qu'il est difficile de satisfaire tous les réglages également avec un nombre croissant de LoRA fusionnées. Cependant, je souhaite que vous vous concentriez sur cet avantage en version 1.0, car elle peut produire des œuvres d'une qualité incroyable sur divers aspects avec les bons réglages. Je reviendrai avec une version plus stable à l'avenir.

  2. Vous pouvez trouver des valeurs de réglages utiles dans la vitrine ou en cherchant auprès d'autres utilisateurs.

  3. Comme toujours, il est préférable de laisser le prompt négatif vide pour de meilleurs résultats.

  4. Cette version 1.0 a demandé beaucoup de travail, donc je prends une pause. J'espère que vous apprécierez le modèle, et si vous fusionnez des modèles, veuillez les partager gratuitement sur Civitai. Ainsi, nous pourrons tous continuer à l'améliorer.

Le spec grid(479,4 MB) : télécharger

v0.4

  • Fusion de 132 LoRAs.

  • Fusion de 4 Checkpoints.

Le spec grid : télécharger

v0.3

  • Amélioré pour tous les samplers.

  • Rendu réaliste très vivant.

  • Stabilisé.

Le spec grid: télécharger

v0.2

  • Améliorations significatives en clarté et détails.

  • Amélioration de la représentation des mains et des pieds.

  • Améliorations esthétiques majeures : composition, abstraction, fluidité, lumière et couleur, etc.

v0.1

  • Après un affinage approprié sur le modèle SDXL1.0, fusion méticuleuse et délibérée de plus de 40 modèles de haute qualité disponibles publiquement sur Civitai.

  • Les tests se sont principalement concentrés sur l'assurance d'une qualité maximale avec un minimum de jetons de prompt, et il n'a pas été confirmé combien la qualité peut s'améliorer avec un grand nombre de jetons. (Merci de faire vos propres tests et partager les résultats)

  • Typiquement, les résultats les plus beaux sont obtenus à mi-chemin entre réalisme et animation.

  • Néanmoins, avec un prompt approprié, il n’y a généralement rien qu’il ne puisse exprimer. (Je soutiens qu’il possède une grande valeur comme modèle fondamental surpassant les autres en fusion. Toutefois, notez qu'il s'agit actuellement de la v0.1)


Précédent
🥂🎆SDXL FaeTastic🎆🥂 - v24
Suivant
Photo Factory - V1

Détails du modèle

Type de modèle

Checkpoint

Modèle de base

SDXL 1.0

Version du modèle

v1.3

Hash du modèle

a40d817f46

Mots entraînés

all in one
photo
2d
3d
anime
game
photorealistic
cinematic
design
base

Créateur

Discussion

Veuillez vous log in pour laisser un commentaire.

Images par AlbedoBase XL - v1.3

Portrait hyperréaliste d'une femme âgée ressemblant à Amelia Earhart, vêtue à la mode des années 1970, faisant un clin d'œil à la caméra tout en tenant une tasse de café blanche dans un cadre intérieur confortable.
Une jeune pom-pom girl brune dansant en jupe verte et haut blanc avec bordure rouge sur un terrain de stade de football, ambiance vibrante
Jeune pom-pom girl brune dansant en tenue de sport bleu vif et rouge dans un stade de football avec une foule en arrière-plan
Une pom-pom girl en maillot de sport rouge et jupe plissée blanche danse sur un terrain de football avec une foule dans les tribunes en arrière-plan.
Peinture réaliste d'une jeune femme aux longs cheveux portant une minijupe blanche et un haut bleu clair, debout dans une salle de bowling avec des boules de bowling sur le côté.

Images avec 3d

Portrait photoréaliste en gros plan d'une fille hipster stylée avec maquillage sombre, mâchoire définie, et un collier séduisant.
Image 3D réaliste de Tifa Lockhart assise avec une jambe levée, portant une brassière de sport blanche et un pantalon de jogging noir, montrant une peau brillante et de la sueur sur un fond blanc simple.
Une tortue très détaillée portant un jetpack, volant au-dessus d'un canal urbain vibrant entouré de bâtiments colorés sous un ciel bleu.
Une voiture classique jaune vif filant sur une rue urbaine mouillée avec une grande explosion en arrière-plan sous un ciel nuageux.
Loona de Helluva Boss assise dans un fauteuil gaming avec de grands yeux rouges tristes, tenant un panneau enflammé disant 'Need Buzz to generate more Loona' dans une salle de jeu.
Chambre futuriste compacte avec design métallique et industriel, comprenant un lit en désordre près d'une grande fenêtre panoramique donnant sur une ligne d'horizon cyberpunk éclairée au néon la nuit.
Image photoréaliste d'une femme élégante en robe rouge frappante et lunettes de soleil, debout avec assurance dans un terminal d'aéroport entourée d'une pile chaotique et imposante de valises colorées sur un chariot à bagages.
Une fille phalène 3D réaliste aux cheveux noir et blanc séparés, grands yeux rouges, et expression émerveillée avec bave, penchée sur une ampoule lumineuse sur une table en bois.
Une arbalétrière médiévale féminine rendue en 3D avec cheveux bruns tressés, yeux marron, vêtue de vêtements médiévaux marron clair et d'une armure en cuir, tenant une arbalète avec un regard sérieux de côté.
Art numérique 3D d'un chat pirate jaune aux yeux bleus brillants, grand chapeau pirate marine orné d'un emblème de crâne, cape marine détaillée attachée par des chaînes dorées, et manteau marron, posé avec assurance devant un fond de vitrail.

Images avec tout en un

Une sœur anime mignonne aux cheveux blonds tressés, grands yeux bleus et expression joyeuse. Elle porte un habit traditionnel de sœur avec un voile noir et un bandeau blanc, tenant ses mains en posture de prière. Cette image est générée par IA utilisant Stable Diffusion.
Fille style anime aux longs cheveux bleus en queue de cheval, tenant un katana, debout sous des cerisiers en fleur. Créé avec l'IA utilisant Stable Diffusion.
Fille anime avec de longs cheveux bleu-gris, tenue ornée et accessoires détaillés, image générée par IA utilisant Stable Diffusion.

Images avec anime

Une peinture numérique détaillée d'une fille d'anime aux cheveux blonds et aux yeux bleus saisissants, éclairée par une lumière douce et onirique dans un style CGI.
Portrait en gros plan de Dio Brando aux cheveux blonds et au bandeau vert, entouré d'effets scintillants sous un ciel bleu clair.
Un bar cyberpunk illuminé par des lumières néon violettes, rempli de clients futuristes portant des casques et des équipements cybernétiques, avec des écrans holographiques et une ambiance high-tech.
Une fille d'anime détaillée aux cheveux blonds portant des vêtements blancs et rouges marchant à travers un ruisseau forestier entourée de méduses orange lumineuses au crépuscule.
Portrait d'une fille elfe avec de longs twintails blancs, yeux bleus, oreilles pointues, portant un capelet blanc avec bordure dorée et des bijoux sur un fond noir.
Fille elfe style anime aux longues doubles queues argentées et yeux verts, debout dans un champ de fleurs bleues, portant une cape blanche, une chemise rayée et des collants noirs.
Une jeune femme anime aux yeux bleus et aux cheveux bruns se tient devant un fond mosaïque floral bleu cobalt dans une esthétique de paysage de rêve.
Illustration numérique de style anime montrant une grande structure pyramidale triangulaire en pierre pointue sur une terre aride avec des rochers épars sous un ciel étoilé et une planète aux anneaux orange.
Guerrière féminine de style anime détaillée en tenue de cuir noir, adoptant une pose dynamique avec des effets colorés tourbillonnants bleus et oranges en arrière-plan.
Un portrait détaillé d'un cyborg aux longs cheveux blancs, aux yeux bleus, portant une armure robotique complexe, debout dans un paysage urbain cyberpunk futuriste la nuit.

Images avec modèle de base

Scène photoréaliste de personnages morts-vivants comprenant des zombies et des squelettes marchant à travers un cimetière hanté éclairé par des citrouilles-lanternes lumineuses sous un ciel sombre et menaçant.

Images avec photorealiste

Silhouette d'un homme cybernétique avec des ailes et de longues jambes fines rempli d'un collage multimédia photoréaliste de paysages urbains et de bâtiments sous un éclairage cinématographique.
Image futuriste en noir et blanc présentant des lignes métalliques partant du haut, avec un feuillage teinté de rouge encadrant la scène et un diamant bleu pulsant au centre.
Image photoréaliste d'un robot femme de ménage allongé sur le sol forestier avec des feuillages mêlés à ses cheveux et parties robotiques, vêtue d'une robe de bonne blanche.
Supermodèle fantastique à la beauté éthérée portant une robe avant-gardiste colorée et vibrante, ornée de bijoux complexes, sur un fond multicolore vif tourbillonnant.
Jeune barista féminine debout derrière un comptoir de café rustique portant une chemise noire à boutons et un tablier noir, souriant doucement avec un maquillage naturel et les cheveux attachés.
Trois femmes portant des pulls et pantalons de style nautique debout ensemble sur le pont d'un yacht de luxe la nuit avec en arrière-plan l'océan des Caraïbes.
Scène photoréaliste d'une jeune femme japonaise en robe d'été colorée et fluide, marchant le long d'un sentier forestier entouré de méduses flottantes et lumineuses sous un éclairage naturel.
Une fille mignonne assise confortablement dans une bibliothèque cosy, étudiant à la lumière de bougie avec un éclairage d'ambiance chaleureux et un livre ouvert devant elle.
Une illustration vectorielle 2D détaillée d'une femme ornée de fleurs d'orchidée noire et de motifs floraux complexes de style baroque.
Gros plan d'un jeune homme avec une barbe blonde courte en pointe et des lunettes, à moitié éclairé par le soleil du matin, avec un chat tigré reposant sur son épaule.