Un chaudron en bronze rempli de feuilles et de brindilles repose à côté d'un grand tronc d'arbre moussu dans une forêt d'automne vibrante, entouré de fougères et d'un feuillage audacieux.
Une femme encapuchonnée en robes déchirées est assise à une table en bois éclairée à la bougie dans une taverne sombre, lisant un livre ancien avec des symboles runiques, entourée de bougies vacillantes et d'ombres.
Intérieur de chambre dans le style Njideka Akunyili Crosby montrant une femme allongée sur un lit avec des textiles vibrants, entourée de découpages de magazines, de rideaux en dentelle et de portraits peints sur les murs.
Clairière au bord du lac au crépuscule au printemps, style aquarelle et fusain avec atmosphère douce d'horreur anime des années 1920 pour romans visuels.
Une femme mystérieuse en long trench-coat sombre aux cheveux sauvages se tient devant un fond abstrait bleu et gris à l'encre avec un hachurage chaotique et un éclairage dramatique.
Silhouette d'une maison traditionnelle et d'un gazebo enveloppés d'une épaisse brume avec une grande montagne en arrière-plan lors de la lumière du petit matin.
Plusieurs pagodes s'élèvent des montagnes couvertes de brume surplombant une rivière avec des navires traditionnels dérivant, encadrées par le brouillard et des arbres lointains.
Vue aérienne d'une longue cabane rectangulaire située sur le sol d'une vallée verte, entourée d'arbres denses et de montagnes imposantes sous un ciel sombre chargé de pluie avec des nuages épais.
Cabane carrée moderne inclinée vers l'avant dans une forêt la nuit, avec un grand mur en verre, un canapé noir intérieur, des plantes, un éclairage incandescente chaud et un coin salon sur le porche extérieur.
Cabane en bois à deux étages avec serre, surélevée sur colonnes, sur une surface forestière en pente entourée de pins, de brume et d'herbe jaune.
Deux cabines modernes en béton avec grandes fenêtres en verre empilées perpendiculairement sur des colonnes en béton, situées sur une pente montagneuse rocheuse couverte de neige avec un arrière-plan montagneux.
Cabane moderne rectangulaire peinte en blanc avec fenêtres en verre et éclairage intérieur, élevée au-dessus des arbres de la forêt sur deux colonnes en béton inclinées sous un ciel gris.

Prompts négatifs recommandés

(deformed iris, deformed pupils), text, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, (extra fingers), (mutated hands), poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, (fused fingers), (too many fingers), long neck, camera

Paramètres recommandés

samplers

Euler

steps

50

cfg

8

resolution

525x525

Conseils

Le modèle est destiné à des fins de recherche, incluant la génération d’œuvres d’art, les outils éducatifs et le déploiement sécurisé.

Il n’est pas destiné à générer des représentations factuelles ou exactes de personnes ou d’événements.

Les limitations incluent un photoréalisme imparfait, l’incapacité à rendre un texte lisible, des défis avec les invites compositionnelles, et une possible génération incorrecte des visages.

Le modèle utilise deux encodeurs textuels pré-entraînés : OpenCLIP-ViT/G et CLIP-ViT/L.

Le pipeline en deux étapes comprend une génération latente de base suivie d’un raffinement haute résolution utilisant SDEdit (img2img).

Sponsors du créateur

Initialement publié sur Hugging Face et partagé ici avec l'autorisation de Stability AI.

Initialement publié sur Hugging Face et partagé ici avec l'autorisation de Stability AI.

SDXL se compose d’un pipeline en deux étapes pour la diffusion latente : d’abord, nous utilisons un modèle de base pour générer des latents de la taille de sortie désirée. Dans la seconde étape, nous utilisons un modèle spécialisé haute résolution et appliquons une technique appelée SDEdit (https://arxiv.org/abs/2108.01073, également connu sous le nom "img2img") sur les latents générés à la première étape, en utilisant la même invite.

Description du Modèle

  • Développé par : Stability AI

  • Type de modèle : Modèle génératif texte-image basé sur la diffusion

  • Description du modèle : Il s'agit d'un modèle qui peut être utilisé pour générer et modifier des images basées sur des invites textuelles. C’est un Modèle de diffusion latente qui utilise deux encodeurs textuels fixes et pré-entraînés (OpenCLIP-ViT/G et CLIP-ViT/L).

  • Ressources pour plus d’informations : Dépôt GitHub.

Sources du Modèle

Utilisations

Utilisation Directe

Le modèle est destiné uniquement à des fins de recherche. Les domaines et tâches de recherche possibles incluent

  • La génération d’œuvres d’art et son usage dans le design et d’autres processus artistiques.

  • Les applications dans des outils éducatifs ou créatifs.

  • La recherche sur les modèles génératifs.

  • Le déploiement sûr de modèles pouvant potentiellement générer du contenu nuisible.

  • Explorer et comprendre les limites et biais des modèles génératifs.

Les usages exclus sont décrits ci-dessous.

Usages Hors Scope

Le modèle n’a pas été entraîné pour produire des représentations factuelles ou exactes de personnes ou d’événements, donc l’utilisation du modèle pour générer ce type de contenu est hors du champ d’application des capacités de ce modèle.

Limitations et Biais

Limitations

  • Le modèle n’atteint pas un photoréalisme parfait

  • Le modèle ne peut pas rendre un texte lisible

  • Le modèle rencontre des difficultés avec des tâches plus complexes impliquant la composition, comme rendre une image correspondant à « Un cube rouge sur une sphère bleue »

  • Les visages et les personnes en général peuvent ne pas être générés correctement.

  • La partie d’auto-encodage du modèle est approximative.

Biais

Bien que les capacités des modèles de génération d’images soient impressionnantes, ils peuvent aussi renforcer ou aggraver des biais sociaux.

Le graphique ci-dessus évalue la préférence utilisateur pour SDXL (avec et sans raffinement) par rapport à Stable Diffusion 1.5 et 2.1. Le modèle de base SDXL performe significativement mieux que les variantes précédentes, et le modèle combiné au module de raffinement atteint la meilleure performance globale.

Précédent
Plant Milk 🌿 - Suite de modèles - Walnut
Suivant
FLUX.1 - DEV FP8 - Kijai [11 GB]

Détails du modèle

Type de modèle

Checkpoint

Modèle de base

SDXL 1.0

Version du modèle

v1.0 VAE fix

Hash du modèle

e6bb9ea85b

Discussion

Veuillez vous log in pour laisser un commentaire.

Images par SD XL - v1.0 Correction VAE

Un chaudron en bronze rempli de feuilles et de brindilles repose à côté d'un grand tronc d'arbre moussu dans une forêt d'automne vibrante, entouré de fougères et d'un feuillage audacieux.
Une femme encapuchonnée en robes déchirées est assise à une table en bois éclairée à la bougie dans une taverne sombre, lisant un livre ancien avec des symboles runiques, entourée de bougies vacillantes et d'ombres.
Intérieur de chambre dans le style Njideka Akunyili Crosby montrant une femme allongée sur un lit avec des textiles vibrants, entourée de découpages de magazines, de rideaux en dentelle et de portraits peints sur les murs.
Clairière au bord du lac au crépuscule au printemps, style aquarelle et fusain avec atmosphère douce d'horreur anime des années 1920 pour romans visuels.
Une femme mystérieuse en long trench-coat sombre aux cheveux sauvages se tient devant un fond abstrait bleu et gris à l'encre avec un hachurage chaotique et un éclairage dramatique.
Silhouette d'une maison traditionnelle et d'un gazebo enveloppés d'une épaisse brume avec une grande montagne en arrière-plan lors de la lumière du petit matin.
Plusieurs pagodes s'élèvent des montagnes couvertes de brume surplombant une rivière avec des navires traditionnels dérivant, encadrées par le brouillard et des arbres lointains.
Vue aérienne d'une longue cabane rectangulaire située sur le sol d'une vallée verte, entourée d'arbres denses et de montagnes imposantes sous un ciel sombre chargé de pluie avec des nuages épais.
Cabane carrée moderne inclinée vers l'avant dans une forêt la nuit, avec un grand mur en verre, un canapé noir intérieur, des plantes, un éclairage incandescente chaud et un coin salon sur le porche extérieur.
Cabane en bois à deux étages avec serre, surélevée sur colonnes, sur une surface forestière en pente entourée de pins, de brume et d'herbe jaune.
Deux cabines modernes en béton avec grandes fenêtres en verre empilées perpendiculairement sur des colonnes en béton, situées sur une pente montagneuse rocheuse couverte de neige avec un arrière-plan montagneux.
Cabane moderne rectangulaire peinte en blanc avec fenêtres en verre et éclairage intérieur, élevée au-dessus des arbres de la forêt sur deux colonnes en béton inclinées sous un ciel gris.

Images avec modèle de base

Scène photoréaliste de personnages morts-vivants comprenant des zombies et des squelettes marchant à travers un cimetière hanté éclairé par des citrouilles-lanternes lumineuses sous un ciel sombre et menaçant.

Images avec officiel

Un portrait hyperdétaillé d'une guerrière avec des cheveux bleu foncé et des yeux jaunes hypnotiques, tenant un orbe doré lumineux dans une armure dorée sous un éclairage cinématographique.

Images avec sdxl

Un dragon détaillé avec un éclat métallique et des veines pulsantes complexes ais-vesselz rouges et bleues couvrant son corps.
Un paysage urbain désert avec des bâtiments en ruine enveloppés et entrelacés de ais-vesselz rouges pulsants, des rues recouvertes d'un liquide rouge visqueux.
Gros plan sur une tête de dragon robotique avec plaques d'armure bleues, soulignée par des étincelles célestes et un ombrage cel net contre une silhouette urbaine au crépuscule.

Images avec stability ai

Fille blonde de style anime portant une robe d'été blanche et un grand chapeau de soleil décoré d'un tournesol, se tenant joyeusement dans un champ de tournesols au coucher du soleil avec les bras levés.
Personnage Ffixgarnet aux longs cheveux noirs et yeux marron, portant une combinaison orange à lacets croisés avec des manches blanches bouffantes et des gants rouges, escaladant une échelle en corde en bois sur fond ciel bleu, rougissante et regardant en arrière
Personnage d'anime aux cheveux rose vif et ailes enflammées accroupi en pose dynamique contre un arrière-plan violet et de fantasy sombre avec des rochers tranchants et déchiquetés.
Vue rapprochée de multiples sphères noires texturées flottant sur un fond cosmique sombre avec des lumières bokeh colorées et rêveuses.
Gros plan d'un cyborg avec un casque noir mat sans visage, de longs cheveux noirs, et une armure rouge et noire complexe brillant faiblement en rouge dans une ambiance sombre.
Guerrière fille de chambre aux couettes vertes brandissant une arme d'hast scie circulaire dans une usine de robots faiblement éclairée avec des pièces mécaniques et des câbles, éclaboussures de sang sur le sol.