Une image dramatique d'un corbeau volant avec des ailes étendues affichant des plumes orange flamboyantes sur un fond de ciel mélancolique.
Un terminator robotique couvert de motifs de dés se tient sur un sol de lave lumineux entouré de dés éparpillés dans une caverne infernale surréaliste.
Image en gros plan en noir et blanc de lèvres féminines entrouvertes avec dents visibles, superposée de motifs d'interférence abstraits.
Paysage urbain en noir et blanc montrant des silhouettes de personnes marchant dans un environnement urbain brumeux avec de grands bâtiments en arrière-plan.
Vue en gros plan d'un alien curieux aux grands yeux réfléchissants, texture détaillée de la peau extraterrestre, debout parmi la flore alien avec des montagnes en arrière-plan sous un objectif grand angle et un effet grain de film.
Vue en gros plan d'un visage extraterrestre très détaillé avec de grands yeux réfléchissants montrant un paysage extra-terrestre, capturé par une sonde interstellaire avec effet grain de film.
Portrait hyperréaliste d'une jeune femme rousse sculpturale aux cheveux bouclés, en extérieur dans un panorama onirique avec un paysage aride flou en arrière-plan.
Image hyper réaliste en gros plan d'un œil vert entouré de taches de rousseur, avec des cheveux roux et des lèvres peintes en noir.
Portrait d'une femme aux longs cheveux roux, taches de rousseur sur peau blanche, yeux vert clair, lèvres noires, et détails complexes dans un style hyperréaliste.

Paramètres recommandés

resolution

525x525

Conseils

Le modèle est destiné à des fins de recherche incluant la génération d’œuvres d’art, outils éducatifs, et déploiement sécurisé.

Il n’est pas destiné à générer des représentations factuelles ou vraies de personnes ou d’événements.

Les limitations incluent un photoréalisme imparfait, l’incapacité à rendre un texte lisible, des défis avec les prompts compositionnels, et une possible mauvaise génération des visages.

Le modèle utilise deux encodeurs textuels pré-entraînés : OpenCLIP-ViT/G et CLIP-ViT/L.

Le pipeline en deux étapes inclut la génération latente de base suivie d’un affinage haute résolution utilisant SDEdit (img2img).

Sponsors du créateur

Originalement Publié sur Hugging Face et partagé ici avec la permission de Stability AI.

Originalement Publié sur Hugging Face et partagé ici avec la permission de Stability AI.

SDXL consiste en un pipeline en deux étapes pour la diffusion latente : d'abord, nous utilisons un modèle de base pour générer les latents de la taille de sortie désirée. Ensuite, nous utilisons un modèle spécialisé haute résolution et appliquons une technique appelée SDEdit (https://arxiv.org/abs/2108.01073, également connue sous le nom de "img2img") aux latents générés à la première étape, en utilisant la même invite.

Description du Modèle

  • Développé par : Stability AI

  • Type de modèle : Modèle génératif texte-image basé sur la diffusion

  • Description du Modèle : Il s'agit d'un modèle qui peut être utilisé pour générer et modifier des images à partir de prompts textuels. C'est un Modèle de Diffusion Latente utilisant deux encodeurs textuels fixes et pré-entraînés (OpenCLIP-ViT/G et CLIP-ViT/L).

  • Ressources pour plus d'informations : Dépôt GitHub.

Sources du Modèle

Utilisations

Utilisation Directe

Le modèle est destiné uniquement à la recherche. Les domaines et tâches possibles incluent

  • La génération d'œuvres d'art et l'utilisation dans le design et autres processus artistiques.

  • Les applications dans les outils éducatifs ou créatifs.

  • La recherche sur les modèles génératifs.

  • Le déploiement sécurisé de modèles ayant le potentiel de générer du contenu nuisible.

  • L'exploration et la compréhension des limites et biais des modèles génératifs.

Les usages exclus sont décrits ci-dessous.

Usages hors périmètre

Le modèle n'a pas été entraîné pour représenter de manière factuelle ou vraie des personnes ou des événements, et donc l'utilisation du modèle pour générer ce type de contenu est hors périmètre pour les capacités de ce modèle.

Limitations et Biais

Limitations

  • Le modèle n’atteint pas un photoréalisme parfait

  • Le modèle ne peut pas rendre un texte lisible

  • Le modèle éprouve des difficultés avec des tâches plus complexes impliquant la composition, comme rendre une image correspondant à « Un cube rouge au-dessus d’une sphère bleue »

  • Les visages et les personnes en général peuvent ne pas être générés correctement.

  • La partie d’auto-encodage du modèle est avec perte.

Biais

Bien que les capacités des modèles de génération d’images soient impressionnantes, ils peuvent aussi renforcer ou exacerber des biais sociaux.

Le graphique ci-dessus évalue la préférence utilisateur pour SDXL (avec et sans affinage) par rapport à Stable Diffusion 1.5 et 2.1. Le modèle de base SDXL performe significativement mieux que les versions précédentes, et le modèle combiné avec le module de raffinage atteint la meilleure performance globale.

Précédent
epiCPhotoGasm - V1
Suivant
IlluQuaint - v0.3

Détails du modèle

Type de modèle

Checkpoint

Modèle de base

SDXL 1.0

Version du modèle

v1.0

Hash du modèle

31e35c80fc

Discussion

Veuillez vous log in pour laisser un commentaire.

Images par SD XL - v1.0

Une image dramatique d'un corbeau volant avec des ailes étendues affichant des plumes orange flamboyantes sur un fond de ciel mélancolique.
Un terminator robotique couvert de motifs de dés se tient sur un sol de lave lumineux entouré de dés éparpillés dans une caverne infernale surréaliste.
Image en gros plan en noir et blanc de lèvres féminines entrouvertes avec dents visibles, superposée de motifs d'interférence abstraits.
Paysage urbain en noir et blanc montrant des silhouettes de personnes marchant dans un environnement urbain brumeux avec de grands bâtiments en arrière-plan.
Vue en gros plan d'un alien curieux aux grands yeux réfléchissants, texture détaillée de la peau extraterrestre, debout parmi la flore alien avec des montagnes en arrière-plan sous un objectif grand angle et un effet grain de film.
Vue en gros plan d'un visage extraterrestre très détaillé avec de grands yeux réfléchissants montrant un paysage extra-terrestre, capturé par une sonde interstellaire avec effet grain de film.
Portrait hyperréaliste d'une jeune femme rousse sculpturale aux cheveux bouclés, en extérieur dans un panorama onirique avec un paysage aride flou en arrière-plan.
Image hyper réaliste en gros plan d'un œil vert entouré de taches de rousseur, avec des cheveux roux et des lèvres peintes en noir.
Portrait d'une femme aux longs cheveux roux, taches de rousseur sur peau blanche, yeux vert clair, lèvres noires, et détails complexes dans un style hyperréaliste.

Images avec modèle de base

Scène photoréaliste de personnages morts-vivants comprenant des zombies et des squelettes marchant à travers un cimetière hanté éclairé par des citrouilles-lanternes lumineuses sous un ciel sombre et menaçant.

Images avec officiel

Un portrait hyperdétaillé d'une guerrière avec des cheveux bleu foncé et des yeux jaunes hypnotiques, tenant un orbe doré lumineux dans une armure dorée sous un éclairage cinématographique.

Images avec sdxl

Un dragon détaillé avec un éclat métallique et des veines pulsantes complexes ais-vesselz rouges et bleues couvrant son corps.
Un paysage urbain désert avec des bâtiments en ruine enveloppés et entrelacés de ais-vesselz rouges pulsants, des rues recouvertes d'un liquide rouge visqueux.
Gros plan sur une tête de dragon robotique avec plaques d'armure bleues, soulignée par des étincelles célestes et un ombrage cel net contre une silhouette urbaine au crépuscule.

Images avec stability ai

Fille blonde de style anime portant une robe d'été blanche et un grand chapeau de soleil décoré d'un tournesol, se tenant joyeusement dans un champ de tournesols au coucher du soleil avec les bras levés.
Personnage Ffixgarnet aux longs cheveux noirs et yeux marron, portant une combinaison orange à lacets croisés avec des manches blanches bouffantes et des gants rouges, escaladant une échelle en corde en bois sur fond ciel bleu, rougissante et regardant en arrière
Personnage d'anime aux cheveux rose vif et ailes enflammées accroupi en pose dynamique contre un arrière-plan violet et de fantasy sombre avec des rochers tranchants et déchiquetés.
Vue rapprochée de multiples sphères noires texturées flottant sur un fond cosmique sombre avec des lumières bokeh colorées et rêveuses.
Gros plan d'un cyborg avec un casque noir mat sans visage, de longs cheveux noirs, et une armure rouge et noire complexe brillant faiblement en rouge dans une ambiance sombre.
Guerrière fille de chambre aux couettes vertes brandissant une arme d'hast scie circulaire dans une usine de robots faiblement éclairée avec des pièces mécaniques et des câbles, éclaboussures de sang sur le sol.