Vista aerea di una lunga cabina rettangolare situata sul fondo di una valle verde, circondata da alberi fitti e montagne imponenti sotto un cielo scuro carico di pioggia con nuvole pesanti.
Cabina quadrata moderna inclinata in avanti nella foresta di notte, con una grande parete in vetro, divano nero interno, piante, illuminazione incandescente calda e zona portico esterna.
Capanna in legno serra su due piani elevata su colonne su una superficie boschiva inclinata circondata da pini, nebbia ed erba gialla.
Doppi moderni baite in cemento con grandi finestre di vetro impilate perpendicolarmente su colonne di cemento, situate su un pendio montano roccioso coperto di neve con uno sfondo di montagne.
Cabina moderna rettangolare verniciata di bianco con finestre in vetro e illuminazione interna, elevata sopra gli alberi della foresta su due colonne di cemento inclinate sotto un cielo grigio.
Una maschera in carbonio forgiato con occhi arancioni luminosi circondata da fiamme vibranti su uno sfondo scuro.
Profilo di una donna fluttuante con un volto dettagliato, la sua pelle e capelli che scorrono con pennellate di vernice colorata vivida e vorticosa su sfondo scuro.
Ritratto di una giovane donna somigliante a Zelda con capelli biondi, orecchie da elfo, occhi azzurri, che indossa un diadema d'oro e un abito medievale viola profondo con dettagli dorati elaborati.
Un gatto nero con occhi arancioni luminosi siede in mezzo a fiamme intense all'interno di un tempio antico con colonne, circondato da fuoco e fumo.
Un altare occulto autunnale in stile fantasy oscuro con caffè fumante in una tazza, candela accesa con fumo ascendente, piccole zucche su piatti, una teiera e un libro aperto con texture acquerellate invecchiate.
Dipinto ad acquerello di un grande relitto di nave sci-fi schiantata su un paesaggio desertico con un pilota incastrato che sta vicino, creato con linee audaci, stile schizzo espressivo e colorato, e illuminazione ad alto contrasto.
Dipinto ad acquerello che rappresenta una strada cittadina allagata fiancheggiata da edifici ruinati intricati, con due figure in pose dinamiche, illuminate da un'illuminazione calda e ad alto contrasto.

Prompt Negativi Consigliati

(deformed iris, deformed pupils), text, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, (extra fingers), (mutated hands), poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, (fused fingers), (too many fingers), long neck, camera

Parametri Consigliati

samplers

Euler

steps

50

cfg

8

resolution

525x525

Suggerimenti

Il modello è destinato a scopi di ricerca inclusi generazione di opere d’arte, strumenti educativi e implementazioni sicure.

Non è destinato a generare rappresentazioni fattuali o veritiere di persone o eventi.

Le limitazioni includono fotorealismo non perfetto, incapacità di rendere testo leggibile, difficoltà con prompt composizionali e possibile generazione imprecisa di volti.

Il modello utilizza due encoder testuali pretrained: OpenCLIP-ViT/G e CLIP-ViT/L.

La pipeline in due fasi include la generazione base dei latenti seguita dal raffinamento ad alta risoluzione usando SDEdit (img2img).

Sponsor del Creatore

Originariamente Pubblicato su Hugging Face e condiviso qui con il permesso di Stability AI.

Originariamente Pubblicato su Hugging Face e condiviso qui con il permesso di Stability AI.

SDXL consiste in una pipeline in due fasi per la diffusione latente: prima, utilizziamo un modello base per generare latenti della dimensione desiderata dell’output. Nella seconda fase, usiamo un modello specializzato ad alta risoluzione e applichiamo una tecnica chiamata SDEdit (https://arxiv.org/abs/2108.01073, conosciuta anche come "img2img") ai latenti generati nella prima fase, usando lo stesso prompt.

Descrizione del Modello

  • Sviluppato da: Stability AI

  • Tipo di modello: Modello generativo testo-immagine basato su diffusione

  • Descrizione del modello: Questo è un modello che può essere usato per generare e modificare immagini basate su prompt testuali. È un Modello di Diffusione Latente che usa due encoder testuali pretrained fissi (OpenCLIP-ViT/G e CLIP-ViT/L).

  • Risorse per maggiori informazioni: Repository GitHub.

Fonti del Modello

Utilizzi

Uso Diretto

Il modello è destinato esclusivamente a scopi di ricerca. Aree e compiti di ricerca possibili includono

  • Generazione di opere d’arte e utilizzo in processi di design e altri processi artistici.

  • Applicazioni in strumenti educativi o creativi.

  • Ricerca sui modelli generativi.

  • Implementazione sicura di modelli che possono generare contenuti nocivi.

  • Analisi e comprensione delle limitazioni e dei bias dei modelli generativi.

Gli usi esclusi sono descritti di seguito.

Uso Fuori Scopo

Il modello non è stato addestrato per rappresentazioni fattuali o veritiere di persone o eventi, pertanto l’uso del modello per generare tali contenuti è fuori dallo scopo delle capacità di questo modello.

Limitazioni e Bias

Limitazioni

  • Il modello non raggiunge un fotorealismo perfetto

  • Il modello non può rendere testo leggibile

  • Il modello fatica con compiti più complessi che coinvolgono la composizionalità, come rendere un'immagine corrispondente a “Un cubo rosso sopra una sfera blu”

  • Volti e persone in generale possono non essere generati correttamente.

  • La parte di autoencoding del modello è lossy.

Bias

Pur essendo impressionanti, le capacità dei modelli di generazione immagini possono anche rafforzare o esacerbare pregiudizi sociali.

Il grafico sopra valuta la preferenza degli utenti per SDXL (con e senza raffinamento) rispetto a Stable Diffusion 1.5 e 2.1. Il modello base SDXL ha prestazioni significativamente migliori rispetto alle versioni precedenti, e il modello combinato con il modulo di raffinamento ottiene la migliore performance complessiva.

Precedente
Plant Milk 🌿 - Suite Modello - Walnut
Successivo
FLUX.1 - DEV FP8 - Kijai [11 GB]

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

SDXL 1.0

Versione del modello

v1.0 VAE fix

Hash del modello

e6bb9ea85b

Discussione

Per favore log in per lasciare un commento.

Immagini di SD XL - v1.0 correzione VAE

Immagini con modello base

Immagini con ufficiale

Immagini con sdxl

Immagini con stability ai