Un calderone di bronzo pieno di foglie e rametti riposa accanto a un grande tronco d'albero coperto di muschio in una foresta autunnale vibrante, circondato da felci e fogliame audace.
Una donna con cappuccio in vesti logore siede a un tavolo di legno illuminato da candele in una taverna oscura, leggendo un antico libro con simboli runici, circondata da candele tremolanti e ombre.
Interno della camera da letto in stile Njideka Akunyili Crosby che mostra una donna reclinata su un letto con tessuti vivaci, circondata da ritagli di riviste, tende di pizzo e dipinti di ritratti sulle pareti.
Radura in stile acquerello e carbone vicino a un lago durante la sera in primavera con morbide estetiche di sfondi per visual novel horror anime degli anni '20.
Una donna misteriosa in un lungo trench scuro con capelli selvaggi si staglia contro uno sfondo astratto di inchiostro blu e grigio con tratteggio caotico e illuminazione drammatica.
Sagoma di una casa tradizionale e un gazebo avvolti in una fitta nebbia con una grande montagna sullo sfondo durante la luce del primo mattino.
Diverse pagode emergono da montagne coperte di nebbia che si affacciano su un fiume con navi tradizionali che fluttuano, incorniciate dalla nebbia e da alberi lontani.
Vista aerea di una lunga cabina rettangolare situata sul fondo di una valle verde, circondata da alberi fitti e montagne imponenti sotto un cielo scuro carico di pioggia con nuvole pesanti.
Cabina quadrata moderna inclinata in avanti nella foresta di notte, con una grande parete in vetro, divano nero interno, piante, illuminazione incandescente calda e zona portico esterna.
Capanna in legno serra su due piani elevata su colonne su una superficie boschiva inclinata circondata da pini, nebbia ed erba gialla.
Doppi moderni baite in cemento con grandi finestre di vetro impilate perpendicolarmente su colonne di cemento, situate su un pendio montano roccioso coperto di neve con uno sfondo di montagne.
Cabina moderna rettangolare verniciata di bianco con finestre in vetro e illuminazione interna, elevata sopra gli alberi della foresta su due colonne di cemento inclinate sotto un cielo grigio.

Prompt Negativi Consigliati

(deformed iris, deformed pupils), text, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, (extra fingers), (mutated hands), poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, (fused fingers), (too many fingers), long neck, camera

Parametri Consigliati

samplers

Euler

steps

50

cfg

8

resolution

525x525

Suggerimenti

Il modello è destinato a scopi di ricerca inclusi generazione di opere d’arte, strumenti educativi e implementazioni sicure.

Non è destinato a generare rappresentazioni fattuali o veritiere di persone o eventi.

Le limitazioni includono fotorealismo non perfetto, incapacità di rendere testo leggibile, difficoltà con prompt composizionali e possibile generazione imprecisa di volti.

Il modello utilizza due encoder testuali pretrained: OpenCLIP-ViT/G e CLIP-ViT/L.

La pipeline in due fasi include la generazione base dei latenti seguita dal raffinamento ad alta risoluzione usando SDEdit (img2img).

Sponsor del Creatore

Originariamente Pubblicato su Hugging Face e condiviso qui con il permesso di Stability AI.

Originariamente Pubblicato su Hugging Face e condiviso qui con il permesso di Stability AI.

SDXL consiste in una pipeline in due fasi per la diffusione latente: prima, utilizziamo un modello base per generare latenti della dimensione desiderata dell’output. Nella seconda fase, usiamo un modello specializzato ad alta risoluzione e applichiamo una tecnica chiamata SDEdit (https://arxiv.org/abs/2108.01073, conosciuta anche come "img2img") ai latenti generati nella prima fase, usando lo stesso prompt.

Descrizione del Modello

  • Sviluppato da: Stability AI

  • Tipo di modello: Modello generativo testo-immagine basato su diffusione

  • Descrizione del modello: Questo è un modello che può essere usato per generare e modificare immagini basate su prompt testuali. È un Modello di Diffusione Latente che usa due encoder testuali pretrained fissi (OpenCLIP-ViT/G e CLIP-ViT/L).

  • Risorse per maggiori informazioni: Repository GitHub.

Fonti del Modello

Utilizzi

Uso Diretto

Il modello è destinato esclusivamente a scopi di ricerca. Aree e compiti di ricerca possibili includono

  • Generazione di opere d’arte e utilizzo in processi di design e altri processi artistici.

  • Applicazioni in strumenti educativi o creativi.

  • Ricerca sui modelli generativi.

  • Implementazione sicura di modelli che possono generare contenuti nocivi.

  • Analisi e comprensione delle limitazioni e dei bias dei modelli generativi.

Gli usi esclusi sono descritti di seguito.

Uso Fuori Scopo

Il modello non è stato addestrato per rappresentazioni fattuali o veritiere di persone o eventi, pertanto l’uso del modello per generare tali contenuti è fuori dallo scopo delle capacità di questo modello.

Limitazioni e Bias

Limitazioni

  • Il modello non raggiunge un fotorealismo perfetto

  • Il modello non può rendere testo leggibile

  • Il modello fatica con compiti più complessi che coinvolgono la composizionalità, come rendere un'immagine corrispondente a “Un cubo rosso sopra una sfera blu”

  • Volti e persone in generale possono non essere generati correttamente.

  • La parte di autoencoding del modello è lossy.

Bias

Pur essendo impressionanti, le capacità dei modelli di generazione immagini possono anche rafforzare o esacerbare pregiudizi sociali.

Il grafico sopra valuta la preferenza degli utenti per SDXL (con e senza raffinamento) rispetto a Stable Diffusion 1.5 e 2.1. Il modello base SDXL ha prestazioni significativamente migliori rispetto alle versioni precedenti, e il modello combinato con il modulo di raffinamento ottiene la migliore performance complessiva.

Precedente
Plant Milk 🌿 - Suite Modello - Walnut
Successivo
FLUX.1 - DEV FP8 - Kijai [11 GB]

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

SDXL 1.0

Versione del modello

v1.0 VAE fix

Hash del modello

e6bb9ea85b

Discussione

Per favore log in per lasciare un commento.

Immagini di SD XL - v1.0 correzione VAE

Un calderone di bronzo pieno di foglie e rametti riposa accanto a un grande tronco d'albero coperto di muschio in una foresta autunnale vibrante, circondato da felci e fogliame audace.
Una donna con cappuccio in vesti logore siede a un tavolo di legno illuminato da candele in una taverna oscura, leggendo un antico libro con simboli runici, circondata da candele tremolanti e ombre.
Interno della camera da letto in stile Njideka Akunyili Crosby che mostra una donna reclinata su un letto con tessuti vivaci, circondata da ritagli di riviste, tende di pizzo e dipinti di ritratti sulle pareti.
Radura in stile acquerello e carbone vicino a un lago durante la sera in primavera con morbide estetiche di sfondi per visual novel horror anime degli anni '20.
Una donna misteriosa in un lungo trench scuro con capelli selvaggi si staglia contro uno sfondo astratto di inchiostro blu e grigio con tratteggio caotico e illuminazione drammatica.
Sagoma di una casa tradizionale e un gazebo avvolti in una fitta nebbia con una grande montagna sullo sfondo durante la luce del primo mattino.
Diverse pagode emergono da montagne coperte di nebbia che si affacciano su un fiume con navi tradizionali che fluttuano, incorniciate dalla nebbia e da alberi lontani.
Vista aerea di una lunga cabina rettangolare situata sul fondo di una valle verde, circondata da alberi fitti e montagne imponenti sotto un cielo scuro carico di pioggia con nuvole pesanti.
Cabina quadrata moderna inclinata in avanti nella foresta di notte, con una grande parete in vetro, divano nero interno, piante, illuminazione incandescente calda e zona portico esterna.
Capanna in legno serra su due piani elevata su colonne su una superficie boschiva inclinata circondata da pini, nebbia ed erba gialla.
Doppi moderni baite in cemento con grandi finestre di vetro impilate perpendicolarmente su colonne di cemento, situate su un pendio montano roccioso coperto di neve con uno sfondo di montagne.
Cabina moderna rettangolare verniciata di bianco con finestre in vetro e illuminazione interna, elevata sopra gli alberi della foresta su due colonne di cemento inclinate sotto un cielo grigio.

Immagini con modello base

Scena fotorealistica di personaggi non morti tra zombie e scheletri che camminano attraverso un cimitero spettrale illuminato da jack-o'-lantern luminosi sotto un cielo scuro e minaccioso.

Immagini con ufficiale

Un ritratto iper-dettagliato di una guerriera con capelli blu scuro e occhi gialli ipnotizzanti, che tiene un orbe dorato luminoso in armatura dorata sotto illuminazione cinematografica.

Immagini con sdxl

Un drago dettagliato con lucentezza metallica e intricate vene pulsanti rosse e blu ais-vesselz che coprono il suo corpo.
Un paesaggio urbano abbandonato con edifici fatiscenti avvolti e intrecciati con ais-vesselz rossi pulsanti, strade rivestite da un liquido viscoso rosso.
Primo piano di una testa di drago robotico con piastre di armatura blu, evidenziata da scintille celesti e cel shading netto contro lo skyline della città al crepuscolo.

Immagini con stability ai

Ragazza bionda in stile anime che indossa un abito estivo bianco e un grande cappello di paglia con decorazione di girasoli, che sta felice in un campo di girasoli al tramonto con le braccia alzate.
Personaggio Ffixgarnet con lunghi capelli neri e occhi marroni, che indossa una tuta arancione incrociata con maniche bianche vaporose e guanti rossi, che scala una scala di corda di legno su sfondo cielo blu, arrossendo e guardando indietro
Personaggio anime con capelli rosa acceso e ali infuocate accovacciato in una posa dinamica contro uno sfondo viola e dark fantasy con rocce frastagliate e appuntite.
Vista ravvicinata di multiple sfere nere testurizzate che fluttuano su uno sfondo cosmico scuro con luci bokeh colorate e da sogno.
Primo piano di un cyborg con elmo opaco nero senza volto, lunghi capelli neri e intricata armatura rossa e nera che si illumina leggermente di rosso in un ambiente cupo.
Guerriera maggiordoma con codini verdi che impugna un'alabarda a sega circolare in una fabbrica di robot scarsamente illuminata piena di parti meccaniche e cavi, spruzzi di sangue sul pavimento.