modelli/Stable Diffusion 3.5 Large - Large

Stable Diffusion 3.5 Large - Large

Luca Bianchi

7/2/2025

1:11:57 PM

| Discussion

Parole Chiave e Tag Correlati

modello base,checkpoint,grande,stability ai,stable diffusion,theally

Una balena colossale emerge con forza da acque turbolente con onde vorticose viola e blu e uno sfondo celestiale.

Una biblioteca sotterranea surreale con scaffali alti pieni di libri, una figura umanoide fatta di ombre invertite al centro, sabbia che cola attraverso crepe nel pavimento di pietra, con il deserto visibile attraverso lucernari deformati sopra.

Una solitaria sagoma di barca a vela con vele alte su acque calme e scure sotto un cielo atmosferico e testurizzato con sottili accenni di atmosfera tempestosa.

Donna in silhouette che pedala attraverso un paesaggio urbano surreale e frammentato con tonalità viola e ocra, circondata da alberi ombrosi e edifici astratti.

Sagoma di una ragazza solitaria seduta su una panca del parco sotto un albero con foglie viola, resa con pittura a impasto e pennellate impressioniste vorticosi in verdi e viole intensi.

Veduta urbana sotto un cielo crepuscolare con alti grattacieli dalle finestre luminose, sullo sfondo di una notte indaco e blu.

Silhouette scura di donna che si dissolve in un muro di mattoni in rovina e testurizzato con purpurei e grigi smorzati sotto un’illuminazione eterea e fumosa.

Una sagoma nera di un gatto seduto al centro contro uno sfondo sfumato bianco e nero con linee orizzontali minimaliste, che evoca lo stile di Bridget Riley.

Un colossale yak dell'Himalaya reso con lavaggi di inchiostro nero drammatici, con pelliccia folta e scompigliata e massicce corna ricurve contro uno sfondo montuoso nebbioso.

Donna solitaria in controluce con trecce gemelle che sta su una strada di ciottoli bagnata dalla pioggia sotto un cielo crepuscolare perpetuo, realizzata in stile graphic novel con pesanti lavaggi di inchiostro nero e tratteggio incrociato.

Un cyborg con arti cromati inginocchiato in una piscina opalescente con schizzi d'acqua intorno, circondato da volti frammentati, uno skyline distorto e una nebulosa eterea sullo sfondo nebbioso.

Un gatto nero seduto su un davanzale soleggiato, rappresentato in uno stile dinamico di schizzo a inchiostro con trame di carboncino e grafite.

Prompt Consigliati

a detailed illustration of a cute rainbow colorful boba tea sitting in a window sill, tiki bar looking out onto a tropical oceanfront background, shallow depth of field, cinematic lighting, dappled sunlight, lens flare bokeh

Parametri Consigliati

samplers

DPM++ 2M

steps

cfg

4.5

Sponsor del Creatore

Si prega di consultare la nostra Guida Rapida a Stable Diffusion 3.5 per tutte le ultime informazioni!

Stable Diffusion 3.5 Large è un modello testo-immagine Multimodal Diffusion Transformer (MMDiT) che presenta miglioramenti nella qualità delle immagini, nella tipografia, nella comprensione di prompt complessi e nell'efficienza delle risorse.

Si prega di notare: questo modello è rilasciato sotto la Licenza della Community Stability. Visitate Stability AI per informazioni o contattarci per dettagli sulla licenza commerciale.

Descrizione del Modello

Sviluppato da: Stability AI
Tipo di modello: modello generativo testo-immagine MMDiT
Descrizione del Modello: Questo modello genera immagini basate su prompt testuali. È un Multimodal Diffusion Transformer che utilizza tre encoder di testo fissi e preregistrati, con normalizzazione QK per migliorare la stabilità dell'addestramento.

Licenza

Licenza Community: Gratuita per uso di ricerca, non commerciale e commerciale per organizzazioni o individui con un fatturato annuo totale inferiore a 1 milione di dollari. Maggiori dettagli sono disponibili nel Contratto di Licenza della Community. Leggi di più su https://stability.ai/license.
Per individui e organizzazioni con fatturato annuo superiore a 1 milione di dollari: si prega di contattarci per ottenere una Licenza Enterprise.

Dettagli di Implementazione

Normalizzazione QK: Implementa la tecnica di normalizzazione QK per migliorare la stabilità dell'addestramento.
Encoder di Testo：
- CLIPs: OpenCLIP-ViT/G, CLIP-ViT/L, lunghezza contesto 77 token
- T5: T5-xxl, lunghezza contesto 77/256 token in diverse fasi di addestramento
Dati e Strategia di Addestramento:
Questo modello è stato addestrato su un'ampia varietà di dati, inclusi dati sintetici e dati pubblici filtrati.

Per maggiori dettagli tecnici sull'architettura originale MMDiT, si prega di consultare il paper di ricerca.

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

Stile Anime Cyberpunk - Flux.1 D v1

ZavyChromaXL - v10.0

Usa questo modello