Stable Diffusion 3.5 Large - Large
Prompt Consigliati
a detailed illustration of a cute rainbow colorful boba tea sitting in a window sill, tiki bar looking out onto a tropical oceanfront background, shallow depth of field, cinematic lighting, dappled sunlight, lens flare bokeh
Parametri Consigliati
samplers
steps
cfg
Sponsor del Creatore
Si prega di consultare la nostra Guida Rapida a Stable Diffusion 3.5 per tutte le ultime informazioni!
Si prega di consultare la nostra Guida Rapida a Stable Diffusion 3.5 per tutte le ultime informazioni!
Stable Diffusion 3.5 Large è un modello testo-immagine Multimodal Diffusion Transformer (MMDiT) che presenta miglioramenti nella qualità delle immagini, nella tipografia, nella comprensione di prompt complessi e nell'efficienza delle risorse.
Si prega di notare: questo modello è rilasciato sotto la Licenza della Community Stability. Visitate Stability AI per informazioni o contattarci per dettagli sulla licenza commerciale.
Descrizione del Modello
Sviluppato da: Stability AI
Tipo di modello: modello generativo testo-immagine MMDiT
Descrizione del Modello: Questo modello genera immagini basate su prompt testuali. È un Multimodal Diffusion Transformer che utilizza tre encoder di testo fissi e preregistrati, con normalizzazione QK per migliorare la stabilità dell'addestramento.
Licenza
Licenza Community: Gratuita per uso di ricerca, non commerciale e commerciale per organizzazioni o individui con un fatturato annuo totale inferiore a 1 milione di dollari. Maggiori dettagli sono disponibili nel Contratto di Licenza della Community. Leggi di più su https://stability.ai/license.
Per individui e organizzazioni con fatturato annuo superiore a 1 milione di dollari: si prega di contattarci per ottenere una Licenza Enterprise.
Dettagli di Implementazione
Normalizzazione QK: Implementa la tecnica di normalizzazione QK per migliorare la stabilità dell'addestramento.
Encoder di Testo:
CLIPs: OpenCLIP-ViT/G, CLIP-ViT/L, lunghezza contesto 77 token
T5: T5-xxl, lunghezza contesto 77/256 token in diverse fasi di addestramento
Dati e Strategia di Addestramento:
Questo modello è stato addestrato su un'ampia varietà di dati, inclusi dati sintetici e dati pubblici filtrati.
Per maggiori dettagli tecnici sull'architettura originale MMDiT, si prega di consultare il paper di ricerca.
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Creatore
Discussione
Per favore log in per lasciare un commento.









