Stable Diffusion 3.5 Large - Large
Prompts recommandés
a detailed illustration of a cute rainbow colorful boba tea sitting in a window sill, tiki bar looking out onto a tropical oceanfront background, shallow depth of field, cinematic lighting, dappled sunlight, lens flare bokeh
Paramètres recommandés
samplers
steps
cfg
Sponsors du créateur
Veuillez consulter notre Guide de démarrage rapide pour Stable Diffusion 3.5 pour toutes les dernières informations !
Veuillez consulter notre Guide de démarrage rapide pour Stable Diffusion 3.5 pour toutes les dernières informations !
Stable Diffusion 3.5 Large est un modèle texte-image Multimodal Diffusion Transformer (MMDiT) qui offre une performance améliorée en qualité d'image, typographie, compréhension complexe des invites et efficacité des ressources.
Veuillez noter : Ce modèle est publié sous la Licence Communautaire Stability. Visitez Stability AI pour en savoir plus ou contactez-nous pour les détails de licence commerciale.
Description du Modèle
Développé par : Stability AI
Type de modèle : modèle génératif texte-image MMDiT
Description du modèle : Ce modèle génère des images à partir de textes d'invite. C’est un Multimodal Diffusion Transformer utilisant trois encodeurs de texte pré-entraînés fixes, et la QK-normalisation pour améliorer la stabilité de l'entraînement.
Licence
Licence communautaire : Gratuit pour la recherche, usage non commercial et commercial pour organisations ou individus avec un revenu annuel total inférieur à 1 million de dollars. Plus de détails dans le Contrat de Licence Communautaire. En savoir plus sur https://stability.ai/license.
Pour les individus et organisations avec un revenu annuel supérieur à 1 million de dollars : veuillez nous contacter pour obtenir une Licence Entreprise.
Détails de l’implémentation
QK Normalisation : Mise en œuvre de la technique de normalisation QK pour améliorer la stabilité de l'entraînement.
Encodeurs de texte :
CLIPs : OpenCLIP-ViT/G, CLIP-ViT/L, longueur de contexte 77 tokens
T5 : T5-xxl, longueur de contexte 77/256 tokens selon les phases d'entraînement
Données et stratégie d'entraînement :
Ce modèle a été entraîné sur une grande variété de données, incluant des données synthétiques et des données filtrées publiques.
Pour plus de détails techniques sur l'architecture originale MMDiT, veuillez consulter le papier de recherche.
Détails du modèle
Type de modèle
Modèle de base
Version du modèle
Hash du modèle
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.









