modèles/Stable Diffusion 3.5 Large Turbo - Large Turbo

Stable Diffusion 3.5 Large Turbo - Large Turbo

8/31/2025

12:43:27 AM

Mots-clés et tags associés

distillation par diffusion adversariale,modèle de base,point de contrôle,large turbo,transformateur de diffusion multimodal,sd 3.5 large turbo,sd3.5,stability ai,stable diffusion 3.5,stable diffusion 3.5 large turbo,modèle génératif texte-image,theally

Profil latéral d'une belle femme abstraite avec un maquillage délicat et des ornements capillaires traditionnels, sur fond d'une ville nocturne avec des montagnes et une grande lune.

Illustration abstraite d'une femme aux cheveux rouges frappants et taches de rousseur, vêtue de vêtements sombres, sur fond d'un ciel nocturne détaillé avec étoiles et motifs célestes.

Paramètres recommandés

steps

4 - null

Sponsors du créateur

Veuillez consulter notre Guide de démarrage rapide de Stable Diffusion 3.5 pour toutes les dernières informations !

Stable Diffusion 3.5 Large Turbo est un modèle texte-à-image Multimodal Diffusion Transformer (MMDiT) avec Adversarial Diffusion Distillation (ADD) qui offre une performance améliorée en qualité d'image, typographie, compréhension de prompts complexes, et efficacité des ressources, avec un accent mis sur un nombre réduit d'étapes d'inférence.

Veuillez noter : Ce modèle est publié sous la Licence Communautaire Stability. Visitez Stability AI pour en savoir plus ou nous contacter pour les détails de licence commerciale.

Description du Modèle

Développé par : Stability AI
Type de modèle : Modèle génératif texte-à-image MMDiT
Description du modèle : Ce modèle génère des images à partir de prompts textuels. Il s'agit d'un Multimodal Diffusion Transformer distillé avec ADD utilisant trois encodeurs de texte fixes et pré-entraînés, avec une normalisation QK.

Licence

Licence Communautaire : Gratuite pour la recherche, usage non commercial et commercial pour les organisations ou individus ayant moins de 1 million de dollars de revenu annuel total. Plus de détails sont disponibles dans le Contrat de Licence Communautaire. Plus d'informations sur https://stability.ai/license.
Pour les individus et organisations avec un revenu annuel supérieur à 1 million de dollars : Veuillez nous contacter pour obtenir une Licence Entreprise.

Sources du Modèle

Pour un usage local ou en hébergement autonome, nous recommandons ComfyUI pour une interface utilisateur basée sur des nœuds, ou diffusers ou GitHub pour une utilisation programmatique.

ComfyUI : Github, Exemple de flux de travail
Huggingface Space : Space
Diffusers : Voir ci-dessous.
GitHub : GitHub.
Points d’API :
- API Stability AI
- Deepinfra

Détails de mise en œuvre

Normalisation QK : Met en œuvre la technique de normalisation QK pour améliorer la stabilité de l'entraînement.
Adversarial Diffusion Distillation (ADD) (voir le rapport technique), qui permet un échantillonnage en 4 étapes avec une haute qualité d'image.
Encodeurs de texte :
- CLIPs : OpenCLIP-ViT/G, CLIP-ViT/L, longueur de contexte de 77 tokens
- T5 : T5-xxl, longueur de contexte de 77/256 tokens à différentes étapes de l'entraînement
Données d'entraînement et stratégie :
Ce modèle a été entraîné sur un large éventail de données, incluant des données synthétiques et des données publiques filtrées.

Pour plus de détails techniques sur l'architecture originale MMDiT, veuillez consulter le papier de recherche.

Contributeur

Camille Dubois

Bonjour ! Je m’appelle Camille Dubois. Passionnée d’art visuel, j’orchestre des galeries numériques pour révéler toute la poésie des images générées par l’IA.

Pikuson | Shiiro's Styles - v1.0

Dragonhead - v1.0

Utiliser ce modèle