modelos/Stable Diffusion 3.5 Large Turbo - Large Turbo

Stable Diffusion 3.5 Large Turbo - Large Turbo

8/31/2025

1:01:51 AM

Palavras-chave e Tags Relacionadas

destilação de difusão adversarial,modelo base,checkpoint,large turbo,transformador de difusão multimodal,sd 3.5 large turbo,sd3.5,stability ai,stable diffusion 3.5,stable diffusion 3.5 large turbo,modelo generativo de texto para imagem,theally

Perfil lateral de uma mulher bela abstrata com maquiagem delicada e ornamentos tradicionais no cabelo, contra um cenário noturno de cidade com montanhas e uma grande lua.

Ilustração abstrata de uma mulher com cabelo ruivo marcante e sardas, vestindo roupas escuras, contra um céu noturno detalhado com estrelas e padrões celestiais.

Parâmetros Recomendados

steps

4 - null

Patrocinadores do Criador

Por favor, consulte nosso Guia Rápido para Stable Diffusion 3.5 para todas as informações mais recentes!

Stable Diffusion 3.5 Large Turbo é um modelo Multimodal Diffusion Transformer (MMDiT) texto para imagem com Adversarial Diffusion Distillation (ADD) que apresenta desempenho aprimorado em qualidade de imagem, tipografia, compreensão de prompts complexos e eficiência de recursos, com foco em menos etapas de inferência.

Por favor, note: Este modelo é lançado sob a Licença Comunitária Stability. Visite Stability AI para aprender ou contate-nos para detalhes sobre licenciamento comercial.

Descrição do Modelo

Desenvolvido por: Stability AI
Tipo de modelo: modelo generativo MMDiT texto para imagem
Descrição do Modelo: Este modelo gera imagens com base em prompts de texto. É um ADD-distilled Multimodal Diffusion Transformer que usa três codificadores de texto fixos e pré-treinados, com normalização QK.

Licença

Licença Comunitária: Gratuita para pesquisa, uso não comercial e comercial para organizações ou indivíduos com receita anual total inferior a $1M. Mais detalhes podem ser encontrados no Acordo de Licença Comunitária. Leia mais em https://stability.ai/license.
Para indivíduos e organizações com receita anual acima de $1M: Por favor, contate-nos para obter uma Licença Empresarial.

Fontes do Modelo

Para uso local ou auto-hospedado, recomendamos ComfyUI para inferência com interface baseada em nós, ou diffusers ou GitHub para uso programático.

ComfyUI: Github, Fluxo de Trabalho Exemplo
Huggingface Space: Space
Diffusers: Veja abaixo.
GitHub: GitHub.
Pontos de Extremidade da API:
- API Stability AI
- Deepinfra

Detalhes da Implementação

QK Normalization: Implementa a técnica de normalização QK para melhorar a estabilidade do treinamento.
Adversarial Diffusion Distillation (ADD) (veja o relatório técnico), que permite amostragem em 4 passos com alta qualidade de imagem.
Codificadores de Texto：
- CLIPs: OpenCLIP-ViT/G, CLIP-ViT/L, comprimento do contexto 77 tokens
- T5: T5-xxl, comprimento do contexto 77/256 tokens em diferentes estágios de treinamento
Dados de Treinamento e Estratégia:
Este modelo foi treinado com uma ampla variedade de dados, incluindo dados sintéticos e dados públicos filtrados.

Para mais detalhes técnicos da arquitetura original MMDiT, consulte o artigo de pesquisa.

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

Pikuson | Shiiro's Styles - v1.0

Dragonhead - v1.0

Usar este modelo