Perfil lateral de uma mulher bela abstrata com maquiagem delicada e ornamentos tradicionais no cabelo, contra um cenário noturno de cidade com montanhas e uma grande lua.
Ilustração abstrata de uma mulher com cabelo ruivo marcante e sardas, vestindo roupas escuras, contra um céu noturno detalhado com estrelas e padrões celestiais.

Parâmetros Recomendados

steps

4 - null

Patrocinadores do Criador

Por favor, consulte nosso Guia Rápido para Stable Diffusion 3.5 para todas as informações mais recentes!

Por favor, consulte nosso Guia Rápido para Stable Diffusion 3.5 para todas as informações mais recentes!

Stable Diffusion 3.5 Large Turbo é um modelo Multimodal Diffusion Transformer (MMDiT) texto para imagem com Adversarial Diffusion Distillation (ADD) que apresenta desempenho aprimorado em qualidade de imagem, tipografia, compreensão de prompts complexos e eficiência de recursos, com foco em menos etapas de inferência.

Por favor, note: Este modelo é lançado sob a Licença Comunitária Stability. Visite Stability AI para aprender ou contate-nos para detalhes sobre licenciamento comercial.

Descrição do Modelo

  • Desenvolvido por: Stability AI

  • Tipo de modelo: modelo generativo MMDiT texto para imagem

  • Descrição do Modelo: Este modelo gera imagens com base em prompts de texto. É um ADD-distilled Multimodal Diffusion Transformer que usa três codificadores de texto fixos e pré-treinados, com normalização QK.

Licença

  • Licença Comunitária: Gratuita para pesquisa, uso não comercial e comercial para organizações ou indivíduos com receita anual total inferior a $1M. Mais detalhes podem ser encontrados no Acordo de Licença Comunitária. Leia mais em https://stability.ai/license.

  • Para indivíduos e organizações com receita anual acima de $1M: Por favor, contate-nos para obter uma Licença Empresarial.

Fontes do Modelo

Para uso local ou auto-hospedado, recomendamos ComfyUI para inferência com interface baseada em nós, ou diffusers ou GitHub para uso programático.

Detalhes da Implementação

  • QK Normalization: Implementa a técnica de normalização QK para melhorar a estabilidade do treinamento.

  • Adversarial Diffusion Distillation (ADD) (veja o relatório técnico), que permite amostragem em 4 passos com alta qualidade de imagem.

  • Codificadores de Texto:

    • CLIPs: OpenCLIP-ViT/G, CLIP-ViT/L, comprimento do contexto 77 tokens

    • T5: T5-xxl, comprimento do contexto 77/256 tokens em diferentes estágios de treinamento

  • Dados de Treinamento e Estratégia:

    Este modelo foi treinado com uma ampla variedade de dados, incluindo dados sintéticos e dados públicos filtrados.

Para mais detalhes técnicos da arquitetura original MMDiT, consulte o artigo de pesquisa.

Anterior
Pikuson | Shiiro's Styles - v1.0
Próximo
Dragonhead - v1.0

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

SD 3.5 Large Turbo

Versão do modelo

Large Turbo

Hash do modelo

fb64610bf8

Criador

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por Stable Diffusion 3.5 Large Turbo - Large Turbo

Perfil lateral de uma mulher bela abstrata com maquiagem delicada e ornamentos tradicionais no cabelo, contra um cenário noturno de cidade com montanhas e uma grande lua.
Ilustração abstrata de uma mulher com cabelo ruivo marcante e sardas, vestindo roupas escuras, contra um céu noturno detalhado com estrelas e padrões celestiais.

Imagens com modelo base

Cena fotorrealista de personagens mortos-vivos incluindo zumbis e esqueletos caminhando por um cemitério assustador iluminado por lanternas de abóbora brilhantes sob um céu escuro e ameaçador.

Imagens com stability ai

Menina loira em estilo anime vestindo um vestido branco de verão e um grande chapéu de sol com decoração de girassol, felizmente posicionada em um campo de girassóis ao pôr do sol com os braços levantados.
Personagem Ffixgarnet com cabelo longo preto e olhos castanhos, vestindo um body laranja com amarração cruzada, mangas bufantes brancas e luvas vermelhas, subindo uma escada de corda de madeira contra fundo de céu azul, corada e olhando para trás
Personagem de anime com cabelo rosa-choque e asas ígneas agachada em uma pose dinâmica contra um fundo roxo de fantasia sombria com rochas afiadas e irregulares.
Vista em close-up de múltiplas esferas texturizadas pretas flutuando contra um fundo cósmico escuro com luzes coloridas e sonhadoras de bokeh.
Close-up de um ciborgue com capacete preto fosco sem rosto, cabelo preto longo e armadura vermelha e preta intrincada brilhando levemente em vermelho em um ambiente de clima sombrio.
Guerreira empregada com twintails verdes empunhando uma arma de haste com serra circular em uma fábrica de robôs mal iluminada com peças mecânicas e cabos, respingos de sangue no chão.