Stable Diffusion 3.5 Large - Large
Prompts Recomendados
a detailed illustration of a cute rainbow colorful boba tea sitting in a window sill, tiki bar looking out onto a tropical oceanfront background, shallow depth of field, cinematic lighting, dappled sunlight, lens flare bokeh
Parâmetros Recomendados
samplers
steps
cfg
Patrocinadores do Criador
Confira nosso Guia Rápido para Stable Diffusion 3.5 para todas as informações mais recentes!
Confira nosso Guia Rápido para Stable Diffusion 3.5 para todas as informações mais recentes!
Stable Diffusion 3.5 Large é um modelo texto-para-imagem Multimodal Diffusion Transformer (MMDiT) que apresenta desempenho aprimorado na qualidade da imagem, tipografia, compreensão de prompts complexos e eficiência de recursos.
Por favor, note: Este modelo é lançado sob a Licença Comunitária Stability. Visite Stability AI para aprender mais ou contate-nos para detalhes sobre licenciamento comercial.
Descrição do Modelo
Desenvolvido por: Stability AI
Tipo de modelo: modelo generativo texto-para-imagem MMDiT
Descrição do Modelo: Este modelo gera imagens com base em prompts de texto. É um Multimodal Diffusion Transformer que usa três codificadores de texto fixos e pré-treinados, com QK-normalization para melhorar a estabilidade do treinamento.
Licença
Licença Comunitária: Gratuita para pesquisa, uso não comercial e comercial para organizações ou indivíduos com receita anual total inferior a $1M. Mais detalhes podem ser encontrados no Acordo de Licença Comunitária. Leia mais em https://stability.ai/license.
Para indivíduos e organizações com receita anual superior a $1M: por favor contate-nos para obter uma Licença Empresarial.
Detalhes da Implementação
QK Normalization: Implementa a técnica de normalização QK para melhorar a estabilidade do treinamento.
Codificadores de Texto:
CLIPs: OpenCLIP-ViT/G, CLIP-ViT/L, comprimento do contexto 77 tokens
T5: T5-xxl, comprimento do contexto 77/256 tokens em diferentes estágios do treinamento
Dados e Estratégia de Treinamento:
Este modelo foi treinado com uma grande variedade de dados, incluindo dados sintéticos e dados públicos filtrados.
Para mais detalhes técnicos da arquitetura original MMDiT, por favor veja o artigo de pesquisa.
Detalhes do Modelo
Tipo de modelo
Modelo base
Versão do modelo
Hash do modelo
Criador
Discussão
Por favor, faça log in para deixar um comentário.









