modelos/Stable Diffusion 3.5 Large - Large

Stable Diffusion 3.5 Large - Large

7/2/2025

1:26:43 PM

Palavras-chave e Tags Relacionadas

modelo base,checkpoint,grande,transformador de difusão multimodal,normalização qk,sd 3.5 large,sd3.5,stability ai,stable diffusion,stable diffusion 3.5,stable diffusion 3.5 large,modelo generativo de texto para imagem,theally

Uma bailarina punk com botas desgastadas e tutu rasgado, capturada em pose no meio de um fundo de nebulosa vermelho-carmesim e dourada em turbilhão, renderizada com pinceladas impasto e detalhes pontilhistas.

Um rosto abstrato emergindo de um vórtice giratório de preto meia-noite, retratado com rabiscos caóticos e linhas minimalistas iluminadas por uma luz branca suave e cintilante.

Uma ilustração digital pontilhista que retrata uma menina com um vestido branco esvoaçante sentada ao lado de um gato preto em uma colina, contra um pôr do sol monocromático com um padrão texturizado de pontos semelhantes a estrelas.

Pernas vestindo meias-calças pretas com saltos agulha vermelhos vibrantes com tiras no tornozelo, em um fundo abstrato dinâmico com texturas de folha de ouro e pinceladas.

Uma mulher solitária está em um campo iluminada pela luz da hora dourada durante um pôr do sol dramático, cercada por gramíneas que balançam e montanhas recortadas distantes em um estilo etéreo e expressionista abstrato.

Uma alta torre esquelética feita de metal corroído está sozinha sobre um chão plano e rachado. A cena possui um estilo minimalista e impressionista com luz branca suave destacando as formas lineares da torre contra um fundo escuro.

Silhueta monocromática de um flâneur parisiense com chapéu e bengala em rua de paralelepípedos, emoldurada pela arquitetura Haussmann minimalista e uma árvore.

Ilustração digital minimalista de uma mulher loira solitária com cabelo liso e reto sentada em uma cadeira contra um fundo azul profundo, segurando uma vibrante xícara de café fúcsia.

Um casal andando próximo sob um guarda-chuva escuro durante uma tempestade ao pôr do sol, com gotas de chuva em uma janela molhada e um fundo texturizado desfocado.

Representação artística abstrata de folhas de gingko girando em cores vívidas de outono como carmesim, dourado e ocre em papel washi texturizado.

Um robô pequeno e delicado com bordas suaves está em uma cena enevoada cheia de flores de cerejeira rosa suave, evocando o estilo de uma gravura japonesa tradicional.

Uma guerreira feminina solitária com pele lavanda pálida, vestindo armadura futurista, pintada com pinceladas ousadas de aquarela em preto, branco e vermelho em um fundo lavanda minimalista.

Prompts Recomendados

a detailed illustration of a cute rainbow colorful boba tea sitting in a window sill, tiki bar looking out onto a tropical oceanfront background, shallow depth of field, cinematic lighting, dappled sunlight, lens flare bokeh

Parâmetros Recomendados

samplers

DPM++ 2M

steps

cfg

4.5

Patrocinadores do Criador

Confira nosso Guia Rápido para Stable Diffusion 3.5 para todas as informações mais recentes!

Stable Diffusion 3.5 Large é um modelo texto-para-imagem Multimodal Diffusion Transformer (MMDiT) que apresenta desempenho aprimorado na qualidade da imagem, tipografia, compreensão de prompts complexos e eficiência de recursos.

Por favor, note: Este modelo é lançado sob a Licença Comunitária Stability. Visite Stability AI para aprender mais ou contate-nos para detalhes sobre licenciamento comercial.

Descrição do Modelo

Desenvolvido por: Stability AI
Tipo de modelo: modelo generativo texto-para-imagem MMDiT
Descrição do Modelo: Este modelo gera imagens com base em prompts de texto. É um Multimodal Diffusion Transformer que usa três codificadores de texto fixos e pré-treinados, com QK-normalization para melhorar a estabilidade do treinamento.

Licença

Licença Comunitária: Gratuita para pesquisa, uso não comercial e comercial para organizações ou indivíduos com receita anual total inferior a $1M. Mais detalhes podem ser encontrados no Acordo de Licença Comunitária. Leia mais em https://stability.ai/license.
Para indivíduos e organizações com receita anual superior a $1M: por favor contate-nos para obter uma Licença Empresarial.

Detalhes da Implementação

QK Normalization: Implementa a técnica de normalização QK para melhorar a estabilidade do treinamento.
Codificadores de Texto：
- CLIPs: OpenCLIP-ViT/G, CLIP-ViT/L, comprimento do contexto 77 tokens
- T5: T5-xxl, comprimento do contexto 77/256 tokens em diferentes estágios do treinamento
Dados e Estratégia de Treinamento:
Este modelo foi treinado com uma grande variedade de dados, incluindo dados sintéticos e dados públicos filtrados.

Para mais detalhes técnicos da arquitetura original MMDiT, por favor veja o artigo de pesquisa.

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

Estilo Anime Cyberpunk - Flux.1 D v1

ZavyChromaXL - v10.0

Usar este modelo