modelos/ThinkDiffusionXL - v1.0

ThinkDiffusionXL - v1.0

João Silva

5/26/2025

11:08:32 AM

| Discussion|

Palavras-chave e Tags Relacionadas

modelo base,checkpoint,sdxl 1.0

Retrato de um homem idoso com rugas profundas e barba branca usando um chapéu bege e camisa amarela, capturado com luz forte de verão com fundo de parque verde desfocado.

Imagem gerada por IA altamente detalhada usando stable diffusion de uma criatura demoníaca com características esqueléticas e armadura intricada e espinhosa. Atmosfera escura e assustadora.

Um ceifador sombrio em uma floresta escura com uma atmosfera nebulosa e assustadora, criado usando stable diffusion.

Uma imagem dramática gerada por AI usando Stable Diffusion de um ceifador sombrio com rosto esquelético, vestindo vestes esfarrapadas, em pé sobre uma rocha com os braços abertos enquanto relâmpagos atingem. O fundo apresenta um céu escuro e tempestuoso e uma paisagem acidentada.

Uma vista de perfil de uma mulher com uma tatuagem intrincada no pescoço e ombro, e um penteado elegante com coque duplo, imagem gerada por AI usando stable diffusion.

Dragão etéreo com asas translúcidas em um palácio em ruínas, céu nublado ao fundo, imagem gerada por AI usando Stable Diffusion.

Parâmetros Recomendados

samplers

DPM++ 2M Karras

steps

cfg

4 - 8

Dicas

Considere usar o TDXL para projetos que exijam alto nível de detalhe e qualidade, pois ele se destaca nessas áreas.

O modelo oferece flexibilidade para gerar imagens sem viés inerente, adequado para qualquer estilo ou assunto.

Patrocinadores do Criador

Você pode encontrá-lo pré-carregado no ThinkDiffusion.

ThinkDiffusionXL (TDXL)

ThinkDiffusionXL é o resultado do nosso objetivo de construir um modelo de referência capaz de um fotorrealismo impressionante, que também seja versátil o suficiente para gerar imagens de alta qualidade em uma variedade de estilos e assuntos, sem precisar ser um gênio em prompts.

Você pode encontrá-lo pré-carregado no ThinkDiffusion.

O trabalho

Fonte de dados: TDXL foi treinado com mais de 10.000 imagens diversas que abrangem fotorrealismo, arte digital, anime e mais. A menor resolução do nosso conjunto de dados é 1365x2048, mas muitas imagens chegam a resoluções tão altas quanto 4622x6753. No total, nosso conjunto de dados ocupa 42GB.
Treinamento: Com 1,8 milhões de passos, colocamos o trabalho necessário. Para comparação, Juggernaut tem 600 mil passos e RealVisXL tem 348 mil passos.
Imagens legendadas manualmente: Cada imagem é cuidadosamente legendada à mão, aprimorando a capacidade do modelo de gerar resultados precisos e de alta qualidade a partir de prompts mínimos.
Capacidades NSFW: O modelo inclui mais de 1.000 imagens NSFW selecionadas com bom gosto.

Nossas considerações

Detalhe e qualidade: A maioria dos modelos XL na categoria Realista sofre com detalhes pobres, especialmente no fundo e até em características básicas como olhos, dentes e pele. Acreditamos que o TDXL supera nessas áreas devido ao seu grande conjunto de dados de alta qualidade. Para comparação, Juggernaut tem cerca de metade do material de imagens, e RealVisXL tem apenas 1.700 imagens. Em última análise, o TDXL simplesmente possui muito mais "conhecimento".
Menos viés: Garantimos o uso de um número igual de imagens para cada estilo, gênero, etc. Outros modelos que testamos nos últimos meses apresentaram algum tipo de viés, às vezes viés para retratos, viés de gênero, certas etnias, etc. Por exemplo, Juggernaut tem viés na área de Close-Up, e a Luz Cinematográfica é bastante dominante nesse modelo. RealVisXL também tem viés para retratos. Por outro lado, o TDXL oferece o que você quer: Paisagem, Plano Médio, Corpo Inteiro, Close-Up, Retrato, Vista Lateral, Vista Posterior, Ações, Cinemático... o que você quiser sem ser sempre direcionado por um viés.
Base versátil: Devido ao seu grande conjunto de dados equilibrado e de qualidade, o TDXL é versátil para servir como modelo base para treinamentos futuros. Você pode criar novos finetunes em direções totalmente diferentes, adicionar LoRAs para preencher conceitos faltantes, ou fazer treinamentos adicionais com dados de qualidade equilibrada.

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

ThisIsReal - v5.0

MooMooFusion - v4.0 Feminina

Usar este modelo