ThinkDiffusionXL - v1.0
Palavras-chave e Tags Relacionadas
Parâmetros Recomendados
samplers
steps
cfg
Dicas
Considere usar o TDXL para projetos que exijam alto nível de detalhe e qualidade, pois ele se destaca nessas áreas.
O modelo oferece flexibilidade para gerar imagens sem viés inerente, adequado para qualquer estilo ou assunto.
Patrocinadores do Criador
Você pode encontrá-lo pré-carregado no ThinkDiffusion.
Leia mais sobre o modelo, clique aqui
Por favor, deixe uma avaliação se estiver satisfeito, isso nos incentivará a criar mais e aprimorá-lo.
ThinkDiffusionXL (TDXL)
ThinkDiffusionXL é o resultado do nosso objetivo de construir um modelo de referência capaz de um fotorrealismo impressionante, que também seja versátil o suficiente para gerar imagens de alta qualidade em uma variedade de estilos e assuntos, sem precisar ser um gênio em prompts.
Você pode encontrá-lo pré-carregado no ThinkDiffusion.
Leia mais sobre o modelo, clique aqui
Por favor, deixe uma avaliação se estiver satisfeito, isso nos incentivará a criar mais e aprimorá-lo.
O trabalho
Fonte de dados: TDXL foi treinado com mais de 10.000 imagens diversas que abrangem fotorrealismo, arte digital, anime e mais. A menor resolução do nosso conjunto de dados é 1365x2048, mas muitas imagens chegam a resoluções tão altas quanto 4622x6753. No total, nosso conjunto de dados ocupa 42GB.
Treinamento: Com 1,8 milhões de passos, colocamos o trabalho necessário. Para comparação, Juggernaut tem 600 mil passos e RealVisXL tem 348 mil passos.
Imagens legendadas manualmente: Cada imagem é cuidadosamente legendada à mão, aprimorando a capacidade do modelo de gerar resultados precisos e de alta qualidade a partir de prompts mínimos.
Capacidades NSFW: O modelo inclui mais de 1.000 imagens NSFW selecionadas com bom gosto.
Nossas considerações
Detalhe e qualidade: A maioria dos modelos XL na categoria Realista sofre com detalhes pobres, especialmente no fundo e até em características básicas como olhos, dentes e pele. Acreditamos que o TDXL supera nessas áreas devido ao seu grande conjunto de dados de alta qualidade. Para comparação, Juggernaut tem cerca de metade do material de imagens, e RealVisXL tem apenas 1.700 imagens. Em última análise, o TDXL simplesmente possui muito mais "conhecimento".
Menos viés: Garantimos o uso de um número igual de imagens para cada estilo, gênero, etc. Outros modelos que testamos nos últimos meses apresentaram algum tipo de viés, às vezes viés para retratos, viés de gênero, certas etnias, etc. Por exemplo, Juggernaut tem viés na área de Close-Up, e a Luz Cinematográfica é bastante dominante nesse modelo. RealVisXL também tem viés para retratos. Por outro lado, o TDXL oferece o que você quer: Paisagem, Plano Médio, Corpo Inteiro, Close-Up, Retrato, Vista Lateral, Vista Posterior, Ações, Cinemático... o que você quiser sem ser sempre direcionado por um viés.
Base versátil: Devido ao seu grande conjunto de dados equilibrado e de qualidade, o TDXL é versátil para servir como modelo base para treinamentos futuros. Você pode criar novos finetunes em direções totalmente diferentes, adicionar LoRAs para preencher conceitos faltantes, ou fazer treinamentos adicionais com dados de qualidade equilibrada.
Detalhes do Modelo
Tipo de modelo
Modelo base
Versão do modelo
Hash do modelo
Criador
Discussão
Por favor, faça log in para deixar um comentário.






