modelos/Projeto UltraRealistic Lora - Flux - v2

Projeto UltraRealistic Lora - Flux - v2

João Silva

10/8/2025

1:02:06 AM

| Discussion|

Palavras-chave e Tags Relacionadas

Selfie em close-up de uma mulher búlgara sorridente com pele natural radiante sob luz suave da janela, usando brincos de prata e uma blusa sem mangas de gola alta em um sótão minimalista.

Figura robótica metálica branca polida com juntas servo visíveis e placas geométricas, apresentando um halo cristalino fragmentado acima da cabeça, fumaça preta girando nas cavidades oculares, e uma fechadura circular revelando engrenagens intricadas no rosto contra um fundo de gradiente de índigo a ultravioleta.

Uma mulher em traje amarelo de risco biológico está em uma paisagem rochosa e árida olhando para uma esfera amarela orgânica colossal com estruturas fundidas semelhantes a ovos e veias sob um céu nublado.

Parâmetros Recomendados

samplers

dpmpp_2m, DPM++ 2M

steps

cfg

Dicas

Para ComfyUI com o modelo Flux: CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength entre 0.8 e 1.0 (normalmente 1.0; reduza para 0.87 se a qualidade das mãos piorar).

Para ComfyUI com o modelo SD3.5: CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength entre 0.5 e 1.0 (normalmente 0.7).

Considere expandir o dataset com poses mais variadas para aprimorar a precisão anatômica em futuras atualizações.

Patrocinadores do Criador

Se quiser apoiar o trabalho e as futuras atualizações do modelo Flux, visite e doe em https://ko-fi.com/danrisi.

O principal objetivo foi criar imagens mais 'vivas' com emoções mais intensas, poses mais dinâmicas e qualidade levemente amadora (também pode produzir imagens de alta qualidade).

P.S: Obrigado a todos pelo feedback! Notei os comentários (não só aqui) sobre problemas de anatomia e tenho coletado relatos e exemplos de todos vocês. Estou considerando algumas opções para resolver isso:

Treinar um checkpoint completo, que pode ser a abordagem mais racional para melhorias consistentes.
Expandir o conjunto de dados com mais fotos que cubram poses variadas para ajudar a aprimorar a precisão anatômica.

Agradeço a contribuição - isso realmente ajuda a moldar as atualizações futuras.

P.S.2: Mudei o treinamento para RunPod para resultados consistentes e de alta qualidade. Se quiser apoiar meu trabalho e futuras atualizações, pode me encontrar no Ko-fi. Porque planejo ajustar um modelo completo, não apenas um LoRa. https://ko-fi.com/danrisi

Configurações que uso no ComfyUI para Flux:
CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength= de 0.8 a 1.0 funciona bem, mas geralmente uso 1, salvo quando as mãos pioram, aí ajusto para 0.87

Configurações que uso no ComfyUI para SD3.5:
CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength= de 0.5 a 1.0 funciona bem, mas geralmente uso 0.7

V2 - Flux

Traz ainda mais realismo e versatilidade às suas criações, com melhorias significativas em estabilidade, anatomia e qualidade geral. Esta atualização torna o LoRA mais adaptável, permitindo alcançar vários níveis de qualidade baseados nos seus prompts—desde realismo em alta definição até estética intencionalmente de menor qualidade.

Treinado com 1048 imagens.

Novidades:

Melhorias na Estabilidade: A nova versão é mais estável e funciona melhor com prompts baseados em texto, oferecendo uma saída mais suave e previsível.

Mãos e Anatomia Aprimoradas: Mãos e anatomia corporal mais refinadas, aumentando a qualidade realista.

Flexibilidade de Qualidade: Com os prompts certos, você pode ajustar para estética de alta ou menor qualidade (exemplos disponíveis).

V1.2 para SD3.5 - Large

Decidi fazer uma versão para SD3.5 com configurações quase iguais. Na minha opinião ficou boa, mas notei alguns problemas de anatomia (em alguns momentos até piores que no Flux), porém a estética (cores, contraste e outros) está ainda melhor que no Flux. Vejo que SD3.5 tem potencial, talvez novas versões também sejam para SD3.5.

V1.2

Substituí metade das imagens do dataset, mudei o estilo de prompting, melhorei as mãos, reduzi os efeitos de 'flashlight' em cenas noturnas e melhorei a qualidade geral do LoRa (espero).
Nesta versão não é necessário usar muitas 'palavras gatilho' como na V1. Apenas adicione algumas delas que mencionei nas palavras gatilho.

Treinei outro LoRa amador (algo já bastante feito por aqui).

Ainda assim, peguei algumas imagens do meu dataset dos anos 2000 e acrescentei outras 700 imagens. O resultado até agora está bem bom, mas há um ponto controverso sobre otimização de qualidade. Eu esperava que ajudasse a controlar a qualidade, mas pelo que vejo isso só confundiu o modelo. No dataset há diversas graduações de qualidade, como:

1) Foto em alta resolução, tirada com celular, sem artefatos visíveis, clara e nítida

2) Foto amadora em baixa resolução tirada com câmera digital, sem artefatos jpeg visíveis, levemente ruidosa

3) Foto em resolução média, tirada com celular, leve granulação devido a condições de pouca luz, sem artefatos digitais significativos

E outras combinações e variações. Acho que vou remover esse tipo na próxima versão. Mas esta está funcionando melhor para mim:

Foto amadora em baixa resolução tirada com câmera digital, sem artefatos jpeg visíveis, levemente ruidosa

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

Frieren フリーレン - 葬送のフリーレン - v2.0-alpha [FLUX]

Crimson Acryllic FLUX - V1

Usar este modelo