Projeto UltraRealistic Lora - Flux - v2
Palavras-chave e Tags Relacionadas
Parâmetros Recomendados
samplers
steps
cfg
Dicas
Para ComfyUI com o modelo Flux: CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength entre 0.8 e 1.0 (normalmente 1.0; reduza para 0.87 se a qualidade das mãos piorar).
Para ComfyUI com o modelo SD3.5: CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength entre 0.5 e 1.0 (normalmente 0.7).
Considere expandir o dataset com poses mais variadas para aprimorar a precisão anatômica em futuras atualizações.
Patrocinadores do Criador
Se quiser apoiar o trabalho e as futuras atualizações do modelo Flux, visite e doe em https://ko-fi.com/danrisi.
O principal objetivo foi criar imagens mais 'vivas' com emoções mais intensas, poses mais dinâmicas e qualidade levemente amadora (também pode produzir imagens de alta qualidade).
P.S: Obrigado a todos pelo feedback! Notei os comentários (não só aqui) sobre problemas de anatomia e tenho coletado relatos e exemplos de todos vocês. Estou considerando algumas opções para resolver isso:
Treinar um checkpoint completo, que pode ser a abordagem mais racional para melhorias consistentes.
Expandir o conjunto de dados com mais fotos que cubram poses variadas para ajudar a aprimorar a precisão anatômica.
Agradeço a contribuição - isso realmente ajuda a moldar as atualizações futuras.
P.S.2: Mudei o treinamento para RunPod para resultados consistentes e de alta qualidade. Se quiser apoiar meu trabalho e futuras atualizações, pode me encontrar no Ko-fi. Porque planejo ajustar um modelo completo, não apenas um LoRa. https://ko-fi.com/danrisi
Configurações que uso no ComfyUI para Flux:
CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength= de 0.8 a 1.0 funciona bem, mas geralmente uso 1, salvo quando as mãos pioram, aí ajusto para 0.87
Configurações que uso no ComfyUI para SD3.5:
CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength= de 0.5 a 1.0 funciona bem, mas geralmente uso 0.7
V2 - Flux
Traz ainda mais realismo e versatilidade às suas criações, com melhorias significativas em estabilidade, anatomia e qualidade geral. Esta atualização torna o LoRA mais adaptável, permitindo alcançar vários níveis de qualidade baseados nos seus prompts—desde realismo em alta definição até estética intencionalmente de menor qualidade.
Treinado com 1048 imagens.
Novidades:
Melhorias na Estabilidade: A nova versão é mais estável e funciona melhor com prompts baseados em texto, oferecendo uma saída mais suave e previsível.
Mãos e Anatomia Aprimoradas: Mãos e anatomia corporal mais refinadas, aumentando a qualidade realista.
Flexibilidade de Qualidade: Com os prompts certos, você pode ajustar para estética de alta ou menor qualidade (exemplos disponíveis).
V1.2 para SD3.5 - Large
Decidi fazer uma versão para SD3.5 com configurações quase iguais. Na minha opinião ficou boa, mas notei alguns problemas de anatomia (em alguns momentos até piores que no Flux), porém a estética (cores, contraste e outros) está ainda melhor que no Flux. Vejo que SD3.5 tem potencial, talvez novas versões também sejam para SD3.5.
V1.2
Substituí metade das imagens do dataset, mudei o estilo de prompting, melhorei as mãos, reduzi os efeitos de 'flashlight' em cenas noturnas e melhorei a qualidade geral do LoRa (espero).
Nesta versão não é necessário usar muitas 'palavras gatilho' como na V1. Apenas adicione algumas delas que mencionei nas palavras gatilho.
V1
Treinei outro LoRa amador (algo já bastante feito por aqui).
Ainda assim, peguei algumas imagens do meu dataset dos anos 2000 e acrescentei outras 700 imagens. O resultado até agora está bem bom, mas há um ponto controverso sobre otimização de qualidade. Eu esperava que ajudasse a controlar a qualidade, mas pelo que vejo isso só confundiu o modelo. No dataset há diversas graduações de qualidade, como:
1) Foto em alta resolução, tirada com celular, sem artefatos visíveis, clara e nítida
2) Foto amadora em baixa resolução tirada com câmera digital, sem artefatos jpeg visíveis, levemente ruidosa
3) Foto em resolução média, tirada com celular, leve granulação devido a condições de pouca luz, sem artefatos digitais significativos
E outras combinações e variações. Acho que vou remover esse tipo na próxima versão. Mas esta está funcionando melhor para mim:
Foto amadora em baixa resolução tirada com câmera digital, sem artefatos jpeg visíveis, levemente ruidosa
Detalhes do Modelo
Tipo de modelo
Modelo base
Versão do modelo
Hash do modelo
Palavras treinadas
Criador
Discussão
Por favor, faça log in para deixar um comentário.






