PixelWave - FLUX.1-dev 03
Palavras-chave e Tags Relacionadas
Parâmetros Recomendados
samplers
steps
cfg
resolution
vae
Parâmetros Recomendados para Alta Resolução
upscale
Dicas
Você pode usar mais passos para melhorar os detalhes finos, mas a saída não muda muito após 8 passos.
Se quiser uma saída mais limpa/organizada, tente aumentar a escala de orientação (CFG).
Mencionar um estilo no prompt pode ajudar o modelo a gerar melhores resultados.
Tente adicionar upscale latent por nó, e escalar o latent por 1.5 para gerar imagens em resolução maior.
Evite usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição, alta qualidade a menos que necessário; pode fazer as imagens parecerem exageradas.
Para estilos fotográficos, evite termos como 'vibrante, intenso, brilhante, alto contraste, neon, dramático' se desejar um visual natural.
Treinamento foi feito com kohya_ss/sd-scripts usando otimizador pagedlion8bit.
Congelar os parâmetros 'time_in', 'vector_in' e modulação impede a 'desdestilação'.
Evite treinar blocos isolados acima de 15; defina os blocos de treinamento na seção FLUX.
Taxa de aprendizado 5e-6 treina rápido mas pare após alguns milhares de passos para evitar corrupção de blocos.
Destaques da Versão
Ajustado por 5 semanas na minha 4090.
Patrocinadores do Criador
Modelo também disponível em: RunDiffusion e Runware.ai
Um enorme obrigado ao RunDiffusion por patrocinar o poder computacional que tornou possível o treinamento deste modelo!
Para acesso API, faça parceria com Runware.ai
PixelWave FLUX.1-schnell 04 - Apache 2.0!
Arquivos Safetensor: 💾BF16 💾FP8 💾bnb FP4
Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
Links para 🤗VAE 🤗T5xxl 🤗CLIP L
Modelo também disponível em: RunDiffusion e Runware.ai
PixelWave FLUX.1 schnell versão 04 é um ajuste estético do FLUX.1-schnell. As imagens de treino foram escolhidas manualmente para garantir que o modelo tenha uma tendência para imagens chamativas, com cores, texturas e iluminação bonitas.
Treinado no modelo schnell original, portanto licença Apache 2.0!
Sem requisitos especiais para rodar. Suporta FLUX LoRAs
Euler Normal, 8 passos.
Você pode usar mais passos para melhorar os detalhes finos, mas a saída não muda muito após 8 passos.
Agradecimentos ao RunDiffusion
Um enorme obrigado ao RunDiffusion (co-criadores do Juggernaut) por patrocinar o poder computacional que tornou possível o treinamento deste modelo! Descobrir como treinar o schnell sem desdestilar o modelo exigiu muitos experimentos, e poder utilizar a computação em nuvem do RunDiffusion facilitou muito.
Para quem precisa de acesso à API para este modelo, estamos fazendo parceria com Runware.ai
Fiz a versão FLUX.1-dev 04 exclusiva para RunDiffusion e Runware por enquanto. Quando eu lançar a versão 05 futuramente, planejo liberar os pesos abertos da dev 04.
Agradecido pelo suporte deles em divulgar este modelo, por favor confira-os!
Treinamento
O treinamento foi feito com kohya_ss/sd-scripts. Você pode encontrar meu fork do Kohya aqui, que também contém mudanças no submódulo sd-scripts, certifique-se de clonar ambos.
Use a aba de fine tuning. Eu encontrei os melhores resultados com o otimizador pagedlion8bit que também pode rodar na minha GPU 4090 de 24GB. Outros otimizadores tiveram dificuldade para aprender algo.
Congelei os parâmetros time_in, vector_in e mod/modulation. Isso impede a 'desdestilação'.
Evito treinar blocos isolados acima de 15. Você pode definir quais blocos treinar na seção FLUX.
LR 5e-6 treina rápido, mas é necessário parar após alguns milhares de passos, pois começam a corromper os blocos e desacelerar o aprendizado.
Então você pode fazer um merge de bloco com um checkpoint anterior, substituindo os blocos corrompidos, e continuar o treinamento.
Sinais de blocos corrompidos: textura de papel sobre a maioria das imagens, perda de detalhes do fundo.
Contato
Para negócios ou consultas comerciais, por favor entre em contato conosco em pixelwave@rundiffusion.com. Licenciamento de fine tunes Flux. Projetos de treinamento personalizados. Desenvolvimento comercial de IA. A equipe faz tudo!
PixelWave Flux.1-dev 03 ajustado!
Arquivos Safetensor: 💾BF16 💾FP8 💾NF4
Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
Links para 🤗VAE 🤗T5xxl 🤗CLIP L
Os arquivos 'diffusers' são na realidade as versões GGUF Q8_0 e Q4_K_M. Arquivos GGUF também disponíveis no huggingface.
Eu ajustei a versão 03 da base FLUX.1-dev por mais de 5 semanas na minha 4090. É capaz de fazer diferentes estilos artísticos, fotografia e anime. Truque que descobri para ajudar com LoRAs.
Usei dpmpp 2m sgm uniforme 30 passos para as imagens de demonstração. Se quiser uma saída mais limpa/organizada, experimente aumentar a orientação (guidance). Mencionar um estilo também ajuda, para que o modelo não precise adivinhar.
Recomendo também tentar adicionar upscaling latent por nó e escalar latent por 1,5, por exemplo, gerando uma imagem 1536x1536 em vez de 1024x1024.
PixelWave Flux.1-schnell 03
Arquivos Safetensor: 💾FP8 💾NF4
Arquivos GGUF: vá para huggingface
Usei dpmpp 2m sgm uniforme 8 passos para as imagens de demonstração.
Você pode começar com 4 passos, mas há menos erros na anatomia se usar mais passos.
PixelWave Flux.1-dev 02
Arquivos Safetensor: 💾BF16 💾FP8
Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
A versão 02 melhorou muito imagens pretas e escuras, e oferece resultados mais confiáveis com menos problemas nas mãos.
Recomendo usar dpmpp_2s_ancestral, beta, 14 passos. Ou euler, simple, 20 passos.
PixelWave 11 SDXL. Um modelo fine tuned para uso geral. Excelente para estilos de arte e fotografia.
Uso 20 passos, DPM++ SDE, CFG de 4 a 6 ou 40 passos, 2M SDE Karras
Versão acelerada - mais de 5 passos, DPM++ SDE Karras, CFG 2.5
PAG recomendado⚡Recomendo escala 1.5, com CFG 3. Link para workflow
🔗Link para galeria expandida 🖼️
⭐Guia de prompts⭐ Você não precisa usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição, alta qualidade, etc. A menos que queira, recomendo não usar palavras como 'vibrante, intenso, brilhante, alto contraste, neon, dramático' para estilos fotográficos se desejar uma aparência mais natural. Isso pode fazer com que as imagens pareçam 'cozidas demais', mas é apenas o CLIP seguindo seu prompt. 🙂 Se quiser fotos vibrantes e neon, PixelWave oferece!
O foco da versão 10 foi treinar os modelos CLIP, que melhoram a confiabilidade, garantem que você possa produzir uma ampla variedade de estilos, e melhor na interpretação de prompts.
Agradecimentos aos meus amigos que ajudaram a testar: masslevel, blink, socalguitarist, klinter, wizard whitebeard.
Guia: Upscaling de prompts com LM Studio e Mikey Nodes
Guia: Adicione mais detalhes à sua imagem usando o método skip step
Não é necessário o modelo refiner.
Este modelo não é uma mistura de outros modelos.
Também criei Mikey Nodes que contém vários nós úteis. Você pode instalá-lo através do comfy manager.
Detalhes do Modelo
Tipo de modelo
Modelo base
Versão do modelo
Hash do modelo
Criador
Discussão
Por favor, faça log in para deixar um comentário.





