PixelWave - FLUX.1-schnell 04
Palavras-chave e Tags Relacionadas
Parâmetros Recomendados
samplers
steps
cfg
resolution
vae
Parâmetros Recomendados para Alta Resolução
upscale
Dicas
Use mais de 8 passos para melhorar detalhes finos, mas a saída não muda muito após 8 passos.
Adicionar prompts de estilo pode ajudar o modelo a gerar saída mais organizada e limpa.
Tente aumentar a escala de orientação para obter imagens mais limpas.
Evite usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição se quiser um visual natural na fotografia.
Para upscaling, tente upscale latent por nó e escale latent por 1.5 para imagens de maior resolução.
Use o otimizador pagedlion8bit para treinar em GPU 24GB, congelando os parâmetros time_in, vector_in e modulation para evitar a desdestilação.
Pare o treinamento após alguns milhares de passos com LR 5e-6 para evitar blocos corrompidos e faça block merge com checkpoints anteriores para corrigir a corrupção.
Destaques da Versão
Ajuste fino do modelo schnell, não usando o modelo dev de forma alguma. Licença Apache 2.0!
Treinado com kohya usando um cronograma personalizado sigma e congelando os parâmetros de tempo e modulação para evitar degradação da destilação temporal.
➤ Passos combinados de treinamento : 1.360.641
➤ Tempo ativo de treinamento: 1192,61 horas (49,7 dias)
Patrocinadores do Criador
Modelo também disponível em: RunDiffusion e Runware.ai
Um enorme obrigado à RunDiffusion por patrocinar o poder computacional para treinar este modelo!
Para acesso via API, confira Runware.ai.
PixelWave FLUX.1-schnell 04 - Apache 2.0!
Arquivos Safetensor: 💾BF16 💾FP8 💾bnb FP4
Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
Links para 🤗VAE 🤗T5xxl 🤗CLIP L
Modelo também disponível em: RunDiffusion e Runware.ai
A versão 04 do PixelWave FLUX.1 schnell é um ajuste estético do FLUX.1-schnell. As imagens usadas no treinamento foram seleções manuais para garantir que o modelo tenha uma inclinação para imagens impactantes, com cores, texturas e iluminação belas.
Treinado no modelo schnell original, portanto licença Apache 2.0!
Sem requisitos especiais para rodar. Suporta FLUX LoRAs
Euler Normal, 8 passos.
Você pode usar mais passos para melhorar detalhes mais finos, mas a saída não muda muito após 8 passos.
Agradecimento à RunDiffusion
Um enorme obrigado à RunDiffusion (co-criadores do Juggernaut) por patrocinar o poder computacional que tornou possível o treinamento deste modelo! Descobrir como treinar schnell sem desdestilar o modelo exigiu muitos testes, e poder usar a nuvem da RunDiffusion facilitou muito.
Para quem precisa de acesso via API para este modelo, estamos fazendo parceria com Runware.ai
Eu deixei a versão FLUX.1-dev 04 exclusiva para RunDiffusion e Runware por enquanto. Quando eu lançar a versão 05 no futuro, planejo disponibilizar pesos abertos da dev 04.
Agradeço o suporte para lançar esse modelo, por favor confira eles!
Treinamento
O treinamento foi feito com kohya_ss/sd-scripts. Você pode encontrar meu fork do Kohya aqui, que também contém alterações no submódulo sd-scripts, certifique-se de clonar ambos.
Use a aba fine tuning. Encontrei os melhores resultados com o otimizador pagedlion8bit, que também podia rodar na minha GPU 4090 de 24GB. Outros otimizadores tiveram dificuldade para aprender.
Congelei os parâmetros time_in, vector_in e mod/modulation. Isso evita a 'desdestilação'.
Evito treinar blocos individuais acima do 15. Você pode definir quais blocos treinar na seção FLUX.
LR 5e-6 treina rápido, mas você precisa parar após alguns milhares de passos porque começa a corromper blocos e a retardar o aprendizado.
Você pode depois fazer block merge com um checkpoint anterior, substituindo os blocos corrompidos, e continuar o treinamento.
Sinais de blocos corrompidos: textura de papel sobre a maioria das imagens, perda de detalhes no fundo.
Contato
Para assuntos comerciais ou de negócios, entre em contato conosco pelo e-mail pixelwave@rundiffusion.com. Licenciamento de ajustes flux. Projetos de treinamento customizado. Desenvolvimento comercial de IA. A equipe pode fazer tudo!
PixelWave Flux.1-dev 03 ajustado!
Arquivos Safetensor: 💾BF16 💾FP8 💾NF4
Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
Links para 🤗VAE 🤗T5xxl 🤗CLIP L
Os arquivos 'diffusers' são na verdade as versões GGUF Q8_0 e Q4_K_M. Arquivos GGUF também disponíveis no huggingface.
Refinei a versão 03 da base FLUX.1-dev por mais de 5 semanas na minha 4090. É capaz de fazer estilos diferentes de arte, fotografia e anime. Truque que descobri para ajudar com LoRAs.
Usei dpmpp 2m sgm uniform 30 passos para as imagens de apresentação. Se quiser um resultado mais limpo, tente aumentar a orientação. Mencionar um estilo também ajuda, assim o modelo não precisa adivinhar.
Também recomendo tentar adicionar o upscale latent por nó, e escalar o latent por 1.5, por exemplo gerando uma imagem 1536x1536 em vez de 1024x1024.
PixelWave Flux.1-schnell 03
Arquivos Safetensor: 💾FP8 💾NF4
Arquivos GGUF: vá para o huggingface
Usei dpmpp 2m sgm uniform 8 passos para as imagens de apresentação.
Você pode começar com 4 passos, mas há menos erros na anatomia se usar mais passos.
PixelWave Flux.1-dev 02
Arquivos Safetensor: 💾BF16 💾FP8
Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
A versão 02 melhorou muito imagens pretas e escuras e tem resultados mais confiáveis com menos problemas com mãos.
Recomendo usar dpmpp_2s_ancestral, beta, 14 passos. Ou euler, simples, 20 passos.
PixelWave 11 SDXL. Um modelo ajustado para uso geral. Ótimo para estilos de arte e fotografia.
Uso 20 passos, DPM++ SDE, CFG 4 a 6 ou 40 passos, 2M SDE Karras
Versão Acelerada - 5+ Passos, DPM++ SDE Karras, 2.5 CFG
PAG Recomendado⚡Recomendo escala 1.5, com CFG 3. Link para o workflow
🔗Link para Galeria Expandida 🖼️
⭐Guia de prompts.⭐ Você não precisa usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição, alta qualidade, etc. A menos que queira, recomendo não usar palavras como 'vibrante, intenso, brilhante, alto contraste, neon, dramático' para estilos fotográficos se desejar um aspecto mais natural. Isso pode fazer as imagens parecerem 'cozidas demais', mas é apenas o CLIP seguindo seu prompt. 🙂 Se quiser fotos vibrantes e neon, o PixelWave oferece!
O foco da versão 10 foi treinar os modelos CLIP, o que melhora a confiabilidade, garante que você possa produzir uma ampla variedade de estilos e melhora o seguimento dos prompts.
Obrigado aos meus amigos que ajudaram nos testes: masslevel, blink, socalguitarist, klinter, wizard whitebeard.
Guia: Ampliando Prompts com LM Studio e Mikey Nodes
Guia: Adicione mais detalhes à sua imagem usando o método skip step
Não é necessário o modelo refiner.
Este modelo não é uma mistura de outros modelos.
Eu também criei Mikey Nodes que contém muitos nós úteis. Você pode instalar via comfy manager.
Detalhes do Modelo
Tipo de modelo
Modelo base
Versão do modelo
Hash do modelo
Criador
Discussão
Por favor, faça log in para deixar um comentário.





