modelos/PixelWave - FLUX.1-schnell 04

PixelWave - FLUX.1-schnell 04

João Silva

12/27/2025

12:56:44 PM

| Discussion|

Palavras-chave e Tags Relacionadas

Um astronauta em um traje espacial desgastado está em um deserto branco diante de uma enorme nave estelar em forma de tubarão com uma abertura semelhante a uma boca escancarada e grandes motores.

Parâmetros Recomendados

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, Euler, DPM++ SDE, 2M SDE Karras

steps

4 - 40

cfg

2.5 - 7

resolution

1536x1536, 1024x1024

vae

ae.safetensors

Parâmetros Recomendados para Alta Resolução

upscale

1.5 - null

Dicas

Use mais de 8 passos para melhorar detalhes finos, mas a saída não muda muito após 8 passos.

Adicionar prompts de estilo pode ajudar o modelo a gerar saída mais organizada e limpa.

Tente aumentar a escala de orientação para obter imagens mais limpas.

Evite usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição se quiser um visual natural na fotografia.

Para upscaling, tente upscale latent por nó e escale latent por 1.5 para imagens de maior resolução.

Use o otimizador pagedlion8bit para treinar em GPU 24GB, congelando os parâmetros time_in, vector_in e modulation para evitar a desdestilação.

Pare o treinamento após alguns milhares de passos com LR 5e-6 para evitar blocos corrompidos e faça block merge com checkpoints anteriores para corrigir a corrupção.

Destaques da Versão

Ajuste fino do modelo schnell, não usando o modelo dev de forma alguma. Licença Apache 2.0!

Treinado com kohya usando um cronograma personalizado sigma e congelando os parâmetros de tempo e modulação para evitar degradação da destilação temporal.

➤ Passos combinados de treinamento : 1.360.641

➤ Tempo ativo de treinamento: 1192,61 horas (49,7 dias)

Patrocinadores do Criador

Modelo também disponível em: RunDiffusion e Runware.ai

Um enorme obrigado à RunDiffusion por patrocinar o poder computacional para treinar este modelo!

Para acesso via API, confira Runware.ai.

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Arquivos Safetensor: 💾BF16 💾FP8 💾bnb FP4

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Links para 🤗VAE 🤗T5xxl 🤗CLIP L

Modelo também disponível em: RunDiffusion e Runware.ai

A versão 04 do PixelWave FLUX.1 schnell é um ajuste estético do FLUX.1-schnell. As imagens usadas no treinamento foram seleções manuais para garantir que o modelo tenha uma inclinação para imagens impactantes, com cores, texturas e iluminação belas.

Treinado no modelo schnell original, portanto licença Apache 2.0!
Sem requisitos especiais para rodar. Suporta FLUX LoRAs
Euler Normal, 8 passos.

Você pode usar mais passos para melhorar detalhes mais finos, mas a saída não muda muito após 8 passos.

Agradecimento à RunDiffusion

Um enorme obrigado à RunDiffusion (co-criadores do Juggernaut) por patrocinar o poder computacional que tornou possível o treinamento deste modelo! Descobrir como treinar schnell sem desdestilar o modelo exigiu muitos testes, e poder usar a nuvem da RunDiffusion facilitou muito.

Para quem precisa de acesso via API para este modelo, estamos fazendo parceria com Runware.ai

Eu deixei a versão FLUX.1-dev 04 exclusiva para RunDiffusion e Runware por enquanto. Quando eu lançar a versão 05 no futuro, planejo disponibilizar pesos abertos da dev 04.

Agradeço o suporte para lançar esse modelo, por favor confira eles!

Treinamento

O treinamento foi feito com kohya_ss/sd-scripts. Você pode encontrar meu fork do Kohya aqui, que também contém alterações no submódulo sd-scripts, certifique-se de clonar ambos.

Use a aba fine tuning. Encontrei os melhores resultados com o otimizador pagedlion8bit, que também podia rodar na minha GPU 4090 de 24GB. Outros otimizadores tiveram dificuldade para aprender.

Congelei os parâmetros time_in, vector_in e mod/modulation. Isso evita a 'desdestilação'.

Evito treinar blocos individuais acima do 15. Você pode definir quais blocos treinar na seção FLUX.

LR 5e-6 treina rápido, mas você precisa parar após alguns milhares de passos porque começa a corromper blocos e a retardar o aprendizado.

Você pode depois fazer block merge com um checkpoint anterior, substituindo os blocos corrompidos, e continuar o treinamento.

Sinais de blocos corrompidos: textura de papel sobre a maioria das imagens, perda de detalhes no fundo.

Contato

Para assuntos comerciais ou de negócios, entre em contato conosco pelo e-mail pixelwave@rundiffusion.com. Licenciamento de ajustes flux. Projetos de treinamento customizado. Desenvolvimento comercial de IA. A equipe pode fazer tudo!

PixelWave Flux.1-dev 03 ajustado!

Arquivos Safetensor: 💾BF16 💾FP8 💾NF4

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Links para 🤗VAE 🤗T5xxl 🤗CLIP L

Os arquivos 'diffusers' são na verdade as versões GGUF Q8_0 e Q4_K_M. Arquivos GGUF também disponíveis no huggingface.

Refinei a versão 03 da base FLUX.1-dev por mais de 5 semanas na minha 4090. É capaz de fazer estilos diferentes de arte, fotografia e anime. Truque que descobri para ajudar com LoRAs.

Usei dpmpp 2m sgm uniform 30 passos para as imagens de apresentação. Se quiser um resultado mais limpo, tente aumentar a orientação. Mencionar um estilo também ajuda, assim o modelo não precisa adivinhar.

Também recomendo tentar adicionar o upscale latent por nó, e escalar o latent por 1.5, por exemplo gerando uma imagem 1536x1536 em vez de 1024x1024.

PixelWave Flux.1-schnell 03

Arquivos Safetensor: 💾FP8 💾NF4

Arquivos GGUF: vá para o huggingface

Usei dpmpp 2m sgm uniform 8 passos para as imagens de apresentação.

Você pode começar com 4 passos, mas há menos erros na anatomia se usar mais passos.

PixelWave Flux.1-dev 02

Arquivos Safetensor: 💾BF16 💾FP8

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

A versão 02 melhorou muito imagens pretas e escuras e tem resultados mais confiáveis com menos problemas com mãos.

Recomendo usar dpmpp_2s_ancestral, beta, 14 passos. Ou euler, simples, 20 passos.

Nós Comfyui-GGUF

PixelWave *11 SDXL**. Um modelo ajustado para uso geral. Ótimo para estilos de arte e fotografia.*

Uso 20 passos, DPM++ SDE, CFG 4 a 6 ou 40 passos, 2M SDE Karras

Versão Acelerada - 5+ Passos, DPM++ SDE Karras, 2.5 CFG

PAG Recomendado⚡Recomendo escala 1.5, com CFG 3. Link para o workflow

🔗Link para Galeria Expandida 🖼️

⭐Guia de prompts.⭐ Você não precisa usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição, alta qualidade, etc. A menos que queira, recomendo não usar palavras como 'vibrante, intenso, brilhante, alto contraste, neon, dramático' para estilos fotográficos se desejar um aspecto mais natural. Isso pode fazer as imagens parecerem 'cozidas demais', mas é apenas o CLIP seguindo seu prompt. 🙂 Se quiser fotos vibrantes e neon, o PixelWave oferece!

O foco da versão 10 foi treinar os modelos CLIP, o que melhora a confiabilidade, garante que você possa produzir uma ampla variedade de estilos e melhora o seguimento dos prompts.

Obrigado aos meus amigos que ajudaram nos testes: masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Guia: Ampliando Prompts com LM Studio e Mikey Nodes

Guia: Adicione mais detalhes à sua imagem usando o método skip step

Não é necessário o modelo refiner.

Este modelo não é uma mistura de outros modelos.

Eu também criei Mikey Nodes que contém muitos nós úteis. Você pode instalar via comfy manager.

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

Smol Dragons [LoRA 1.5+SDXL] - SDXL

ICBINP - "Eu Não Consigo Acreditar Que Não É Fotografia" - LCM

Usar este modelo