Uma mulher com vestido preto lendo um livro em um sofá de veludo vermelho escuro em uma sala de biblioteca aconchegante e com iluminação baixa, com lareira acesa, pintura floral e estantes altas de livros.
Foto diurna de um bairro suburbano de Los Angeles mostrando um SUV branco estacionado na rua em frente a casas e palmeiras.
Jovem com shorts jeans e regata branca encostada em um carro vermelho dos anos 1950 em uma rua cubana colorida em Havana, com prédios em tons pastéis.
Uma vista aérea panorâmica de uma cidade romana situada em uma paisagem italiana montanhosa com caminhos de terra secos em primeiro plano, montanhas ao fundo e o oceano à esquerda sob um céu azul claro.

Parâmetros Recomendados

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, euler, DPM++ SDE, 2M SDE Karras, DPM++ SDE Karras, DPM++ 2M

steps

4 - 40

cfg

2.5 - 7

resolution

1024x1024, 1536x1536

vae

ae.safetensors - unknown

Parâmetros Recomendados para Alta Resolução

upscale

1.5 - null

Dicas

Você pode usar mais passos para melhorar os detalhes finos, mas a saída não muda muito após 8 passos.

Se quiser uma saída mais limpa/organizada, tente aumentar a escala de orientação (CFG).

Mencionar um estilo no prompt pode ajudar o modelo a gerar melhores resultados.

Tente adicionar upscale latent por nó, e escalar o latent por 1.5 para gerar imagens em resolução maior.

Evite usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição, alta qualidade a menos que necessário; pode fazer as imagens parecerem exageradas.

Para estilos fotográficos, evite termos como 'vibrante, intenso, brilhante, alto contraste, neon, dramático' se desejar um visual natural.

Treinamento foi feito com kohya_ss/sd-scripts usando otimizador pagedlion8bit.

Congelar os parâmetros 'time_in', 'vector_in' e modulação impede a 'desdestilação'.

Evite treinar blocos isolados acima de 15; defina os blocos de treinamento na seção FLUX.

Taxa de aprendizado 5e-6 treina rápido mas pare após alguns milhares de passos para evitar corrupção de blocos.

Destaques da Versão

Ajustado por 5 semanas na minha 4090.

Patrocinadores do Criador

Modelo também disponível em: RunDiffusion e Runware.ai

Um enorme obrigado ao RunDiffusion por patrocinar o poder computacional que tornou possível o treinamento deste modelo!

Para acesso API, faça parceria com Runware.ai

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Arquivos Safetensor: 💾BF16 💾FP8 💾bnb FP4

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Links para 🤗VAE 🤗T5xxl 🤗CLIP L

Modelo também disponível em: RunDiffusion e Runware.ai

PixelWave FLUX.1 schnell versão 04 é um ajuste estético do FLUX.1-schnell. As imagens de treino foram escolhidas manualmente para garantir que o modelo tenha uma tendência para imagens chamativas, com cores, texturas e iluminação bonitas.

  • Treinado no modelo schnell original, portanto licença Apache 2.0!

  • Sem requisitos especiais para rodar. Suporta FLUX LoRAs

  • Euler Normal, 8 passos.

Você pode usar mais passos para melhorar os detalhes finos, mas a saída não muda muito após 8 passos.

Agradecimentos ao RunDiffusion

Um enorme obrigado ao RunDiffusion (co-criadores do Juggernaut) por patrocinar o poder computacional que tornou possível o treinamento deste modelo! Descobrir como treinar o schnell sem desdestilar o modelo exigiu muitos experimentos, e poder utilizar a computação em nuvem do RunDiffusion facilitou muito.

Para quem precisa de acesso à API para este modelo, estamos fazendo parceria com Runware.ai

Fiz a versão FLUX.1-dev 04 exclusiva para RunDiffusion e Runware por enquanto. Quando eu lançar a versão 05 futuramente, planejo liberar os pesos abertos da dev 04.

Agradecido pelo suporte deles em divulgar este modelo, por favor confira-os!

Treinamento

O treinamento foi feito com kohya_ss/sd-scripts. Você pode encontrar meu fork do Kohya aqui, que também contém mudanças no submódulo sd-scripts, certifique-se de clonar ambos.

Use a aba de fine tuning. Eu encontrei os melhores resultados com o otimizador pagedlion8bit que também pode rodar na minha GPU 4090 de 24GB. Outros otimizadores tiveram dificuldade para aprender algo.

Congelei os parâmetros time_in, vector_in e mod/modulation. Isso impede a 'desdestilação'.

Evito treinar blocos isolados acima de 15. Você pode definir quais blocos treinar na seção FLUX.

LR 5e-6 treina rápido, mas é necessário parar após alguns milhares de passos, pois começam a corromper os blocos e desacelerar o aprendizado.

Então você pode fazer um merge de bloco com um checkpoint anterior, substituindo os blocos corrompidos, e continuar o treinamento.

Sinais de blocos corrompidos: textura de papel sobre a maioria das imagens, perda de detalhes do fundo.

Contato

Para negócios ou consultas comerciais, por favor entre em contato conosco em pixelwave@rundiffusion.com. Licenciamento de fine tunes Flux. Projetos de treinamento personalizados. Desenvolvimento comercial de IA. A equipe faz tudo!

PixelWave Flux.1-dev 03 ajustado!

Arquivos Safetensor: 💾BF16 💾FP8 💾NF4

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Links para 🤗VAE 🤗T5xxl 🤗CLIP L

Os arquivos 'diffusers' são na realidade as versões GGUF Q8_0 e Q4_K_M. Arquivos GGUF também disponíveis no huggingface.

Eu ajustei a versão 03 da base FLUX.1-dev por mais de 5 semanas na minha 4090. É capaz de fazer diferentes estilos artísticos, fotografia e anime. Truque que descobri para ajudar com LoRAs.

Usei dpmpp 2m sgm uniforme 30 passos para as imagens de demonstração. Se quiser uma saída mais limpa/organizada, experimente aumentar a orientação (guidance). Mencionar um estilo também ajuda, para que o modelo não precise adivinhar.

Recomendo também tentar adicionar upscaling latent por nó e escalar latent por 1,5, por exemplo, gerando uma imagem 1536x1536 em vez de 1024x1024.

PixelWave Flux.1-schnell 03

Arquivos Safetensor: 💾FP8 💾NF4

Arquivos GGUF: vá para huggingface

Usei dpmpp 2m sgm uniforme 8 passos para as imagens de demonstração.

Você pode começar com 4 passos, mas há menos erros na anatomia se usar mais passos.

PixelWave Flux.1-dev 02

Arquivos Safetensor: 💾BF16 💾FP8

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

A versão 02 melhorou muito imagens pretas e escuras, e oferece resultados mais confiáveis com menos problemas nas mãos.

Recomendo usar dpmpp_2s_ancestral, beta, 14 passos. Ou euler, simple, 20 passos.

Nós Comfyui-GGUF

PixelWave 11 SDXL. Um modelo fine tuned para uso geral. Excelente para estilos de arte e fotografia.

Uso 20 passos, DPM++ SDE, CFG de 4 a 6 ou 40 passos, 2M SDE Karras

Versão acelerada - mais de 5 passos, DPM++ SDE Karras, CFG 2.5

PAG recomendado⚡Recomendo escala 1.5, com CFG 3. Link para workflow

🔗Link para galeria expandida 🖼️

Guia de prompts⭐ Você não precisa usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição, alta qualidade, etc. A menos que queira, recomendo não usar palavras como 'vibrante, intenso, brilhante, alto contraste, neon, dramático' para estilos fotográficos se desejar uma aparência mais natural. Isso pode fazer com que as imagens pareçam 'cozidas demais', mas é apenas o CLIP seguindo seu prompt. 🙂 Se quiser fotos vibrantes e neon, PixelWave oferece!

O foco da versão 10 foi treinar os modelos CLIP, que melhoram a confiabilidade, garantem que você possa produzir uma ampla variedade de estilos, e melhor na interpretação de prompts.

Agradecimentos aos meus amigos que ajudaram a testar: masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Guia: Upscaling de prompts com LM Studio e Mikey Nodes

Guia: Adicione mais detalhes à sua imagem usando o método skip step

Não é necessário o modelo refiner.

Este modelo não é uma mistura de outros modelos.

Também criei Mikey Nodes que contém vários nós úteis. Você pode instalá-lo através do comfy manager.

Anterior
Artify´s Fantastic Flux Landscape Lora - artilands_v1.0
Próximo
Project0* - v4.0 Art_Realism_FP8

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

Flux.1 D

Versão do modelo

FLUX.1-dev 03

Hash do modelo

49b429b788

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por PixelWave - FLUX.1-dev 03

Imagens com anime

Imagens com modelo base

Imagens com arte digital

Imagens com fotografia

Imagens com arte tradicional