Um astronauta em um traje espacial desgastado está em um deserto branco diante de uma enorme nave estelar em forma de tubarão com uma abertura semelhante a uma boca escancarada e grandes motores.

Parâmetros Recomendados

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, Euler, DPM++ SDE, 2M SDE Karras

steps

4 - 40

cfg

2.5 - 7

resolution

1536x1536, 1024x1024

vae

ae.safetensors

Parâmetros Recomendados para Alta Resolução

upscale

1.5 - null

Dicas

Use mais de 8 passos para melhorar detalhes finos, mas a saída não muda muito após 8 passos.

Adicionar prompts de estilo pode ajudar o modelo a gerar saída mais organizada e limpa.

Tente aumentar a escala de orientação para obter imagens mais limpas.

Evite usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição se quiser um visual natural na fotografia.

Para upscaling, tente upscale latent por nó e escale latent por 1.5 para imagens de maior resolução.

Use o otimizador pagedlion8bit para treinar em GPU 24GB, congelando os parâmetros time_in, vector_in e modulation para evitar a desdestilação.

Pare o treinamento após alguns milhares de passos com LR 5e-6 para evitar blocos corrompidos e faça block merge com checkpoints anteriores para corrigir a corrupção.

Destaques da Versão

Ajuste fino do modelo schnell, não usando o modelo dev de forma alguma. Licença Apache 2.0!

Treinado com kohya usando um cronograma personalizado sigma e congelando os parâmetros de tempo e modulação para evitar degradação da destilação temporal.

➤ Passos combinados de treinamento : 1.360.641

➤ Tempo ativo de treinamento: 1192,61 horas (49,7 dias)

Patrocinadores do Criador

Modelo também disponível em: RunDiffusion e Runware.ai

Um enorme obrigado à RunDiffusion por patrocinar o poder computacional para treinar este modelo!

Para acesso via API, confira Runware.ai.

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Arquivos Safetensor: 💾BF16 💾FP8 💾bnb FP4

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Links para 🤗VAE 🤗T5xxl 🤗CLIP L

Modelo também disponível em: RunDiffusion e Runware.ai

A versão 04 do PixelWave FLUX.1 schnell é um ajuste estético do FLUX.1-schnell. As imagens usadas no treinamento foram seleções manuais para garantir que o modelo tenha uma inclinação para imagens impactantes, com cores, texturas e iluminação belas.

  • Treinado no modelo schnell original, portanto licença Apache 2.0!

  • Sem requisitos especiais para rodar. Suporta FLUX LoRAs

  • Euler Normal, 8 passos.

Você pode usar mais passos para melhorar detalhes mais finos, mas a saída não muda muito após 8 passos.

Agradecimento à RunDiffusion

Um enorme obrigado à RunDiffusion (co-criadores do Juggernaut) por patrocinar o poder computacional que tornou possível o treinamento deste modelo! Descobrir como treinar schnell sem desdestilar o modelo exigiu muitos testes, e poder usar a nuvem da RunDiffusion facilitou muito.

Para quem precisa de acesso via API para este modelo, estamos fazendo parceria com Runware.ai

Eu deixei a versão FLUX.1-dev 04 exclusiva para RunDiffusion e Runware por enquanto. Quando eu lançar a versão 05 no futuro, planejo disponibilizar pesos abertos da dev 04.

Agradeço o suporte para lançar esse modelo, por favor confira eles!

Treinamento

O treinamento foi feito com kohya_ss/sd-scripts. Você pode encontrar meu fork do Kohya aqui, que também contém alterações no submódulo sd-scripts, certifique-se de clonar ambos.

Use a aba fine tuning. Encontrei os melhores resultados com o otimizador pagedlion8bit, que também podia rodar na minha GPU 4090 de 24GB. Outros otimizadores tiveram dificuldade para aprender.

Congelei os parâmetros time_in, vector_in e mod/modulation. Isso evita a 'desdestilação'.

Evito treinar blocos individuais acima do 15. Você pode definir quais blocos treinar na seção FLUX.

LR 5e-6 treina rápido, mas você precisa parar após alguns milhares de passos porque começa a corromper blocos e a retardar o aprendizado.

Você pode depois fazer block merge com um checkpoint anterior, substituindo os blocos corrompidos, e continuar o treinamento.

Sinais de blocos corrompidos: textura de papel sobre a maioria das imagens, perda de detalhes no fundo.

Contato

Para assuntos comerciais ou de negócios, entre em contato conosco pelo e-mail pixelwave@rundiffusion.com. Licenciamento de ajustes flux. Projetos de treinamento customizado. Desenvolvimento comercial de IA. A equipe pode fazer tudo!

PixelWave Flux.1-dev 03 ajustado!

Arquivos Safetensor: 💾BF16 💾FP8 💾NF4

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Links para 🤗VAE 🤗T5xxl 🤗CLIP L

Os arquivos 'diffusers' são na verdade as versões GGUF Q8_0 e Q4_K_M. Arquivos GGUF também disponíveis no huggingface.

Refinei a versão 03 da base FLUX.1-dev por mais de 5 semanas na minha 4090. É capaz de fazer estilos diferentes de arte, fotografia e anime. Truque que descobri para ajudar com LoRAs.

Usei dpmpp 2m sgm uniform 30 passos para as imagens de apresentação. Se quiser um resultado mais limpo, tente aumentar a orientação. Mencionar um estilo também ajuda, assim o modelo não precisa adivinhar.

Também recomendo tentar adicionar o upscale latent por nó, e escalar o latent por 1.5, por exemplo gerando uma imagem 1536x1536 em vez de 1024x1024.

PixelWave Flux.1-schnell 03

Arquivos Safetensor: 💾FP8 💾NF4

Arquivos GGUF: vá para o huggingface

Usei dpmpp 2m sgm uniform 8 passos para as imagens de apresentação.

Você pode começar com 4 passos, mas há menos erros na anatomia se usar mais passos.

PixelWave Flux.1-dev 02

Arquivos Safetensor: 💾BF16 💾FP8

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

A versão 02 melhorou muito imagens pretas e escuras e tem resultados mais confiáveis com menos problemas com mãos.

Recomendo usar dpmpp_2s_ancestral, beta, 14 passos. Ou euler, simples, 20 passos.

Nós Comfyui-GGUF

PixelWave 11 SDXL. Um modelo ajustado para uso geral. Ótimo para estilos de arte e fotografia.

Uso 20 passos, DPM++ SDE, CFG 4 a 6 ou 40 passos, 2M SDE Karras

Versão Acelerada - 5+ Passos, DPM++ SDE Karras, 2.5 CFG

PAG Recomendado⚡Recomendo escala 1.5, com CFG 3. Link para o workflow

🔗Link para Galeria Expandida 🖼️

Guia de prompts.⭐ Você não precisa usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição, alta qualidade, etc. A menos que queira, recomendo não usar palavras como 'vibrante, intenso, brilhante, alto contraste, neon, dramático' para estilos fotográficos se desejar um aspecto mais natural. Isso pode fazer as imagens parecerem 'cozidas demais', mas é apenas o CLIP seguindo seu prompt. 🙂 Se quiser fotos vibrantes e neon, o PixelWave oferece!

O foco da versão 10 foi treinar os modelos CLIP, o que melhora a confiabilidade, garante que você possa produzir uma ampla variedade de estilos e melhora o seguimento dos prompts.

Obrigado aos meus amigos que ajudaram nos testes: masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Guia: Ampliando Prompts com LM Studio e Mikey Nodes

Guia: Adicione mais detalhes à sua imagem usando o método skip step

Não é necessário o modelo refiner.

Este modelo não é uma mistura de outros modelos.

Eu também criei Mikey Nodes que contém muitos nós úteis. Você pode instalar via comfy manager.

Anterior
Smol Dragons [LoRA 1.5+SDXL] - SDXL
Próximo
ICBINP - "Eu Não Consigo Acreditar Que Não É Fotografia" - LCM

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

Flux.1 S

Versão do modelo

FLUX.1-schnell 04

Hash do modelo

565b846820

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por PixelWave - FLUX.1-schnell 04

Um astronauta em um traje espacial desgastado está em um deserto branco diante de uma enorme nave estelar em forma de tubarão com uma abertura semelhante a uma boca escancarada e grandes motores.

Imagens com anime

Ilustração digital em estilo anime mostrando uma grande estrutura pontiaguda de pirâmide de pedra triangular em terra árida com pedras espalhadas sob um céu estrelado e um planeta com anéis laranja.
Guerreira feminina detalhada em estilo anime, com traje de couro preto, em uma pose dinâmica com efeitos coloridos em azul e laranja rodopiando ao fundo.
Personagem anime Frieren com orelhas pontudas e olhos verdes, cabelo cinza em twintails, vestindo uma camisola branca transparente, sentada em uma cama em um quarto suavemente iluminado.
Um retrato detalhado de um ciborgue com cabelo branco longo, olhos azuis e armadura robótica intrincada, em uma paisagem urbana futurista cyberpunk à noite.
Retrato em close de uma pequena garota elfa com longos rabos de cavalo prateados, olhos azul-esverdeados e traços faciais delicados, vestindo uma capa branca com acabamento dourado e brincos vermelhos, em pé numa floresta.
Uma delicada fada parecida com Sininho com asas translúcidas intricadas, dormindo pacificamente em flores vibrantes, vestida com um traje verde detalhado.
Y'shtola Rhul de Final Fantasy XIV usando um vestido chinês preto sem mangas com orelhas de gato e cauda, contra um fundo noturno com lanternas penduradas.
Um monastério e cidade sci-fi futuristas construídos em penhascos íngremes de uma garganta verdejante com um rio abaixo, apresentando uma máquina voadora e uma mulher solitária caminhando por uma ponte fina.
Uma arara vibrante empoleirada em um galho na floresta tropical com tons suaves de pastéis e estilo anime de alto contraste.
Uma garota com olhos belos e franja sentada na grama, luz do sol e sombras das folhas se entrelaçam sobre ela e no chão.

Imagens com modelo base

Cena fotorrealista de personagens mortos-vivos incluindo zumbis e esqueletos caminhando por um cemitério assustador iluminado por lanternas de abóbora brilhantes sob um céu escuro e ameaçador.

Imagens com arte digital

Close-up em preto e branco de uma mulher com cabelos molhados pela chuva, parcialmente se desintegrando em partículas coloridas do arco-íris que se dispersam para a esquerda.
Retrato de uma mulher negra de pele escura estilizada como deusa, usando joias de ouro e um traje dourado com cabelo curto e escuro.
Cidade futurista com altas torres cilíndricas de vidro situada em uma paisagem montanhosa nevada sob um céu dramático ao pôr do sol.
Arte digital de um gato cinza escuro fofo com olhos azuis brilhantes sentado em um galho de árvore rodeado por folhas de outono laranja. O gato tem um halo brilhante acima da cabeça e usa uma coleira com um pingente.
Uma mulher feroz em um exotraje tecnológico brilhante dispara rajadas de energia no meio de uma enorme explosão em uma paisagem urbana distópica iluminada por neon.
Pintura digital em close-up de uma menina de cabelo castanho segurando um coelho branco contra um cenário de vila nevada no inverno, renderizada em estilo de arte clássico.
Vista por trás de um longo caminho rachado que atravessa uma cidade distópica devastada por uma explosão atômica com uma enorme nuvem em forma de cogumelo e ruínas em chamas.
Um unicórnio branco com um chifre rosa brilhante e uma crina rosa fluida, olhos vermelhos com esclera colorida, em um fundo escuro no estilo de arte digital.
Arte digital em close-up de um gato preto com olhos amarelos brilhantes, representado com cores chapadas, alto contraste e traços mínimos.

Imagens com fotografia

Retrato em close de um extraordinário Pica-pau-azul ao amanhecer, exibindo penas detalhadas, crista azul vibrante e olho afiado com sutil borrão de movimento.
Mulher loira com sardas e sorriso sentada ao ar livre usando camiseta vinho decote em V e micro-saia floral sob iluminação natural
Avô com cabelo grisalho e mulher com rabo de cavalo alto e cabelo grisalho, em uma piscina turquesa com um cachorro branco e um canguru próximo a paredes rosas
Arquitetura moderna escura e atmosférica com estruturas de concreto em camadas iluminadas por um brilho laranja quente à noite.
Uma paisagem noturna mística apresentando ruínas de pedra antigas com escadas, uma lua cheia brilhante se pondo atrás de montanhas distantes, um vale de rio sinuoso, estrelas brilhantes e um céu quente e mágico iluminado por iluminação cinematográfica.
Lincoln Continental preto fotorrealista com janelas escuras em uma rua molhada de Nova York durante o pôr do sol da hora dourada, com pavimento brilhante e atmosfera chuvosa em estilo grão de filme.
Um retrato de fotografia de moda de uma mulher com cabelo curto platinado, espreitando por trás de uma moldura de porta escura, iluminada por iluminação cinematográfica fria azul em estilo minimalista.
Retrato em close-up de dupla exposição de uma mulher com névoa e ondas do oceano misturando-se ao seu perfil em cores suaves e cinematográficas
Close-up de uma jovem mulher com olhos verdes e sardas parcialmente escondida atrás de um arbusto de flores roxas vibrantes e folhas verdes, uma flor cobrindo um dos olhos.
Uma ilustração fotorrealista em estilo aquarela de uma mulher africana com túnica branca e calças usando óculos escuros, descendo escadas dentro de uma enorme nave espacial futurista preta com elementos de design cyberpunk e pós-apocalípticos sob iluminação dramática.

Imagens com arte tradicional

Uma confiante guarda romana feminina vestindo armadura de batalha de bronze com detalhes intrincados, posicionada em uma rua histórica da cidade durante o dia.
Pintura em tinta oriental retratando cachoeiras dramáticas descendo por penhascos rochosos com atmosfera enevoada e caligrafia tênue
Um gato malhado sentado serenamente entre flores vibrantes no estilo aquarela japonesa sob um grande sol vermelho com elegantes efeitos de tinta chinesa.
Close de uma garota com cabelo brilhante e pele clara, olhos fechados.
Garota anime com cabelo loiro longo em uniforme escolar japonês tradicional com laço azul
Um tigre branco e uma menina em roupas tradicionais sobre um fundo de montanha com névoa. Imagem gerada por IA usando stable diffusion.
Uma cena dramática com um samurai solitário em pé sobre a água, enfrentando uma pagode japonesa tradicional à distância sob um céu tempestuoso com nuvens rodopiantes e névoa, gerada usando Stable Diffusion.
Imagem gerada por IA usando Stable Diffusion de uma bela mulher vestida com traje chinês tradicional, com cabelo esvoaçante, roupas antigas detalhadas e um fundo oriental sereno com uma pagoda e folhagens.