Uma mulher com vestido preto lendo um livro em um sofá de veludo vermelho escuro em uma sala de biblioteca aconchegante e com iluminação baixa, com lareira acesa, pintura floral e estantes altas de livros.
Foto diurna de um bairro suburbano de Los Angeles mostrando um SUV branco estacionado na rua em frente a casas e palmeiras.
Jovem com shorts jeans e regata branca encostada em um carro vermelho dos anos 1950 em uma rua cubana colorida em Havana, com prédios em tons pastéis.
Uma vista aérea panorâmica de uma cidade romana situada em uma paisagem italiana montanhosa com caminhos de terra secos em primeiro plano, montanhas ao fundo e o oceano à esquerda sob um céu azul claro.

Parâmetros Recomendados

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, euler, DPM++ SDE, 2M SDE Karras, DPM++ SDE Karras, DPM++ 2M

steps

4 - 40

cfg

2.5 - 7

resolution

1024x1024, 1536x1536

vae

ae.safetensors - unknown

Parâmetros Recomendados para Alta Resolução

upscale

1.5 - null

Dicas

Você pode usar mais passos para melhorar os detalhes finos, mas a saída não muda muito após 8 passos.

Se quiser uma saída mais limpa/organizada, tente aumentar a escala de orientação (CFG).

Mencionar um estilo no prompt pode ajudar o modelo a gerar melhores resultados.

Tente adicionar upscale latent por nó, e escalar o latent por 1.5 para gerar imagens em resolução maior.

Evite usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição, alta qualidade a menos que necessário; pode fazer as imagens parecerem exageradas.

Para estilos fotográficos, evite termos como 'vibrante, intenso, brilhante, alto contraste, neon, dramático' se desejar um visual natural.

Treinamento foi feito com kohya_ss/sd-scripts usando otimizador pagedlion8bit.

Congelar os parâmetros 'time_in', 'vector_in' e modulação impede a 'desdestilação'.

Evite treinar blocos isolados acima de 15; defina os blocos de treinamento na seção FLUX.

Taxa de aprendizado 5e-6 treina rápido mas pare após alguns milhares de passos para evitar corrupção de blocos.

Destaques da Versão

Ajustado por 5 semanas na minha 4090.

Patrocinadores do Criador

Modelo também disponível em: RunDiffusion e Runware.ai

Um enorme obrigado ao RunDiffusion por patrocinar o poder computacional que tornou possível o treinamento deste modelo!

Para acesso API, faça parceria com Runware.ai

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Arquivos Safetensor: 💾BF16 💾FP8 💾bnb FP4

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Links para 🤗VAE 🤗T5xxl 🤗CLIP L

Modelo também disponível em: RunDiffusion e Runware.ai

PixelWave FLUX.1 schnell versão 04 é um ajuste estético do FLUX.1-schnell. As imagens de treino foram escolhidas manualmente para garantir que o modelo tenha uma tendência para imagens chamativas, com cores, texturas e iluminação bonitas.

  • Treinado no modelo schnell original, portanto licença Apache 2.0!

  • Sem requisitos especiais para rodar. Suporta FLUX LoRAs

  • Euler Normal, 8 passos.

Você pode usar mais passos para melhorar os detalhes finos, mas a saída não muda muito após 8 passos.

Agradecimentos ao RunDiffusion

Um enorme obrigado ao RunDiffusion (co-criadores do Juggernaut) por patrocinar o poder computacional que tornou possível o treinamento deste modelo! Descobrir como treinar o schnell sem desdestilar o modelo exigiu muitos experimentos, e poder utilizar a computação em nuvem do RunDiffusion facilitou muito.

Para quem precisa de acesso à API para este modelo, estamos fazendo parceria com Runware.ai

Fiz a versão FLUX.1-dev 04 exclusiva para RunDiffusion e Runware por enquanto. Quando eu lançar a versão 05 futuramente, planejo liberar os pesos abertos da dev 04.

Agradecido pelo suporte deles em divulgar este modelo, por favor confira-os!

Treinamento

O treinamento foi feito com kohya_ss/sd-scripts. Você pode encontrar meu fork do Kohya aqui, que também contém mudanças no submódulo sd-scripts, certifique-se de clonar ambos.

Use a aba de fine tuning. Eu encontrei os melhores resultados com o otimizador pagedlion8bit que também pode rodar na minha GPU 4090 de 24GB. Outros otimizadores tiveram dificuldade para aprender algo.

Congelei os parâmetros time_in, vector_in e mod/modulation. Isso impede a 'desdestilação'.

Evito treinar blocos isolados acima de 15. Você pode definir quais blocos treinar na seção FLUX.

LR 5e-6 treina rápido, mas é necessário parar após alguns milhares de passos, pois começam a corromper os blocos e desacelerar o aprendizado.

Então você pode fazer um merge de bloco com um checkpoint anterior, substituindo os blocos corrompidos, e continuar o treinamento.

Sinais de blocos corrompidos: textura de papel sobre a maioria das imagens, perda de detalhes do fundo.

Contato

Para negócios ou consultas comerciais, por favor entre em contato conosco em pixelwave@rundiffusion.com. Licenciamento de fine tunes Flux. Projetos de treinamento personalizados. Desenvolvimento comercial de IA. A equipe faz tudo!

PixelWave Flux.1-dev 03 ajustado!

Arquivos Safetensor: 💾BF16 💾FP8 💾NF4

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Links para 🤗VAE 🤗T5xxl 🤗CLIP L

Os arquivos 'diffusers' são na realidade as versões GGUF Q8_0 e Q4_K_M. Arquivos GGUF também disponíveis no huggingface.

Eu ajustei a versão 03 da base FLUX.1-dev por mais de 5 semanas na minha 4090. É capaz de fazer diferentes estilos artísticos, fotografia e anime. Truque que descobri para ajudar com LoRAs.

Usei dpmpp 2m sgm uniforme 30 passos para as imagens de demonstração. Se quiser uma saída mais limpa/organizada, experimente aumentar a orientação (guidance). Mencionar um estilo também ajuda, para que o modelo não precise adivinhar.

Recomendo também tentar adicionar upscaling latent por nó e escalar latent por 1,5, por exemplo, gerando uma imagem 1536x1536 em vez de 1024x1024.

PixelWave Flux.1-schnell 03

Arquivos Safetensor: 💾FP8 💾NF4

Arquivos GGUF: vá para huggingface

Usei dpmpp 2m sgm uniforme 8 passos para as imagens de demonstração.

Você pode começar com 4 passos, mas há menos erros na anatomia se usar mais passos.

PixelWave Flux.1-dev 02

Arquivos Safetensor: 💾BF16 💾FP8

Arquivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

A versão 02 melhorou muito imagens pretas e escuras, e oferece resultados mais confiáveis com menos problemas nas mãos.

Recomendo usar dpmpp_2s_ancestral, beta, 14 passos. Ou euler, simple, 20 passos.

Nós Comfyui-GGUF

PixelWave 11 SDXL. Um modelo fine tuned para uso geral. Excelente para estilos de arte e fotografia.

Uso 20 passos, DPM++ SDE, CFG de 4 a 6 ou 40 passos, 2M SDE Karras

Versão acelerada - mais de 5 passos, DPM++ SDE Karras, CFG 2.5

PAG recomendado⚡Recomendo escala 1.5, com CFG 3. Link para workflow

🔗Link para galeria expandida 🖼️

Guia de prompts⭐ Você não precisa usar termos de 'qualidade' como 4K, 8K, masterpiece, alta definição, alta qualidade, etc. A menos que queira, recomendo não usar palavras como 'vibrante, intenso, brilhante, alto contraste, neon, dramático' para estilos fotográficos se desejar uma aparência mais natural. Isso pode fazer com que as imagens pareçam 'cozidas demais', mas é apenas o CLIP seguindo seu prompt. 🙂 Se quiser fotos vibrantes e neon, PixelWave oferece!

O foco da versão 10 foi treinar os modelos CLIP, que melhoram a confiabilidade, garantem que você possa produzir uma ampla variedade de estilos, e melhor na interpretação de prompts.

Agradecimentos aos meus amigos que ajudaram a testar: masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Guia: Upscaling de prompts com LM Studio e Mikey Nodes

Guia: Adicione mais detalhes à sua imagem usando o método skip step

Não é necessário o modelo refiner.

Este modelo não é uma mistura de outros modelos.

Também criei Mikey Nodes que contém vários nós úteis. Você pode instalá-lo através do comfy manager.

Anterior
Artify´s Fantastic Flux Landscape Lora - artilands_v1.0
Próximo
Project0* - v4.0 Art_Realism_FP8

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

Flux.1 D

Versão do modelo

FLUX.1-dev 03

Hash do modelo

49b429b788

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por PixelWave - FLUX.1-dev 03

Uma mulher com vestido preto lendo um livro em um sofá de veludo vermelho escuro em uma sala de biblioteca aconchegante e com iluminação baixa, com lareira acesa, pintura floral e estantes altas de livros.
Foto diurna de um bairro suburbano de Los Angeles mostrando um SUV branco estacionado na rua em frente a casas e palmeiras.
Jovem com shorts jeans e regata branca encostada em um carro vermelho dos anos 1950 em uma rua cubana colorida em Havana, com prédios em tons pastéis.
Uma vista aérea panorâmica de uma cidade romana situada em uma paisagem italiana montanhosa com caminhos de terra secos em primeiro plano, montanhas ao fundo e o oceano à esquerda sob um céu azul claro.

Imagens com anime

Fêmea egípcia em estilo anime ajoelhada no deserto, com pele bronzeada, cabelos brancos, olhos vermelhos, vestindo uma túnica branca e colar egípcio, raio de sol ao fundo.
Garota anime de cabelo curto em um campo de flores azuis à noite, com uma luz azul brilhante e galáxia no céu, luzes da cidade ao longe.
Uma garota de anime estilizada com cabelo preto longo e olhos verdes marcantes, vestindo roupa preta e meias até a coxa adornadas com tatuagens de flores vermelhas, segurando uma katana contra um fundo vermelho.
Uma cena dramática de batalha steampunk com dirigíveis pairando sobre o horizonte da cidade, robôs e exoesqueletos movidos a vapor lutando na rua enquanto uma explosão ilumina o centro sob céus tempestuosos.
Uma garota raposa sorridente com cabelo loiro, olhos amarelos, orelhas de raposa e cauda de raposa, vestindo um kimono colorido com detalhes em pele e ornamentos tradicionais no cabelo, em pé diante de um portão torii.
Garota anime com cabelo roxo-azulado em vestido chinês rosa sentada em um sofá verde azulado segurando bandejas de bebidas em um ambiente de café.
Menina loira em estilo anime vestindo um vestido branco de verão e um grande chapéu de sol com decoração de girassol, felizmente posicionada em um campo de girassóis ao pôr do sol com os braços levantados.
Uma mulher confiante com cabelo branco curto e olhos azuis penetrantes vestindo um suéter preto sem mangas com gola alta, calças pretas e luvas sem dedos, parada em um beco urbano pouco iluminado sob um céu noturno estrelado.
Mulher loira vestindo armadura Helldiver preta e dourada com corte no decote, botas acima do joelho, segurando um capacete, com olhos azuis e um leve sorriso
Garota de anime com cabelo vermelho em trança, vestindo uniforme escolar azul-marinho com detalhes dourados, sentada com as pernas afastadas, olhando para o observador com olhos vermelhos, e usando fitas e brincos vermelhos.

Imagens com modelo base

Cena fotorrealista de personagens mortos-vivos incluindo zumbis e esqueletos caminhando por um cemitério assustador iluminado por lanternas de abóbora brilhantes sob um céu escuro e ameaçador.

Imagens com arte digital

Um modelo de nave espacial holográfica translúcida exibido dentro de um cubo transparente no meio de uma movimentada praça de cidade futurista com prédios altos e painéis digitais.
Ilustração digital fotorrealista de um quarto futurista apresentando uma projeção holográfica de um personagem temático espacial em tons azuis acima da cama ornamentada, com uma mulher em um traje futurista elegante sentada na cama em um quarto luxuoso com paredes azuis e vista para a paisagem urbana.
Personagem feminina sci-fi com longo rabo de cavalo preto e franja, vestindo macacão justo branco e esmeralda, vista por trás com ênfase em sua silhueta em estilo quadrinhos.
Uma caneca de café Starbucks brilhante emitindo faíscas violetas e cianas e vapor em um ambiente escuro.
Pintura digital de um grande pássaro escuro com penas irregulares e asas estendidas, contra um fundo texturizado vermelho intenso com uma luz brilhante e luminosa à direita.
Retrato digital de uma garota ruiva com olhos verdes e sardas no rosto e ombros, vestindo uma regata escura contra um fundo escuro.
Gato preto antropomórfico vestindo um elegante terno xadrez sentado em uma mesa de madeira, segurando um copo de gin marrom, com olhos amarelos brilhantes e detalhes intrincados em um ambiente lounge surreal.
Retrato digital de um jovem branco com cabelos brancos e olhos azuis, capa de álbum de música new wave dinâmica e detalhada intitulada Counting Down The Days por MUSAIC.

Imagens com fotografia

Avô com cabelo grisalho e mulher com rabo de cavalo alto e cabelo grisalho, em uma piscina turquesa com um cachorro branco e um canguru próximo a paredes rosas
Arquitetura moderna escura e atmosférica com estruturas de concreto em camadas iluminadas por um brilho laranja quente à noite.
Uma paisagem noturna mística apresentando ruínas de pedra antigas com escadas, uma lua cheia brilhante se pondo atrás de montanhas distantes, um vale de rio sinuoso, estrelas brilhantes e um céu quente e mágico iluminado por iluminação cinematográfica.
Lincoln Continental preto fotorrealista com janelas escuras em uma rua molhada de Nova York durante o pôr do sol da hora dourada, com pavimento brilhante e atmosfera chuvosa em estilo grão de filme.
Um retrato de fotografia de moda de uma mulher com cabelo curto platinado, espreitando por trás de uma moldura de porta escura, iluminada por iluminação cinematográfica fria azul em estilo minimalista.
Retrato em close-up de dupla exposição de uma mulher com névoa e ondas do oceano misturando-se ao seu perfil em cores suaves e cinematográficas
Close-up de uma jovem mulher com olhos verdes e sardas parcialmente escondida atrás de um arbusto de flores roxas vibrantes e folhas verdes, uma flor cobrindo um dos olhos.
Uma ilustração fotorrealista em estilo aquarela de uma mulher africana com túnica branca e calças usando óculos escuros, descendo escadas dentro de uma enorme nave espacial futurista preta com elementos de design cyberpunk e pós-apocalípticos sob iluminação dramática.
Renderização 3D fotorrealista de uma figura dentro de um grande túnel cilíndrico escuro com elementos de tecnologia futurista e luzes laranja brilhantes, iluminado por efeitos de iluminação cinematográfica e volumétrica.
Foto hiper-realista frontal de um android distópico usando um capacete cyberpunk de metal esculpido com fios e cabos, envolto em vestes negras.

Imagens com arte tradicional

Uma confiante guarda romana feminina vestindo armadura de batalha de bronze com detalhes intrincados, posicionada em uma rua histórica da cidade durante o dia.
Pintura em tinta oriental retratando cachoeiras dramáticas descendo por penhascos rochosos com atmosfera enevoada e caligrafia tênue
Um gato malhado sentado serenamente entre flores vibrantes no estilo aquarela japonesa sob um grande sol vermelho com elegantes efeitos de tinta chinesa.
Close de uma garota com cabelo brilhante e pele clara, olhos fechados.
Garota anime com cabelo loiro longo em uniforme escolar japonês tradicional com laço azul
Um tigre branco e uma menina em roupas tradicionais sobre um fundo de montanha com névoa. Imagem gerada por IA usando stable diffusion.
Uma cena dramática com um samurai solitário em pé sobre a água, enfrentando uma pagode japonesa tradicional à distância sob um céu tempestuoso com nuvens rodopiantes e névoa, gerada usando Stable Diffusion.
Imagem gerada por IA usando Stable Diffusion de uma bela mulher vestida com traje chinês tradicional, com cabelo esvoaçante, roupas antigas detalhadas e um fundo oriental sereno com uma pagoda e folhagens.