modelos/SDXL / Flux.1 D - Preto Fosco (Vanta) - Experimento - Flux.1 D v2.0

SDXL / Flux.1 D - Preto Fosco (Vanta) - Experimento - Flux.1 D v2.0

|
7/2/2025
|
1:28:47 AM
| Discussion|
0
Duas jovens irmãs brincam com um grande urso gentil dentro de um chalé medieval aconchegante, iluminado por luz quente em estilo pintura a óleo.
Uma princesa elfa futurista e esguia com cabelo branco longo sentada em uma mesa de jantar à luz de velas dentro de uma estação espacial com vista para os anéis de Saturno, em estilo de pintura a óleo detalhada inspirada em Rembrandt.
Pintura digital de uma bela sereia com cabelo loiro longo e esvoaçante, cauda cintilante roxa, vestindo vestido preto e joias temáticas do oceano, no estilo Rembrandt.
Retrato de uma deusa adolescente robótica com cabelos longos loiros esvoaçantes e olhos azuis, apresentando corpo meio robótico em uma oficina futurista, iluminada por iluminação estilo Rembrandt.
Uma garota de cabelo ruivo usando jardineira branca de jeans está dentro de uma nave espacial de alta tecnologia, olhando através de uma grande janela circular para o espaço sideral cheio de estrelas e um planeta abaixo.
Uma jovem adolescente coreana temática cyberpunk com cabelo loiro platinado em tranças, vestindo um hanbok futurista azul brilhante e um visor de realidade aumentada, segurando um coquetel azul luminoso em uma vibrante rua da cidade iluminada por neon à noite.
Retrato hiper-realista em close-up de uma jovem garota elfa com longo cabelo branco, impressionantes olhos prata-azulados, vestindo um vestido roxo escuro, iluminada por luz suave do sol em um quarto vitoriano.
Pintura a óleo de uma menina tween frágil com traços delicados cercada por rosas vermelhas, renderizada no estilo de Rembrandt com tons profundos e ricos e detalhes intrincados.
Retrato a óleo de meio corpo de uma jovem Cleópatra com expressão curiosa, corte geométrico tipo bob com faixa dourada, vestindo uma túnica branca de linho com bordados dourados, espiando de um corredor escuro, iluminada com iluminação Rembrandt.
Uma jovem garota com cabelo loiro e fones de ouvido sentada em uma mesa aconchegante cercada por livros e plantas à noite, escrevendo em seu diário com um gato ruivo próximo e uma paisagem urbana brilhante através da janela.
Pintura digital altamente detalhada de uma adolescente ciborgue albina com articulações mecânicas, twintails brancos, pele pálida, olhos azuis e grade de mapeamento facial digital em um fundo tecnológico azul.
Três irmãs elfas serenas com longos cabelos brancos e orelhas pontudas sentadas no banco de trás de um carro usando roupas modernas coloridas de rua, pintadas em um estilo de pintura a óleo hiper-realista.

Prompts Recomendados

vantablack

Parâmetros Recomendados

samplers

Euler

steps

20

cfg

1

resolution

512x512, 832x1296

other models

- Flux1 - vanta_black_V2.0 (5d8cf3724039), flux1-dev-fp8 (275ef623d3)

Dicas

Este LoRA é melhor usado em combinação com outros LoRAs coloridos ou de estilo.

Espere efeitos aleatórios ou incomuns; às vezes pode piorar a qualidade da imagem.

Pode adicionar ambientes escuros quando há fontes de luz para melhorar o realismo.

Boa sorte com os prompts, pois não há orientação específica fornecida.

Destaques da Versão

Última tentativa e algumas alterações

Flux.1 D - V2.0

Última tentativa de fazê-lo funcionar no Flux... e por funcionar quero dizer causar o máximo de confusão possível. Provavelmente nunca fará exatamente o que a versão SDXL fez. Mesmo após 6000 passos e apenas pela observação já era óbvio. SDXL é meio que "ok, vou aprender, mas darei meu toque" enquanto o Flux luta/compensa de maneira intensa contra qualquer coisa que não sabe como lidar ou exatamente o que eu quero que seja aprendido. Por outro lado, após um treinamento longo, ele produz aquelas imagens com tanta precisão que copia os dados de treinamento 1/1, o que resulta em quase preto total. Flux pode copiar uma imagem perfeitamente, como fotos, mesmo após poucos passos.

Como disse na última versão Flux, a maior parte do tempo é algo que quero misturar com outros LoRAs que são mais coloridos ou têm um estilo específico.

Mesmas imagens que a SDXL v.3.0 com várias adicionais para a versão Flux (algumas em formato paisagem). Mas... retirei 3 imagens que provavelmente eram responsáveis por pelo menos 80% das imagens postadas por mim ou por outras pessoas. Isso era algo que queria fazer na versão SDXL, mas decidi não fazer na época. A razão é que aquelas imagens eram dominantes demais, causando muitos comportamentos estranhos e um viés para criar imagens específicas. Vi isso na versão Flux v.1.0 e agora elas se foram. A popularidade provavelmente vai cair aqui, mas não me importo.

Sinto que muitas pessoas usam um determinado LoRA porque está no seu "fluxo de trabalho", eu acho. Em alguns casos, imagens feitas sem LoRA parecem melhores e você nunca saberia. LoRAs de estilo são diferentes, pois adicionam um estilo claramente perceptível ao gerar imagens. Este aqui, no entanto, tem muito potencial para piorar as coisas, por isso não selecionei cuidadosamente as imagens que postei, apenas para mostrar o que quero dizer. Se você adicionar algo que tenha um brilho forte ou uma fonte de luz como uma vela, Flux (e alguns modelos SDXL) adicionam um ambiente escuro por conta própria, porque uma fonte de luz sempre precisa de alguma escuridão para ser notada (o farol de um carro em dia ensolarado não faz muito efeito).

E nem pergunte se funciona na versão NF4 ou QQUFUF 5.64.3255 K4 2 ou sei lá o que. O arquivo não é tão grande, então você pode testar por conta própria. Vou me manter afastado desses modelos a menos que ofereçam mais benefícios do que uma versão Dev FP8/16 normal, além de menor consumo de memória e/ou aumento de velocidade quase nulo (ou pior, queda de desempenho).

Sei como pode ser irritante quando alguém lança uma nova versão de qualquer tipo de modelo em curto período se você acabou de se acostumar com o anterior. Não vou continuar perseguindo esta versão e apenas verei se eu ou outra pessoa consegue tirar algo útil dela.

Além disso, o trabalho para preparar as imagens no Photoshop não vale a pena, especialmente se você sabe que isso não mudará nada. Prefiro fazer algo novo, ou provavelmente estúpido, que seja interessante ou crie efeitos aleatórios... ou simplesmente fluxificar modelos antigos para ver o que acontece.


Flux.1 D - V1.0

Após algumas experiências com Kohya e outros, para minha surpresa, testes bem-sucedidos com conceitos LoRA bem estranhos para Flux, decidi tentar este para ver se funcionava. Na verdade, não era meu objetivo principal ter uma versão Flux, pois Flux já trabalha bem com contraste (na maior parte). Meu objetivo principal era me livrar daquele aspecto artificial/falso e pensei que um conjunto de dados tão "indefinido" faria esse papel. Bem, às vezes faz, outras vezes piora ainda mais.

Como na versão SDXL, é mais algo para usar com outros LoRAs, especialmente os que adicionam muita cor.

Desculpe por estar meio preguiçoso com os prompts e imagens. Usei basicamente as mesmas coisas do V.3.0, mas deve servir para demonstração por enquanto. Às vezes mata os detalhes e não acrescenta algo particularmente interessante (imagem da água-viva, por exemplo, ou o papagaio).

  • Mesma semente para imagens correspondentes

  • As duas primeiras imagens são com e sem LoRA, depois invertido: primeiro sem, depois com LoRA (às vezes em intensidades diferentes)

  • Algumas usam palavras-chave no início, mas duvido que isso seja necessário no Flux

  • Baseado no conjunto de dados V1.0, não no novo (não quis usar muitas imagens)

Não tenho certeza se quero fazer mais LoRAs para Flux, mas vou testar bastante. Está realmente confuso agora com todas as versões diferentes e não parece valer a pena gastar muito tempo em algo que pode ficar obsoleto em 10 horas.

E só uma nota: foi treinado com uma 4060 TI (16 GB), entre 14.4 e 15.2 GB de VRAM usada, 3.95s/it - 5.15s/it, 512x, Rank 4... então, não precisa de 4090 aqui. Claro que seria mais rápido, mas se você pode simplesmente iniciar, esquecer e fazer outra coisa no meio, não é problema, a menos que queira testar algo.

Como sempre, vou usar aqui e ali para ver se consigo algo significativo. Mais provável que seja só para satisfazer minha curiosidade.


V.3.0

Após minha pequena confusão com a v2.0, certifiquei-me de que desta vez é coisa séria, sem fusões ou o que seja. Estava um pouco cético no começo, devido à quantidade de imagens adicionadas, que pudesse se afastar muito da primeira versão, mas felizmente não aconteceu.

Estou realmente feliz que muitas pessoas encontraram uso para este LoRA e criaram tantas imagens. Considerando que nunca foi projetado para fazer o que está fazendo agora, é bom ver que tem outra utilidade, ou melhor dizendo, pode ser usado para outras coisas (como todos os LoRAs).

Esta provavelmente (muito provavelmente) será a última versão por algum tempo, pois só adicionar mais imagens não mudará o efeito principal. A maior parte é produzida usando diferentes modelos, combinações de LoRA e prompts de qualquer forma.

Vou me concentrar mais em criar imagens para encontrar mais combinações (e relaxar um pouco), fazer LoRAs estranhos novos, consertar os antigos etc. Também baixei muita coisa de outras pessoas e não tive chance de usar a maior parte.

Obrigado novamente por todas as imagens postadas até agora e espero ver mais, embora todo LoRA tenha uma vida útil neste setor de IA rápido e o fator novidade inevitavelmente termine. :)


V2.0


Pequeno anúncio sobre a V2.0 (02.04 ou 04.02 dependendo do seu país, eu acho)

Bem, sou oficialmente um idiota.

Comecei a treinar outro LoRA quando percebi que nada estava acontecendo nas imagens de amostra, mesmo após 2000 passos, o que é praticamente impossível. Então, procurei o motivo disso e vi uma configuração que não mudei de volta (ou neste caso, para a configuração correta), que era o "LR warmup". Normalmente, não uso passos de aquecimento, mas no que fiz antes estava testando o que realmente faz. Isso foi num conjunto de dados de cerca de 4 imagens. Sempre uso uma configuração de 100 épocas, mas está configurado para gerar um modelo a cada 500 passos, não por época. O Warm Up estava configurado para 32%, então 4 imagens x 10 repetições x 100 épocas = 4000 passos (32% warmup = 1280 passos onde não acontece muita coisa).

Agora, este LoRA tinha as mesmas configurações, mas com 60 imagens (60 x 10 x 100 = 60000 - 32% warmup = 19200 passos)... portanto, mesmo após 12000 passos, ainda nem tinha começado, o que significa que praticamente treinei ar quente. Explica muita coisa na verdade. Como eu dormi, não percebi isso, apesar de ter sido meio desconcertante levar tanto tempo para ter efeito, que eu pensei que fosse devido às próprias imagens.

É... então este é um fracasso e a maior parte do que ele faz vem da fusão com a V1.0.

Vou treinar de novo no fim de semana, quando voltar do trabalho, desta vez com as configurações corretas.

Peço desculpas por isso. Talvez tenha sido uma brincadeira não intencional de Dia da Mentira :) .... :(


Adicionei mais algumas fotos porque tenho usado bastante ultimamente e não faço upload de um novo LoRA há algum tempo, o que é basicamente uma combinação de eu estar muito ocupado no trabalho e escolher só assuntos estressantes complicados que também "tem" que ser feitos da forma mais complicada possível... todo o resto seria chato.

Além disso, gastei bastante tempo desmontando Pony, o que me surpreende em alguns aspectos. Se você deixar de lado todo o conteúdo furry, anime e pornô geral, ele é quase mais básico que o modelo Base XL, o que é bom para adicionar conceitos e estilos via treinamento LoRA, mas conhece coisas muito mais complexas, como posicionamento, emoções, ângulos estranhos etc... mas isso é outra história completamente diferente.

Não sei quanto treinamento mais vou conseguir fazer este ano. Talvez faça algumas coisas mais fáceis no meio, mas quem sabe. IA está avançando rápido, então pode sair alguma coisa nova em um mês... ou em uma semana.

  • Testei a mesma semente e o mesmo modelo com imagens geradas anteriormente. A alteração varia de sutil em alguns casos a extrema em outros (e agora sei por quê: leia o anúncio)

  • Também peço desculpas por não ter feito mais variações nas imagens mostradas. Às vezes, preparar as imagens leva mais tempo que treinar o LoRA, mas não deve importar muito neste caso. Mais coisas virão naturalmente de qualquer forma.


V1.0

Tentei desafiar a IA um pouco para ver o que ela captaria de imagens de treinamento quase totalmente pretas e com formas apenas tênues.

Foi quase impossível preparar o conjunto de dados no Photoshop porque eu praticamente não via nada. Claro que cada pessoa tem configurações diferentes de monitor, etc., então é difícil dizer se aquelas imagens eram realmente tão escuras, mas isso cansou bastante meus olhos. Mesmo agora olhar para as imagens geradas é meio difícil, embora não sejam tão escuras quanto as imagens de treinamento.

Fiquei surpreso que o modelo captou algo. Vou deixá-lo de lado por enquanto até descobrir o que fazer com ele. Com certeza faz algumas coisas estranhas. De algum modo, colocar imagens geradas no ControlNet IP-Adapter realça tudo e produz resultados aleatórios.

Dicas para geração:

  • Não tenho ideia... boa sorte.

Anterior
Epic gorgeous Details - Balance_v2.0
Próximo
FLUX - Pro 1.1 Ultra

Detalhes do Modelo

Tipo de modelo

LORA

Modelo base

Flux.1 D

Versão do modelo

Flux.1 D v2.0

Hash do modelo

1dd1fb8b12

Palavras treinadas

vantablack

Discussão

Por favor, faça log in para deixar um comentário.