modelos/Stabilizer IL/NAI - illus01 v1.72

Stabilizer IL/NAI - illus01 v1.72

|
9/30/2025
|
1:28:56 PM
| Discussion|
0
Fêmea híbrida de veado anthro com cabelo vermelho segurando um grande guarda-chuva verde rasgado, vestindo um vestido de folhas, em pé em uma floresta conífera sob um céu nublado, pássaros empoleirados em seus chifres em um ninho.
Jovem mulher kawaii com cabelo loiro claro e olhos azuis sorrindo animadamente, segurando dois cones de sorvete em uma rua urbana com cores pastéis.

Prompts Recomendados

<lora:illustriousXL_stabilizer_v1.72:0.8>1girl, masterpiece

Parâmetros Recomendados

samplers

Euler a

steps

24 - 25

cfg

3 - 5.5

resolution

1024x1024, 832x1216

other models

illustriousXL_stabilizer_v1.72 (632563d18bb8), illustriousXL_v01 (3e15ba0038), waiNSFWIllustrious_v120 (89cb4ec0a9)

Parâmetros Recomendados para Alta Resolução

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.5

denoising strength

0.25

Dicas

Carregue esta LoRA primeiro na sua pilha de LoRAs para minimizar mudanças inesperadas devido ao peso dinâmico do patch com a arquitetura DoRA.

Use como modelo base ajustado aplicando força total no modelo base pré-treinado para obter os melhores detalhes naturais e controle de estilo.

Tenha cautela ao empilhar com modelos base fortemente estilizados, pois pode degradar os efeitos desejados.

O modelo não pode adicionar detalhes naturais a modelos base fortemente sobreajustados com imagens de estilo AI.

Evite feedback no sistema de avaliação do Civitai; deixe comentários na seção de comentários fornecida para maior visibilidade.

Use LoRAs complementares como Dark, Contrast Controller e Style Strength Controller para ajustes adicionais de ambiente e estilo.

Patrocinadores do Criador

Me encontre no TensorArt

Última atualização:

(7/9/2025) Você pode me encontrar no TensorArt.


Stabilizer

Este é meu modelo base ajustado, mas em forma de LoRA.

Este modelo base ajustado:

  • Foca na criatividade, em vez de um estilo fixo. O conjunto de dados é muito diversificado. Portanto, este modelo não possui um estilo padrão (viés) que limite sua criatividade.

  • Somente texturas naturais, iluminação e detalhes mais finos. Sem estilo plástico de AI. (Mesmas faces AI, estilo de cabelo, superfícies lisas sem textura, etc.). Eu selecionei manualmente todas as imagens no conjunto de dados. Zero imagens AI no conjunto.

  • Imagens menos deformadas. Mais lógicas. Melhor fundo e composição.

  • Melhor compreensão do prompt. Treinado com legendas em linguagem natural.

  • (v-pred) Iluminação melhor e equilibrada, alto contraste. Preto puro 0 e branco 255 podem estar na mesma imagem, até no mesmo local, mas sem transbordamento ou saturação excessiva.

Imagens da capa são as saídas brutas, na resolução padrão de 1MP. Sem upscale, plugins ou correções de inpainting. Contêm metadados, 100% reproduzíveis.

Os estilos nas imagens da capa vêm do modelo base pré-treinado, acionados pelo prompt. Eles não estão no meu conjunto de dados. Você pode ver que o modelo pré-treinado conhece esses estilos, mas não consegue gerá-los adequadamente devido ao sobreajuste em dados de anime. Este modelo resolveu o problema de sobreajuste. Veja a seção "como e por que funciona" abaixo.

Por que não há estilo padrão?

  • O que é "estilo padrão": Se um modelo tem um estilo padrão (viés), significa que não importa o que você solicite, o modelo deve gerar as mesmas coisas (faces, fundos, sensações) que compõem o estilo padrão.

  • Vantagens: É fácil de usar, você não precisará mais indicar o estilo no prompt.

  • Desvantagens: Mas você também não pode sobrepor. Se você solicitar algo que não se encaixa no estilo padrão, o modelo simplesmente o ignorará. Se empilhar mais estilos, o estilo padrão sempre sobrepõe/polui/limita outros estilos.

  • "Sem estilo padrão" significa sem viés, e você precisa especificar o estilo desejado, por tags ou LoRAs. Mas não haverá sobreposição/poluição de estilo deste modelo. Você pode obter o estilo que empilhou exatamente como deveria ser.

Por que este "modelo base ajustado" é uma LoRA?

  • Eu não sou um gigachad e não tenho milhões de imagens de treinamento. Ajustar o modelo base inteiro não é necessário, uma LoRA é suficiente.

  • Posso economizar muita VRAM para usar tamanhos de lotes maiores.

  • Só preciso fazer upload e você só precisa baixar um pequeno arquivo de 40MiB, em vez de um checkpoint enorme de 7GiB, economizando 99,4% em dados e armazenamento. Por isso posso atualizar com frequência.

  • Esta LoRA pode parecer pequena, mas ainda é poderosa. Porque usa a nova arquitetura DoRA da Nvidia, que é mais eficiente que a LoRA tradicional.

Então, como obter este "modelo base ajustado"?

Simples.

modelo base pré-treinado + Esta LoRA = "modelo base ajustado"

Basta carregar esta LoRA no modelo base pré-treinado com força total. Então o modelo base pré-treinado se tornará o modelo base ajustado. Veja abaixo "Como usar".

Compartilhar merges usando este modelo é proibido. Para sua informação, há palavras-chave ocultas para imprimir marca d'água invisível. Eu mesmo codifiquei a marca e o detector. Não quero usar, mas posso.

Este modelo é publicado apenas no Civitai e TensorArt. Se você encontrar "me" e esta frase em outras plataformas, tudo isso é falso e a plataforma que você usa é uma plataforma pirata.

Por favor, deixe feedback na seção de comentários para que todos possam ver. Não escreva feedback no sistema de avaliação do Civitai, é tão mal projetado que ninguém consegue encontrar e ver as avaliações.


Como usar

Últimas versões:

  • nbvp10 v0.271 (treinado no NoobAI v-pred v1.0).

    • Cores precisas e detalhes finos. Este é o melhor modelo até agora.

  • nbep10 v0.273 (treinado no NoobAI eps v1.0). Descontinuado.

    • Menor saturação e contraste em comparação com os modelos v-pred. Devido a uma "pequena falha" no padrão epsilon (eps). Limita o alcance de cores do modelo. Por isso temos o v-pred depois.

  • illus01 v1.198 (treinado no Illustrious v0.1). Descontinuado.

    • Muito antigo...

Nota: carregue esta LoRA primeiro na sua pilha de LoRAs.

Esta LoRA usa uma nova arquitetura chamada DoRA da Nvidia, que é mais eficiente do que a LoRA tradicional. Contudo, ao contrário da LoRA tradicional que tem peso estático, o peso do patch do DoRA é calculado dinamicamente baseado no peso do modelo base carregado no momento (que muda ao carregar LoRAs). Para minimizar mudanças inesperadas, carregue esta LoRA primeiro.

Duas maneiras de usar este modelo:

1). Use como um modelo base ajustado (Recomendado):

Se você deseja os detalhes mais finos e naturais e construir a combinação de estilo que quiser, com controle total.

Basta carregar esta LoRA primeiro no modelo base pré-treinado com força total. Então o modelo base pré-treinado se tornará o modelo base ajustado.

2). Use como uma LoRA em outro modelo base ajustado.

Porque por que não, afinal é uma LoRA.

Coisas para notar:

  • Importante: Se estiver usando o modelo base "illustrious". Você precisa verificar em qual modelo base pré-treinado seu modelo base realmente se baseia. E os modelos "illustrious" de anime mais populares são baseados (ou próximos) no NoobAI, não illustrious. Leia mais (por que esses modelos base são rotulados incorretamente e como testar seu modelo base) em "Discussão". A LoRA precisa corresponder ao modelo base pré-treinado. Base incompatível reduz a qualidade da imagem.

  • Você está prestes a mesclar dois modelos base. Se seu modelo base já tem um estilo padrão muito forte, simplesmente adicionar esta LoRA normalmente não lhe dará o que espera. Você pode precisar equilibrar outros pesos (LoRAs, blocos U-net, etc.).

  • Este modelo não pode adicionar detalhes naturais a modelos base com estilos AI (treinados com imagens AI, você sente que tudo é liso, brilhante, sem textura e parece plástico). Sei que alguns de vocês escolheram este modelo para se livrar dessa suavidade do estilo AI no seu modelo base atual. Infelizmente não vai funcionar, porque o estilo AI é extremamente sobreajustado (você pode aprender isso instantaneamente, como o modelo AI se for treinado com imagens AI). E como imagens AI carecem de detalhes comparado a imagens do mundo real, o modelo também aprendeu a suprimir detalhes. O que é um problema sério. Uma vez que o estilo AI está presente, você não consegue removê-lo.

  • Este modelo não é uma ferramenta mágica que permite empilhar mais LoRAs em um modelo base sem quebrar. Sei que o nome pode ser enganoso.


Por que e como isso funciona:

O problema do sobreajuste:

  • Modelos de anime treinados em imagens de anime. Imagens de anime são simples e contém apenas "conceitos" de nível alto, geralmente abstratos. Não têm fundos, detalhes ou texturas.

  • Queremos que o modelo aprenda apenas os "conceitos" de alto nível. Mas o fato é que o modelo aprende o que vê, não o que queremos.

  • Depois de ver mais de 10 milhões de imagens simples e abstratas de anime, o modelo aprenderá que 1) não precisa gerar detalhes, porque o conjunto de dados nunca o instruíu a isso. 2) Em vez disso, deve gerar imagens simples com conceitos abstratos, mesmo sem entender. Isso leva a imagens deformadas, chamado "sobreajuste".

A solução:

  • Treinar o modelo com imagens de anime e do mundo real. Para que aprenda os conceitos mantendo detalhes e texturas naturais, ou seja, menos sobreajuste.

  • NoobAI fez isso misturando algumas imagens reais de cosplay no conjunto de dados. (se não me engano, os desenvolvedores mencionaram isso em algum lugar)

  • Este modelo vai além, foi treinado em um pouco de tudo: arquitetura, objetos do cotidiano, roupas, paisagens, ... E também com legendas naturais multilíngues, para imitar a configuração original de treino do SDXL.

O resultado:

  • Veja comparações sem (w/o): 1 (estilos de artista), 2 (estilos gerais)

  • Menos sobreajuste, menos imagens deformadas. Mais texturas, iluminações e detalhes naturais. Agora você pode usar milhares de tags de estilos embutidas (Danbooru, tags e621), além de estilos gerais que o SDXL original entende, e obter imagens limpas e detalhadas conforme esperado, sejam 2D, 3D, abstratas ou realistas.

  • Máxima criatividade ainda. Devido ao conjunto diversificado. Não há estilo padrão. Então, não limita a criatividade do modelo pré-treinado nem de outras LoRAs de estilo.


Conjunto de dados

versão mais recente ou versões recentes

~7 mil imagens no total. Não muito grande (comparado a gigachads que amam treinar com milhões de imagens), mas também não pequeno. E cada imagem foi selecionada manualmente por mim.

  • Apenas coisas normais e atraentes. Nada de estilo artístico louco que não possa ser descrito. Sem imagens AI, sem marcas d'água, etc.

  • Apenas imagens em alta resolução. A média de pixels do conjunto é 3,37 MP, cerca de 1800x1800.

  • Todas as imagens têm legendas naturais geradas pela última versão do LLM do Google.

  • Todos os personagens de anime são marcados primeiro com o wd tagger v3 e depois pelo LLM do Google.

  • Contém natureza, ao ar livre, interiores, animais, objetos do dia a dia, muitas coisas, exceto humanos reais.

  • Contém todos os tipos de condições de brilho. Muito escuro, muito claro, muito escuro e muito claro.


Outras ferramentas

Algumas ideias que estavam planejadas para fazer parte do Stabilizer. Agora são LoRAs separadas, para maior flexibilidade. Link da coleção: https://civitai.com/collections/8274233.

Dark: Uma LoRA com viés para ambientes mais escuros. Útil para corrigir o viés de brilho alto em alguns modelos base. Treinada com imagens de baixa luminosidade. Sem viés de estilo, assim sem poluição de estilo.

Contrast Controller: Uma LoRA artesanal. Controla o contraste como um controle deslizante no seu monitor. Diferente de outros "realçadores de contraste" treinados, o efeito desta LoRA é estável, linear matematicamente e sem efeitos colaterais no estilo.

Útil quando seu modelo base tem problema de saturação excessiva ou quando você quer algo realmente colorido.

Exemplo:

Style Strength Controller: Ou redutor do efeito de sobreajuste. Pode reduzir todos os tipos de efeitos de sobreajuste (viés em objetos, brilho, etc.) matematicamente. Ou amplificá-los, se quiser.

Diferenças em relação ao Stabilizer:

  • O Stabilizer foi treinado com dados do mundo real. Só pode "reduzir" efeitos de sobreajuste relacionados à textura, detalhes e fundos, adicionando-os de volta.

  • O Style Controller não foi treinado. É mais como "desfazer" o treinamento do modelo base, para que ele fique menos sobreajustado. Pode matematicamente reduzir todos os efeitos de sobreajuste, como viés no brilho e objetos.


Versões antigas:

Você pode encontrar mais informações no "Log de atualizações". Atenção que versões antigas podem ter efeitos bem diferentes.

Linha do tempo principal:

  • Agora ~: Detalhes naturais e texturas, compreensão estável do prompt e mais criatividade. Não limitado ao estilo puro de anime 2D.

  • illus01 v1.23 / nbep11 0.138 ~: Estilo anime melhor com cores vivas.

  • illus01 v1.3 / nbep11 0.58 ~: Estilo anime melhorado.


Log de atualizações

(31/8/2025) NoobAI ep10 v0.273

Esta versão foi treinada do zero no NoobAI eps v1.0.

Comparado à anterior illus01 v1.198:

  • Brilho melhor e equilibrado em condições extremas. (igual ao nbvp v0.271)

  • Texturas e detalhes melhores. Possui mais passos de treino em timesteps com alto SNR. (versões illus01 pulavam esses timesteps para compatibilidade. Agora que todos os modelos base são NoobAI, não é necessário pular.)

(24/8/2025) NoobAI v-pred v0.271:

Comparado ao v0.264 anterior:

  • Iluminação melhor e equilibrada em condições extremas, menos viés.

  • Alto contraste, preto puro 0 e branco 255 na mesma imagem, até no mesmo lugar, sem transbordamento ou saturação. Agora você pode ter todos de uma vez.

  • (antigo v0.264 tentava limitar a imagem entre 10~250 para evitar transbordamento, mas ainda tinha viés perceptível, tornando a imagem geral muito escura ou clara)

  • Como o v0.264, prefira força alta ou total (0.9~1).

(17/8/2025) NoobAI v-pred v0.264:

  • Primeira versão treinada no NoobAI v-pred.

  • Oferece melhor iluminação, menos transbordamento.

  • Nota: prefira força alta ou total (0.9~1).

(28/7/2025) illus01 v1.198

Principalmente comparado ao v1.185c:

  • Fim da versão "c". Embora "visualmente marcante" seja bom, tinha problemas de compatibilidade. Ex: quando seu modelo base já tem aumento similar de contraste. Empilhar dois aumentos de contraste é muito ruim. Portanto, sem mais efeitos loucos pós-produção (alto contraste e saturação, etc.).

  • Em vez disso, mais texturas e detalhes. Iluminação cinematográfica. Melhor compatibilidade.

  • Esta versão mudou várias coisas, incluindo renovação do conjunto de dados, então o efeito será bem diferente das versões anteriores.

  • Para quem quiser os efeitos loucos do v1.185c, pode encontrar estilos artísticos puros e dedicados nesta página. Se o conjunto de dados for grande o suficiente para uma LoRA, posso treiná-la.

(21/6/2025) illus01 v1.185c:

Comparado ao v1.165c.

  • +100% de nitidez e clareza.

  • -30% de imagens muito caóticas (difíceis de descrever). Então você pode notar que esta versão não oferece mais altos níveis de contraste, mas deve ser mais estável para casos de uso normais.

(10/6/2025): illus01 v1.165c

Esta é uma versão especial. Não é uma melhoria do v1.164. "c" significa "colorido", "criativo", às vezes "caótico".

O conjunto de dados contém imagens muito visualmente marcantes, mas às vezes difíceis de descrever, ex: muito coloridas, alto contraste, condições de iluminação complexas, objetos e padrões complexos por toda parte.

Então você terá "visual marcante", mas às custas do "natural". Pode afetar estilos com cores suaves, etc. Por exemplo, esta versão não gera perfeitamente textura "desenho a lápis" como o v1.164.

(4/6/2025): illus01 v1.164

  • Melhor compreensão do prompt. Agora cada imagem tem 3 legendas naturais, de perspectivas diferentes. Tags Danbooru são verificadas pelo LLM, apenas as importantes são selecionadas e fundidas na legenda natural.

  • Anti-sobreexposição. Adicionado um viés para evitar que a saída do modelo alcance o nível de branco puro #ffffff. Na maioria das vezes, #ffffff equivale a sobreexposição, perdendo muitos detalhes.

  • Alterado algumas configurações de treinamento para maior compatibilidade com NoobAI, tanto e-pred quanto v-pred.

(19/5/2025): illus01 v1.152

  • Continuação de melhorias em iluminação, texturas e detalhes.

  • Mais 5 mil imagens, mais passos de treinamento, resultando em efeito mais forte.

(9/5/2025): nbep11 v0.205:

  • Correção rápida de problemas de brilho e cor no v0.198. Agora não altera brilho e cores de forma tão drástica como uma foto real. v0.198 não é ruim, só criativo demais.

(7/5/2025): nbep11 v0.198:

  • Adicionadas mais imagens escuras. Menos deformações no corpo e fundo em ambientes escuros.

  • Removido realce de cor e contraste, pois não é mais necessário. Use o Contrast Controller.

(25/4/2025): nbep11 v0.172.

  • Mesmas novidades em illus01 v1.93 ~ v1.121. Resumo: novo conjunto "Touching Grass". Melhor textura natural, fundo, iluminação. Efeitos de personagem mais suaves para melhor compatibilidade.

  • Maior precisão e estabilidade de cor. (Comparado ao nbep11 v0.160)

(17/4/2025): illus01 v1.121.

  • Reversão para illustrious v0.1. Versões illustrious v1.0 e posteriores foram treinadas deliberadamente com imagens AI (aproximadamente 30% do conjunto). O que não é ideal para treino de LoRA. Só percebi isso após ler o paper.

  • Efeito do estilo de personagem reduzido. Voltou ao nível do v1.23. Personagens terão menos detalhes com esta LoRA, mas melhor compatibilidade. Um trade-off.

  • Outras características iguais às da versão abaixo (v1.113).

(10/4/2025): illus11 v1.113 ❌.

  • Atualização: use esta versão apenas se souber que seu modelo base é baseado no Illustrious v1.1. Caso contrário, use illus01 v1.121.

  • Treinado no Illustrious v1.1.

  • Novo conjunto "Touching Grass" adicionado. Melhor textura natural, iluminação e efeito de profundidade de campo. Estabilidade estrutural de fundo melhorada. Fundo menos deformado, como salas ou edifícios.

  • Legendas em linguagem natural completas geradas por LLM.

(30/3/2025): illus01 v1.93.

  • v1.72 foi treinado demais. Então reduzi sua força geral para melhorar compatibilidade.

(22/3/2025): nbep11 v0.160.

  • Mesmas características do illus v1.72.

(15/3/2025): illus01 v1.72

  • Mesmo novo conjunto de texturas e iluminação mencionado no ani40z v0.4 abaixo. Mais iluminação natural e texturas naturais.

  • Adicionado pequeno conjunto de aproximadamente 100 imagens focado em aprimoramento de mãos, com diversas tarefas como segurar copos.

  • Removidas todas as imagens com "fundo simples" do conjunto. -200 imagens.

  • Ferramenta de treino mudada de kohya para onetrainer. Arquitetura da LoRA trocada para DoRA.

(4/3/2025) ani40z v0.4

  • Treinado no Animagine XL 4.0 ani40zero.

  • Adicionado conjunto de ~1k imagens focadas em iluminação dinâmica natural e textura do mundo real.

  • Mais iluminação natural e texturas naturais.

ani04 v0.1

  • Versão inicial para Animagine XL 4.0. Principalmente para corrigir problemas de brilho do Animagine 4.0. Melhor contraste e brilho.

illus01 v1.23

nbep11 v0.138

  • Adicionadas algumas imagens furry/não-humanas/outras para equilibrar o conjunto de dados.

nbep11 v0.129

  • versão ruim, efeito muito fraco, ignore-a

nbep11 v0.114

  • Implementado "Cores em alcance total". Equilibra automaticamente as imagens para ficarem "normais e atraentes". Pense nisso como o botão "melhoria automática" da maioria dos editores de foto. Um efeito colateral é que evita alto viés, por exemplo, você querer 95% da imagem preta e 5% clara, em vez de 50/50%.

  • Adicionados dados um pouco mais realistas. Detalhes mais vívidos, iluminação, menos cores chapadas.

illus01 v1.7

nbep11 v0.96

  • Mais imagens de treinamento.

  • Após isso, treinado novamente em um pequeno conjunto "wallpaper" (papéis de parede reais de jogos, de melhor qualidade que encontrei, ~100 imagens). Melhorias em detalhes (perceptíveis em pele e cabelo) e contraste.

nbep11 v0.58

  • Mais imagens. Parâmetros de treino alinhados com os do modelo base NoobAI.

illus01 v1.3

nbep11 v0.30

  • Mais imagens.

nbep11 v0.11: Treinado no NoobAI epsilon pred v1.1.

  • Tags do conjunto de dados melhoradas. Estrutura e distribuição de pesos da LoRA melhoradas. Deve ser mais estável e causar menos impacto na composição da imagem.

illus01 v1.1

  • Treinado no illustriousXL v0.1.

nbep10 v0.10

  • Treinado no NoobAI epsilon pred v1.0.

Anterior
Estudo de Retrato - Companion (ROGER HAUSS)
Próximo
✨ Lazy Embeddings para TODOS os modelos illustrious NoobAI Pony SDXL LazyPositive LazyNegative (Positivo e Negativo mais!) - lazynsfw

Detalhes do Modelo

Tipo de modelo

LORA

Modelo base

Illustrious

Versão do modelo

illus01 v1.72

Hash do modelo

632563d18b

Discussão

Por favor, faça log in para deixar um comentário.