modelos/Stabilizer IL/NAI - illus01 v1.198

Stabilizer IL/NAI - illus01 v1.198

|
10/5/2025
|
1:05:28 AM
| Discussion|
0
Un policía agachado acariciando a un gran monstruo cíclope con cabello multicolor en un sendero sombreado del bosque iluminado por la luz solar filtrada.
Primer plano HD detallado de una paloma esponjosa sentada en un nido con plumas alrededor, mirando hacia arriba con ojos brillantes.

Prompts Recomendados

upper body

Parámetros Recomendados

samplers

Euler, Euler a

steps

23 - 31

cfg

4 - 5

resolution

1024x1024, 896x1152

other models

illustriousXLv01_stabilizer_v1.198_1 (28e331428bc0), noobaiXLNAIXL_epsilonPred11Version (6681e8e4b1), illus01_style_collection_elpe_v0.22 (7a21c1c0c77c), noobai_ep10_stabilizer_v0.251_1_fp16 (582bf9ad100e), illustriousXLv01_stable_dark_v0.3 (583a239afed0), illustriousXLv01_stabilizer_v1.200_1 (5982a1c7f4b1), illus01_style_collection_dcr_v0.7 (bbe3bdfa5585)

Consejos

Carga este LoRA primero en tu pila de LoRAs para minimizar cambios inesperados debido a pesos de parche dinámicos con arquitectura DoRA.

Úsalo como modelo base finamente ajustado aplicando fuerza total sobre el modelo base preentrenado para mejores detalles naturales y control de estilo.

Ten precaución al apilar con modelos base con estilos fuertes, ya que puede degradar los efectos deseados.

El modelo no puede agregar detalles naturales a modelos base muy sobreajustados con imágenes de estilo AI.

Evita dejar feedback en el sistema de reseñas de Civitai; deja comentarios en la sección provista para mejor visibilidad.

Usa LoRAs complementarios como Dark, Contrast Controller y Style Strength Controller para ajustes adicionales de ambiente y estilo.

Patrocinadores del Creador

Encuéntrame en TensorArt

Última actualización:

(9/7/2025) Puedes encontrarme en TensorArt.


Stabilizer

Este es mi modelo base finamente ajustado, pero en forma de LoRA.

Este modelo base finamente ajustado:

  • Se enfoca en la creatividad, en lugar de un estilo fijo. El conjunto de datos es muy diverso. Por lo tanto, este modelo no tiene un estilo predeterminado (sesgo) que limite su creatividad.

  • Solo texturas naturales, iluminación y detalles finos. No estilo plástico AI. (Mismas caras AI, estilo de cabello, superficies lisas sin textura, etc.). Seleccioné cuidadosamente cada imagen en el conjunto de datos. Cero imágenes AI en el conjunto de datos.

  • Menos imágenes deformadas. Más lógica. Mejor fondo y composición.

  • Mejor comprensión del prompt. Entrenado con descripciones en lenguaje natural.

  • (v-pred) Mejor iluminación balanceada y alto contraste. Negro puro 0 y blanco 255 pueden estar en la misma imagen, incluso en el mismo lugar, pero sin desbordamientos ni sobresaturación.

Las imágenes de portada son salidas sin procesar, con resolución por defecto de 1MP. Sin reescalado, sin plugins, sin retoques de inpainting. Contienen metadatos, 100% reproducibles.

Los estilos en las imágenes de portada provienen del modelo base preentrenado, activados por el prompt. No están en mi conjunto de datos. Puedes ver que el modelo preentrenado conoce esos estilos, pero no puede generarlos correctamente debido al sobreajuste a datos de anime. Este modelo soluciona el problema de sobreajuste. Ver sección "cómo y por qué funciona" abajo.

¿Por qué no hay estilo predeterminado?

  • ¿Qué es "estilo predeterminado"?: Si un modelo tiene un estilo predeterminado (sesgo), significa que no importa qué prompt des, el modelo debe generar las mismas cosas (caras, fondos, sensaciones) que forman ese estilo predeterminado.

  • Pros: Es fácil de usar, no necesitas especificar el estilo.

  • Contras: No puedes sobrescribirlo tampoco. Si pides algo que no encaja, el modelo lo ignorará. Si superpones estilos, el estilo predeterminado siempre solapará/contaminará/limitará otros estilos.

  • "sin estilo predeterminado" significa sin sesgo, y debes especificar el estilo que quieres, mediante etiquetas o LoRAs. Pero no habrá contaminación ni solapamiento de estilo de este modelo. Obtendrás el estilo exacto que apiles.

¿Por qué este "modelo base finamente ajustado" es un LoRA?

  • No soy un gigachad ni tengo millones de imágenes para entrenar. No es necesario afinar todo el modelo base; un LoRA es suficiente.

  • Puedo ahorrar mucha VRAM para usar tamaños de lote mayores.

  • Sólo tengo que subir, y tú sólo necesitas descargar un archivo pequeño de 40MiB, en lugar de un enorme checkpoint de 7GiB, ahorrando 99.4% de datos y almacenamiento. Así puedo actualizarlo frecuentemente.

  • Este LoRA puede parecer pequeño, pero es potente porque usa la nueva arquitectura DoRA de Nvidia, más eficiente que LoRA tradicional.

¿Cómo obtengo este "modelo base finamente ajustado"?

Sencillo.

modelo base preentrenado + este LoRA = "modelo base finamente ajustado"

Solo carga este LoRA sobre el modelo base preentrenado con fuerza total. Entonces el modelo base preentrenado se convertirá en el finamente ajustado. Ver sección "Cómo usar" abajo.

Está prohibido compartir merges usando este modelo. Para que sepas, hay palabras clave ocultas para imprimir marca de agua invisible. Programé la marca de agua y su detector. No quiero usarlo, pero puedo.

Este modelo solo se publica en Civitai y TensorArt. Si ves "yo" y esta frase en otras plataformas, son falsos y esa plataforma es pirata.

Por favor, deja feedback en la sección de comentarios para que todos lo puedan ver. No escribas feedback en el sistema de reseñas de Civitai, está muy mal diseñado, nadie puede encontrar ni ver las reseñas.


Cómo usar

Últimas versiones:

  • nbvp10 v0.271 (entrenado con NoobAI v-pred v1.0).

    • Colores precisos y detalles finos. Este es el mejor modelo hasta ahora.

  • nbep10 v0.273 (entrenado con NoobAI eps v1.0). Descontinuado.

    • Menos saturación y contraste en comparación con los modelos v-pred. Debido a un "pequeño defecto" en la predicción estándar epsilon (eps). Limita el alcance de colores del modelo. Por eso luego tenemos v-pred.

  • illus01 v1.198 (entrenado con Illustrious v0.1). Descontinuado.

    • Simplemente muy viejo...

Nota: carga este LoRA primero en tu pila de LoRAs.

Este LoRA usa la nueva arquitectura DoRA de Nvidia, más eficiente que LoRA tradicional. Pero a diferencia de LoRA tradicional que tiene un peso de parche estático, el peso del parche de DoRA se calcula dinámicamente según el peso actual del modelo base cargado (que cambia al cargar LoRAs). Para minimizar cambios inesperados, carga este LoRA primero.

Dos formas de usar este modelo:

1). Usarlo como modelo base finamente ajustado (Recomendado):

Si quieres los detalles naturales más finos y construir la combinación de estilos que deseas, con control total.

Solo carga este LoRA primero sobre el modelo base preentrenado con fuerza total. Entonces el modelo base preentrenado se convertirá en el finamente ajustado.

2). Usarlo como LoRA sobre otro modelo base finamente ajustado.

Porque, después de todo, es un LoRA.

Aspectos a considerar:

  • Importante: Si usas un modelo base "illustrious". Debes verificar en qué modelo base preentrenado se basa realmente tu modelo. Y los modelos base "illustrious" de anime más populares están basados (o cercanos) en NoobAI, no en illustrious. Lee más (por qué esos modelos base están mal etiquetados y cómo probar tu modelo base) en "Discusión". El LoRA debe coincidir con el modelo base preentrenado. Una base mal emparejada degradará la calidad de imagen.

  • Vas a combinar dos modelos base. Si tu modelo base ya tiene un estilo predeterminado muy fuerte, añadir este LoRA usualmente no te dará lo esperado. Puede que necesites equilibrar otros pesos (LoRAs, bloques U-net, etc.).

  • Este modelo no puede agregar detalles naturales a modelos base con estilos AI (entrenados con imágenes AI, donde todo se ve liso, brillante, sin textura, plástico). Sé que algunos escogen este modelo para eliminar esa suavidad AI en su base actual. Desafortunadamente no funcionará porque el estilo AI está extremadamente sobreajustado (aprendes instantáneamente lo que hiciste, igual que el modelo AI entrenado con imágenes AI). Además, las imágenes AI carecen de detalles comparadas con imágenes reales, por lo que el modelo aprendió a suprimir detalles. Eso es realmente problemático. Una vez que el estilo AI está allí, no puedes eliminarlo.

  • Este modelo no es una herramienta mágica que te permita apilar más LoRAs sobre un modelo base sin romperlo. Sé que el nombre puede ser engañoso.


Por qué y cómo funciona:

El problema del sobreajuste:

  • Los modelos de anime se entrenan con imágenes de anime. Las imágenes de anime son simples y solo contienen "conceptos" de alto nivel, a menudo muy abstractos. No hay fondos, detalles ni texturas.

  • Queremos que el modelo solo aprenda esos "conceptos" de alto nivel. Pero el hecho es que el modelo aprende lo que ve, no lo que quieres.

  • Después de ver más de 10 millones de imágenes abstractas simples de anime, el modelo aprende que 1) no necesita generar detalles porque nunca se le indicó, 2) debe generar imágenes simples con conceptos abstractos incluso si no los entiende. Esto lleva a imágenes deformadas, es decir, "sobreajuste".

La solución:

  • Entrenar el modelo con imágenes de anime y del mundo real. Así puede aprender conceptos mientras mantiene detalles y texturas naturales, es decir, menos sobreajuste.

  • NoobAI hizo esto mezclando algunas imágenes reales de cosplay en su conjunto de datos. (si recuerdo correctamente, sus desarrolladores mencionaron esto en algún lugar)

  • Este modelo va más allá, se entrenó con de todo un poco: arquitectura, objetos cotidianos, ropa, paisajes, ... También con descripciones naturales multilíneas para imitar el entrenamiento original de SDXL.

El resultado:

  • Ver comparaciones sin y con: 1 (estilos de artista), 2 (estilos generales)

  • Menos sobreajuste, menos imágenes deformadas. Más texturas naturales, iluminación y detalles. Ahora puedes usar miles de etiquetas de estilo integradas (etiquetas Danbooru, e621), así como estilos generales que entiende SDXL original, y obtener imágenes limpias y detalladas como deberían ser. Sin importar si son 2D o 3D, abstractas o realistas.

  • Máxima creatividad. Gracias al conjunto de datos diverso. No hay estilo predeterminado, por lo que no limita la creatividad del modelo preentrenado ni de otros LoRAs de estilo.


Conjunto de datos

versión reciente o últimas versiones

~7k imágenes en total. No es tan grande (comparado con gigachads que afinan modelos con millones de imágenes), pero tampoco pequeño. Y cada imagen fue seleccionada a mano por mí.

  • Sólo cosas normales y bonitas. Nada de estilo artístico loco que no se pueda describir. Sin imágenes AI, sin marcas de agua, etc.

  • Sólo imágenes de alta resolución. El promedio de píxeles es 3.37 MP, ~1800x1800.

  • Todas las imágenes tienen descripciones naturales generadas con el último LLM de Google.

  • Todos los personajes de anime etiquetados primero con wd tagger v3 y luego con LLM de Google.

  • Contiene naturaleza, exteriores, interiores, animales, objetos diarios, muchas cosas, excepto humanos reales.

  • Incluye todo tipo de condiciones de brillo. Muy oscuro, muy brillante, muy oscuro y muy brillante.


Otras herramientas

Algunas ideas que iban a ser, o solían ser, parte de Stabilizer. Ahora son LoRAs separados para mayor flexibilidad. Enlace a la colección: https://civitai.com/collections/8274233.

Dark: Un LoRA sesgado hacia ambientes más oscuros. Útil para corregir el sesgo de brillo alto en algunos modelos base. Entrenado con imágenes de baja iluminación. Sin sesgo de estilo, por lo que no hay contaminación de estilo.

Contrast Controller: Un LoRA hecho a mano. Controla el contraste como si usaras un deslizador en tu monitor. A diferencia de otros "realzadores de contraste" entrenados, el efecto de este LoRA es estable, matemáticamente lineal y sin efectos secundarios en el estilo.

Útil cuando tu modelo base tiene problema de sobresaturación o quieres algo realmente colorido.

Ejemplo:

Style Strength Controller: O reductor de efectos de sobreajuste. Puede reducir todo tipo de efectos de sobreajuste (sesgo en objetos, brillo, etc.) matemáticamente. O amplificarlo, si quieres.

Diferencias con Stabilizer:

  • Stabilizer se entrenó con datos del mundo real. Solo puede "reducir" efectos de sobreajuste en texturas, detalles y fondos, añadiéndolos de vuelta.

  • Style Controller no proviene del entrenamiento. Es más bien "deshacer" el entrenamiento para el modelo base, reduciendo el sobreajuste. Puede reducir matemáticamente todo tipo de efectos de sobreajuste, como sesgos en brillo u objetos.


Versiones antiguas:

Puedes encontrar más información en el "Registro de actualizaciones". Ten en cuenta que las versiones antiguas pueden tener efectos muy diferentes.

Línea principal:

  • Ahora ~: Detalles y texturas naturales, comprensión estable del prompt y más creatividad. Ya no limitado solo al estilo 2D anime puro.

  • illus01 v1.23 / nbep11 0.138 ~: Mejor estilo anime con colores vivos.

  • illus01 v1.3 / nbep11 0.58 ~: Mejor estilo anime.


Registro de actualizaciones

(8/31/2025) NoobAI ep10 v0.273

Esta versión se entrenó desde el inicio en NoobAI eps v1.0.

Comparado con illus01 v1.198 anterior:

  • Mejor y balanceado brillo en condiciones extremas. (igual que nbvp v0.271)

  • Mejores texturas y detalles. Tiene más pasos de entrenamiento en timesteps de alta SNR. (Las versiones illus01 omitieron esos timesteps para mejor compatibilidad. Ahora que todos los modelos base son NoobAI, no es necesario omitirlos.)

(8/24/2025) NoobAI v-pred v0.271:

Comparado con v0.264 anterior:

  • Mejor y balanceada iluminación en condiciones extremas, menos sesgos.

  • Alto contraste, negro puro 0 y blanco 255 en la misma imagen, incluso en el mismo lugar, sin desbordamientos ni sobresaturación. Ahora puedes tenerlos todos a la vez.

  • (La antigua v0.264 intentaba limitar la imagen entre 10~250 para evitar desbordamientos, y aún tenía sesgos visibles, la imagen podía ser demasiado oscura o brillante)

  • Como en v0.264, preferir fuerza alta o total (0.9~1).

(8/17/2025) NoobAI v-pred v0.264:

  • Primera versión entrenada en NoobAI v-pred.

  • Proporciona mejor iluminación, menos desbordamientos.

  • Nota: preferir fuerza alta o total (0.9~1).

(7/28/2025) illus01 v1.198

Principal comparación con v1.185c:

  • Fin de la versión "c". Aunque "visualmente impactante" es buena, tiene problemas de compatibilidad. Ej. cuando tu modelo base ya tiene aumento de contraste similar. Apilar dos mejoras de contraste es muy malo. Por eso, no más efectos extraños (alto contraste y saturación, etc.).

  • En cambio, más texturas y detalles. Iluminación a nivel cinematográfico. Mejor compatibilidad.

  • Esta versión cambió muchas cosas, incluyendo revisión del conjunto de datos, por lo que el efecto es bastante diferente a versiones anteriores.

  • Para quienes quieran los efectos locos de v1.185c, pueden encontrar estilos artísticos puros y dedicados en esta página. Si el conjunto de datos es lo suficientemente grande para un LoRA, podría entrenar uno.

(6/21/2025) illus01 v1.185c:

Comparado con v1.165c.

  • +100% claridad y nitidez.

  • -30% imágenes demasiado caóticas (difíciles de describir). Por eso puede que esta versión ya no dé un nivel de contraste tan alto, pero será más estable en casos normales.

(6/10/2025): illus01 v1.165c

Versión especial. No es una mejora de v1.164. "c" significa "colorido", "creativo", a veces "caótico".

El conjunto de datos contiene imágenes muy impactantes visualmente, pero a veces difíciles de describir, ej.: muy coloridas, alto contraste, condiciones de iluminación complejas, objetos y patrones complejos por todas partes.

Así que obtendrás "impacto visual", pero a costa de "naturalidad". Puede afectar estilos con colores suaves, etc. Ej.: esta versión no genera textura "arte a lápiz" tan bien como v1.164.

(6/4/2025): illus01 v1.164

  • Mejor comprensión del prompt. Ahora cada imagen tiene 3 descripciones naturales desde diferentes perspectivas. Las etiquetas Danbooru son verificadas por LLM, sólo se escogen las etiquetas importantes y se fusionan en la descripción natural.

  • Anti-sobreexposición. Añadido sesgo para prevenir que la salida del modelo alcance el nivel blanco puro #ffffff. La mayoría de las veces #ffffff == sobreexposición, que hace perder muchos detalles.

  • Cambiadas algunas configuraciones de entrenamiento. Más compatible con NoobAI, tanto e-pred como v-pred.

(5/19/2025): illus01 v1.152

  • Continuo mejorando iluminación, texturas y detalles.

  • 5K imágenes adicionales, más pasos de entrenamiento, resultado: efecto más fuerte.

(5/9/2025): nbep11 v0.205:

  • Corrección rápida de problemas de brillo y color en v0.198. Ya no debería cambiar brillo y colores tan drásticamente como una foto real. v0.198 no es mala, solo muy creativa, pero demasiado.

(5/7/2025): nbep11 v0.198:

  • Más imágenes oscuras. Menos deformación en cuerpo y fondo de ambientes oscuros.

  • Quitada mejora de color y contraste, porque ya no es necesaria. Usa Contrast Controller en su lugar.

(4/25/2025): nbep11 v0.172.

  • Mismas novedades en illus01 v1.93 ~ v1.121. Resumen: nuevo conjunto de datos fotográfico "Touching Grass". Mejor textura natural, fondo, iluminación. Menor efecto de personajes para mejor compatibilidad.

  • Mejor precisión y estabilidad de color. (Comparado con nbep11 v0.160)

(4/17/2025): illus01 v1.121.

  • Revertido a illustrious v0.1. Illustrious v1.0 y versiones más nuevas fueron entrenadas deliberadamente con imágenes AI (quizás 30% del conjunto de datos). No es ideal para entrenar LoRA. No lo noté hasta leer su paper.

  • Menor efecto de estilo en personajes. Volviendo al nivel v1.23. Los personajes tendrán menos detalles con este LoRA, pero mejor compatibilidad. Es un compromiso.

  • Otros aspectos igual que en abajo (v1.113).

(4/10/2025): illus11 v1.113 ❌.

  • Actualización: usa esta versión solo si sabes que tu modelo base está basado en Illustrious v1.1. De lo contrario, usa illus01 v1.121.

  • Entrenado sobre Illustrious v1.1.

  • Nuevo conjunto de datos "Touching Grass" añadido. Mejor textura natural, iluminación y efecto de profundidad de campo. Mejor estabilidad estructural del fondo. Menos deformación en fondo, como habitaciones o edificios deformados.

  • Descripciones completas en lenguaje natural generadas por LLM.

(3/30/2025): illus01 v1.93.

  • v1.72 fue entrenado demasiado fuerte. Así que reduje su fuerza general. Ahora debería tener mejor compatibilidad.

(3/22/2025): nbep11 v0.160.

  • Las mismas novedades en illus v1.72.

(3/15/2025): illus01 v1.72

  • Mismo nuevo conjunto de datos de texturas e iluminación naturales mencionado en ani40z v0.4 abajo. Más iluminación natural y texturas naturales.

  • Añadido pequeño conjunto de ~100 imágenes para mejora en manos, enfocándose en tareas como sostener un vaso o taza.

  • Eliminadas todas las imágenes de "fondo simple" del conjunto de datos. -200 imágenes.

  • Cambiada herramienta de entrenamiento de kohya a onetrainer. Cambiada arquitectura LoRA a DoRA.

(3/4/2025) ani40z v0.4

  • Entrenado en Animagine XL 4.0 ani40zero.

  • Añadido conjunto de datos de ~1k imágenes enfocado en iluminación dinámica natural y texturas del mundo real.

  • Más iluminación natural y texturas naturales.

ani04 v0.1

  • Versión inicial para Animagine XL 4.0. Principalmente para arreglar problemas de brillo en Animagine 4.0. Mejor contraste y brillo.

illus01 v1.23

nbep11 v0.138

  • Añadidas algunas imágenes de animales peludos/no humanos/otros para equilibrar el conjunto de datos.

nbep11 v0.129

  • Mala versión, el efecto es muy débil, ignórala.

nbep11 v0.114

  • Implementado "Colores de rango completo". Automáticamente balancea las cosas hacia "normal y bonito". Piensa en esto como el botón de "auto mejora con un clic" en la mayoría de las herramientas de edición fotográfica. Una desventaja de esta optimización: previene sesgos altos. Por ejemplo, quieres que 95% de la imagen sea negra y 5% brillante, en lugar de 50/50%.

  • Añadidos datos un poco más realistas. Detalles, iluminación más vivos, menos colores planos.

illus01 v1.7

nbep11 v0.96

  • MÁS imágenes de entrenamiento.

  • Luego afinado de nuevo en un pequeño conjunto de "wallpapers" (wallpapers reales de juegos, la mejor calidad que pude encontrar, ~100 imágenes). Mejoras en detalles (notables en piel y cabello) y contraste.

nbep11 v0.58

  • Más imágenes. Cambiados parámetros de entrenamiento para acercarse más al modelo base NoobAI.

illus01 v1.3

nbep11 v0.30

  • Más imágenes.

nbep11 v0.11: Entrenado en NoobAI epsilon pred v1.1.

  • Mejoradas etiquetas del conjunto de datos. Mejorada estructura y distribución de pesos del LoRA. Debe ser más estable y afectar menos la composición de la imagen.

illus01 v1.1

  • Entrenado sobre illustriousXL v0.1.

nbep10 v0.10

  • Entrenado en NoobAI epsilon pred v1.0.

Anterior
Elfo de sangre (World of Warcraft) - v1.0
Siguiente
Velvet's Mythic Fantasy Styles | Flux + Pony + illustrious - illustrious Dark Lines

Detalles del Modelo

Tipo de modelo

LORA

Modelo base

Illustrious

Versión del modelo

illus01 v1.198

Hash del modelo

c502b406ef

Discusión

Por favor log in para dejar un comentario.