modelos/Stabilizer IL/NAI - illus01 v1.72

Stabilizer IL/NAI - illus01 v1.72

|
9/30/2025
|
1:16:07 PM
| Discussion|
0
Híbrido de ciervo anthro hembra con cabello rojo sosteniendo un gran paraguas verde rasgado, vistiendo un vestido de hojas, de pie en un bosque de coníferas bajo un cielo nublado, aves posadas en sus cuernos en un nido.
Joven mujer kawaii con cabello rubio claro y ojos azules sonriendo emocionada, sosteniendo dos conos de helado en un entorno urbano con colores pastel.

Prompts Recomendados

<lora:illustriousXL_stabilizer_v1.72:0.8>1girl, masterpiece

Parámetros Recomendados

samplers

Euler a

steps

24 - 25

cfg

3 - 5.5

resolution

1024x1024, 832x1216

other models

illustriousXL_stabilizer_v1.72 (632563d18bb8), illustriousXL_v01 (3e15ba0038), waiNSFWIllustrious_v120 (89cb4ec0a9)

Parámetros Recomendados de Alta Resolución

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.5

denoising strength

0.25

Consejos

Carga esta LoRA primero en tu pila de LoRAs para minimizar cambios inesperados debido a pesos dinámicos con arquitectura DoRA.

Usa como modelo base ajustado aplicando fuerza completa sobre el modelo base preentrenado para los mejores detalles naturales y control de estilo.

Ten cuidado al apilarla con modelos base con estilos muy fuertes pues puede degradar los efectos deseados.

El modelo no puede agregar detalles naturales a modelos base muy sobreajustados con imágenes de estilo AI.

Evita dejar comentarios en el sistema de reseñas de Civitai; deja los comentarios en la sección proporcionada para mejor visibilidad.

Usa LoRAs complementarias como Dark, Contrast Controller y Style Strength Controller para ajustes adicionales de ambiente y estilo.

Patrocinadores del Creador

Encuéntrame en TensorArt

Última actualización:

(9/7/2025) Puedes encontrarme en TensorArt.


Stabilizer

Este es mi modelo base ajustado, pero en formato LoRA.

Este modelo base ajustado:

  • Se enfoca en la creatividad, más que en un estilo fijo. El conjunto de datos es muy diverso. Por lo tanto, este modelo no tiene un estilo predeterminado (sesgo) que limite su creatividad.

  • Sólo texturas naturales, iluminación y los más finos detalles. No estilo plástico de IA. (Mismas caras de IA, estilo de cabello, superficies suaves sin textura, etc.). Seleccioné manualmente todas las imágenes del conjunto de datos. Cero imágenes de IA en el conjunto.

  • Menos imágenes deformadas. Más lógico. Mejor fondo y composición.

  • Mejor comprensión del prompt. Entrenado con descripciones en lenguaje natural.

  • (v-pred) Mejor y equilibrada iluminación, alto contraste. Negro puro 0 y blanco 255 pueden estar en la misma imagen, incluso en el mismo lugar, pero sin desbordamientos ni sobresaturación.

Las imágenes de portada son las salidas sin procesar, a resolución predeterminada de 1MP. Sin ampliación, sin plugins, sin correcciones de inpainting. Con metadatos, 100% reproducible.

Los estilos en las imágenes de portada provienen del modelo base preentrenado, activados por el prompt. No están en mi conjunto de datos. Puedes ver que el modelo preentrenado conoce esos estilos, pero simplemente no puede generarlos adecuadamente porque está sobreajustado a datos de anime. Este modelo corrigió el problema de sobreajuste. Ver la sección "cómo y por qué funciona" abajo.

¿Por qué no hay estilo predeterminado?

  • ¿Qué es "estilo predeterminado"?: si un modelo tiene un estilo predeterminado (sesgo), significa que sin importar lo que ingreses en el prompt, el modelo debe generar las mismas cosas (caras, fondos, sensaciones) que forman ese estilo predeterminado.

  • Pros: Es fácil de usar, no tendrás que especificar estilo.

  • Contras: Pero tampoco puedes sobreescribirlo. Si ingresas algo que no encaja en el estilo predeterminado, el modelo simplemente lo ignorará. Si apilas más estilos, el estilo predeterminado siempre se superpondrá/contaminará/limitará a otros estilos.

  • "sin estilo predeterminado" significa sin sesgo, y necesitas especificar el estilo que deseas, mediante etiquetas o LoRAs. Pero no habrá superposición o contaminación de estilos en este modelo. Podrás obtener exactamente el estilo que apilaste.

¿Por qué este "modelo base ajustado" es una LoRA?

  • No soy un gigachad ni tengo millones de imágenes de entrenamiento. Ajustar todo el modelo base no es necesario, una LoRA es suficiente.

  • Puedo ahorrar mucha VRAM para usar tamaños de lote más grandes.

  • Solo tengo que subir, y tú descargar, un pequeño archivo de 40MiB, en lugar de un gran checkpoint de 7GiB, ahorrando el 99.4% de datos y almacenamiento. Así puedo actualizarlo con frecuencia.

  • Esta LoRA puede parecer pequeña, pero sigue siendo potente. Porque utiliza una nueva arquitectura llamada DoRA de Nvidia, más eficiente que la LoRA tradicional.

¿Cómo obtengo este "modelo base ajustado"?

Sencillo.

modelo base preentrenado + esta LoRA = "modelo base ajustado"

Solo carga esta LoRA en el modelo base preentrenado con fuerza completa. Entonces el modelo base preentrenado se convertirá en el modelo base ajustado. Ver más abajo en "Cómo usar".

Prohibido compartir merges usando este modelo. Para tu información, hay palabras clave ocultas para imprimir marca de agua invisible. Yo mismo diseñé la marca de agua y el detector. No deseo usarla, pero puedo hacerlo.

Este modelo solo se publica en Civitai y TensorArt. Si ves "yo" y esta frase en otras plataformas, son falsos y la plataforma que usas es una plataforma pirata.

Por favor deja comentarios en la sección de comentarios. Para que todos puedan verlos. No dejes comentarios en el sistema de reseñas de Civitai, está mal diseñado, literalmente nadie puede encontrar ni ver la reseña.


Cómo usar

Últimas versiones:

  • nbvp10 v0.271 (entrenado en NoobAI v-pred v1.0).

    • Colores precisos y detalles finos. Este es el mejor modelo hasta ahora.

  • nbep10 v0.273 (entrenado en NoobAI eps v1.0). Descontinuado.

    • Menos saturación y contraste comparado con los modelos v-pred. Debido a un "pequeño defecto" en la predicción epsilon estándar (eps). Limita el rango de color del modelo. Por eso tenemos v-pred después.

  • illus01 v1.198 (entrenado en Illustrious v0.1). Descontinuado.

    • Sólo demasiado antiguo...

Nota: carga esta LoRA primero en tu pila de LoRAs.

Esta LoRA utiliza una nueva arquitectura llamada DoRA de Nvidia, que es más eficiente que la LoRA tradicional. Sin embargo, a diferencia de la LoRA tradicional que tiene un peso de parche estático, el peso de parche de DoRA se calcula dinámicamente según el peso del modelo base cargado actualmente (que cambia al cargar LoRAs). Para minimizar cambios inesperados, carga esta LoRA primero.

Dos formas de usar este modelo:

1). Usarlo como modelo base ajustado (Recomendado):

Si deseas los detalles más finos y naturales y construir la combinación de estilos que quieras, con control total.

Solo carga esta LoRA primero en el modelo base preentrenado con fuerza completa. Entonces el modelo base preentrenado se convertirá en el modelo base ajustado.

2). Usarlo como LoRA en otro modelo base ajustado.

Porque, ¿por qué no? Es una LoRA después de todo.

Cosas a tener en cuenta:

  • Importante: Si usas un modelo base "illustrious". Necesitas verificar en qué modelo base preentrenado está basado realmente tu modelo base. Y los modelos base "illustrious" de anime más populares están basados (o cercanos) a NoobAI, no a illustrious. Lee más (por qué esos modelos base están mal etiquetados y cómo probar tu modelo base) en "Discusión". La LoRA debe coincidir con el modelo base preentrenado. Un modelo base que no coincide degradará la calidad de imagen.

  • Estás a punto de combinar dos modelos base. Si tu modelo base ya tiene un estilo predeterminado muy fuerte, simplemente agregar esta LoRA no te dará lo que esperas. Es posible que necesites equilibrar otros pesos (LoRAs, bloques U-net, etc.).

  • Este modelo no puede agregar detalles naturales a modelos base con estilos IA (entrenados con imágenes de IA; puedes notar que todo es liso, brillante, sin textura y parece plástico). Sé que algunos eligen este modelo para eliminar la suavidad del estilo IA en su modelo actual. Desafortunadamente, no funcionará, porque el estilo IA está extremadamente sobreajustado (puedes aprender instantáneamente lo que acabas de hacer, igual que el modelo IA si lo entrenas con imágenes IA). Y debido a que las imágenes IA carecen de detalles comparados con imágenes reales, el modelo también aprendió a sufrir supresión de detalles, lo cual es problemático. Una vez que el estilo IA está ahí, no puedes eliminarlo.

  • Este modelo no es una herramienta mágica que te permita apilar más LoRAs en un modelo base sin romperlo. Sé que el nombre puede ser engañoso.


Por qué y cómo funciona esto:

El problema del sobreajuste:

  • Modelos de anime entrenados con imágenes de anime. Las imágenes de anime son simples y sólo contienen "conceptos" de alto nivel, a menudo muy abstractos. No tienen fondos, detalles ni texturas.

  • Queremos que el modelo solo aprenda "conceptos" de alto nivel. La verdad es que el modelo aprende lo que ve, no lo que quieres.

  • Después de ver más de 10 millones de imágenes abstractas simples de anime, el modelo aprenderá que 1) no necesita generar detalles porque el conjunto de datos nunca se lo indicó. 2) En cambio debe generar imágenes simples con conceptos abstractos aunque no los entienda. Esto conduce a imágenes deformadas, es decir, "sobreajuste".

La solución:

  • Entrenar al modelo con imágenes de anime y del mundo real para que aprenda conceptos manteniendo detalles y texturas naturales, es decir, menos sobreajuste.

  • NoobAI lo hizo mezclando algunas imágenes reales de cosplay en su conjunto. (si no recuerdo mal, sus desarrolladores mencionaron esto en algún lugar)

  • Este modelo va más allá, fue entrenado con un poco de todo: arquitectura, objetos cotidianos, ropa, paisajes, ... Además con subtítulos multilínea en lenguaje natural, para imitar la configuración original de entrenamiento SDXL.

El resultado:

  • Ver comparaciones sin/sin: 1 (estilos artísticos), 2 (estilos generales)

  • Menos sobreajuste, menos imágenes deformadas. Más texturas, iluminaciones y detalles naturales. Ahora puedes usar miles de etiquetas de estilo incorporadas (etiquetas Danbooru, e621), así como estilos generales que entiende SDXL original, y obtener una imagen limpia y detallada como debe ser. No importa si es 2D o 3D, abstracta o realista.

  • Aún máxima creatividad. Debido a la diversidad del conjunto de datos. No hay estilo predeterminado, por lo que no limita la creatividad del modelo preentrenado ni de otras LoRAs de estilo.


Conjunto de datos

versión más reciente o versiones recientes

~7k imágenes en total. No es tan grande (comparado con gigachads que entrenan modelos con millones de imágenes), pero tampoco pequeño. Y cada imagen está seleccionada por mí.

  • Sólo cosas normales y bonitas. Sin estilos artísticos locos que no se puedan describir. Sin imágenes IA, sin marcas de agua, etc.

  • Sólo imágenes de alta resolución. El promedio de píxeles del conjunto es 3.37 MP, ~1800x1800.

  • Todas las imágenes tienen descripciones naturales usando el último LLM de Google.

  • Todos los personajes de anime están etiquetados primero con wd tagger v3 y luego con Google LLM.

  • Contiene naturaleza, exteriores, interiores, animales, objetos diarios, muchas cosas, excepto humanos reales.

  • Incluye todo tipo de condiciones de brillo. Muy oscuro, muy brillante, muy oscuro y muy brillante.


Otras herramientas

Algunas ideas que iban a ser, o fueron parte de Stabilizer. Ahora son LoRAs separadas para mejor flexibilidad. Enlace de colección: https://civitai.com/collections/8274233.

Dark: Una LoRA sesgada hacia entornos más oscuros. Útil para corregir el sesgo de brillo alto en algunos modelos base. Entrenado con imágenes de bajo brillo. Sin sesgos de estilo, sin contaminación de estilo.

Contrast Controller: Una LoRA diseñada manualmente. Controla el contraste como si usaras un deslizador en tu monitor. A diferencia de otros "mejoradores de contraste" entrenados, el efecto de esta LoRA es estable, matemáticamente lineal y sin efectos secundarios en el estilo.

Útil cuando tu modelo base tiene problemas de sobresaturación o quieres algo muy colorido.

Ejemplo:

Style Strength Controller: O reductor de efectos de sobreajuste. Puede reducir todo tipo de efectos de sobreajuste (sesgos en objetos, brillo, etc.), matemáticamente. O ampliarlos, si quieres.

Diferencias con Stabilizer:

  • Stabilizer fue entrenado con datos del mundo real. Solo puede "reducir" efectos de sobreajuste sobre texturas, detalles y fondos, agregándolos de vuelta.

  • Style Controller no fue entrenado. Es más como "deshacer" el entrenamiento del modelo base, por lo que estará menos sobreajustado. Puede reducir matemáticamente todos los efectos de sobreajuste, como sesgos en brillo y objetos.


Versiones antiguas:

Puedes encontrar más info en "Registro de actualizaciones". Ten en cuenta que las versiones antiguas pueden tener efectos muy diferentes.

Línea de tiempo principal:

  • Ahora ~: Detalles y texturas naturales, comprensión estable del prompt y más creatividad. Ya no limitado al estilo anime puro 2D.

  • illus01 v1.23 / nbep11 0.138 ~: Mejor estilo de anime con colores vivos.

  • illus01 v1.3 / nbep11 0.58 ~: Mejor estilo de anime.


Registro de actualizaciones

(31/8/2025) NoobAI ep10 v0.273

Esta versión está entrenada desde el principio con NoobAI eps v1.0.

Comparado con la anterior illus01 v1.198:

  • Mejor y equilibrado brillo en condiciones extremas. (igual que nbvp v0.271)

  • Mejores texturas y detalles. Tiene más pasos de entrenamiento en timesteps con alta relación señal-ruido (SNR). (las versiones illus01 omitían esos timesteps para mejor compatibilidad; ahora todos los modelos base son NoobAI, no es necesario omitirlos.)

(24/8/2025) NoobAI v-pred v0.271:

Comparado con v0.264 anterior:

  • Mejor y equilibrada iluminación en condiciones extremas, menos sesgo.

  • Alto contraste, negro puro 0 y blanco 255 en la misma imagen, incluso en el mismo lugar, sin desbordamientos ni sobresaturación. Ahora puedes tener todos al mismo tiempo.

  • (v0.264 antiguo trataba de limitar la imagen entre 10 y 250 para evitar desbordamientos, pero aún tenía problemas de sesgo, la imagen en general podía quedar demasiado oscura o brillante)

  • Igual que v0.264, prefiere fuerza alta o completa (0.9~1).

(17/8/2025) NoobAI v-pred v0.264:

  • Primera versión entrenada en NoobAI v-pred.

  • Proporciona mejor iluminación, menos desbordamientos.

  • Nota: prefiere fuerza alta o completa (0.9~1).

(28/7/2025) illus01 v1.198

Principalmente comparado con v1.185c:

  • Fin de la versión "c". Aunque "visualmente llamativo" es bueno, tenía problemas de compatibilidad. Por ejemplo, si tu modelo base ya tiene una mejora similar para contraste, apilar dos mejoras de contraste es muy malo. Por lo tanto, no más efectos de postprocesado locos (alto contraste y saturación, etc.).

  • En cambio, más texturas y detalles. Iluminación a nivel cinematográfico. Mejor compatibilidad.

  • Esta versión cambió muchas cosas, incluyendo renovación del conjunto de datos, por lo que el efecto será bastante diferente a versiones anteriores.

  • Para quienes quieran los efectos locos de v1.185c. Puedes encontrar estilos artísticos puros y dedicados en esta página. Si el conjunto de datos es lo suficientemente grande para una LoRA, tal vez entrene una.

(21/6/2025) illus01 v1.185c:

Comparado con v1.165c.

  • +100% limpieza y nitidez.

  • -30% imágenes demasiado caóticas (difíciles de describir). Por lo tanto, esta versión puede que no te dé un nivel de contraste loco, pero será más estable en uso normal.

(10/6/2025): illus01 v1.165c

Versión especial. No es una mejora de v1.164. "c" significa "colorido", "creativo", a veces "caótico".

El conjunto de datos contiene imágenes muy visualmente impactantes, pero a veces difíciles de describir, por ejemplo: muy coloridas, alto contraste, iluminación compleja, objetos y patrones complejos por todas partes.

Así que obtendrás "visualmente impactante", pero a costa de "naturalidad". Puede afectar estilos con colores suaves, etc. Por ejemplo, esta versión no puede generar textura "arte a lápiz" perfectamente como v1.164.

(4/6/2025): illus01 v1.164

  • Mejor comprensión del prompt. Ahora cada imagen tiene 3 descripciones naturales, desde diferentes perspectivas. Las etiquetas Danbooru son verificadas por LLM, solo las importantes son fusionadas en la descripción natural.

  • Anti-sobreexposición. Añadido un sesgo para evitar que la salida del modelo alcance el blanco puro #ffffff. La mayoría de las veces #ffffff == sobreexposición, y se pierden muchos detalles.

  • Cambios en configuraciones de entrenamiento. Más compatible con NoobAI, tanto e-pred como v-pred.

(19/5/2025): illus01 v1.152

  • Continúa mejorando iluminación, texturas y detalles.

  • 5K imágenes más, más pasos de entrenamiento, resultado con efecto más fuerte.

(9/5/2025): nbep11 v0.205:

  • Corrección rápida de problemas de brillo y color en v0.198. Ahora no debería cambiar brillo y colores tan drásticamente como en una fotografía real. v0.198 no es malo, solo creativo, pero demasiado creativo.

(7/5/2025): nbep11 v0.198:

  • Más imágenes oscuras. Menos cuerpos deformados, fondo en ambiente oscuro.

  • Eliminada mejora de color y contraste. Porque ya no es necesaria. Usa Contrast Controller en su lugar.

(25/4/2025): nbep11 v0.172.

  • Las mismas novedades que en illus01 v1.93 ~ v1.121. Resumen: nuevo conjunto de fotos "Touching Grass". Mejor textura natural, fondo e iluminación. Efectos de personaje más suaves para mejor compatibilidad.

  • Mejor precisión y estabilidad de color. (Comparado con nbep11 v0.160)

(17/4/2025): illus01 v1.121.

  • Revertido a illustrious v0.1. illustrious v1.0 y posteriores fueron entrenados con imágenes IA deliberadamente (quizás 30% del conjunto). No es ideal para entrenamiento LoRA. No lo noté hasta leer su paper.

  • Menos efecto de estilo en personajes. Volvió al nivel v1.23. Los personajes tendrán menos detalles con esta LoRA, pero mejor compatibilidad. Es un compromiso.

  • Otras cosas iguales que en v1.113 abajo.

(10/4/2025): illus11 v1.113 ❌.

  • Actualización: usa esta versión solo si sabes que tu modelo base está basado en Illustrious v1.1. Si no, usa illus01 v1.121.

  • Entrenado en Illustrious v1.1.

  • Nuevo conjunto "Touching Grass" añadido. Mejor textura natural, iluminación y efecto de profundidad de campo. Mejor estabilidad estructural de fondo. Menos fondos deformados, como habitaciones o edificios deformados.

  • Subtítulos completos en lenguaje natural por LLM.

(30/3/2025): illus01 v1.93.

  • v1.72 fue entrenado muy intensamente. Así que reduje su fuerza general. Debe tener mejor compatibilidad.

(22/3/2025): nbep11 v0.160.

  • Igual que en illus v1.72.

(15/3/2025): illus01 v1.72

  • Mismo nuevo conjunto de texturas e iluminación como se menciona abajo en ani40z v0.4. Más iluminación natural y texturas naturales.

  • Se añadió un pequeño conjunto de unas ~100 imágenes para mejora de manos, enfocándose en diferentes tareas manuales como sostener un vaso o taza.

  • Se eliminaron todas las imágenes de "fondo simple" del conjunto. -200 imágenes.

  • Cambio de herramiento de entrenamiento de kohya a onetrainer. Cambio de arquitectura LoRA a DoRA.

(4/3/2025) ani40z v0.4

  • Entrenado en Animagine XL 4.0 ani40zero.

  • Añadido conjunto de ~1k imágenes enfocadas en iluminación dinámica natural y texturas del mundo real.

  • Más iluminación natural y texturas naturales.

ani04 v0.1

  • Versión inicial para Animagine XL 4.0. Principalmente para corregir problemas de brillo de Animagine 4.0. Mejor y mayor contraste.

illus01 v1.23

nbep11 v0.138

  • Añadidas algunas imágenes furry/no humanas/otras para balancear el conjunto de datos.

nbep11 v0.129

  • versión mala, efecto demasiado débil, ignóralo

nbep11 v0.114

  • Implementado "Colores de rango completo". Automáticamente balancea las cosas hacia "normal y atractivo". Piensa en esto como el botón de "auto mejora de foto" en la mayoría de herramientas de edición. Un efecto secundario: previene sesgos altos. Por ejemplo, si quieres 95% de la imagen en negro y 5% brillante, en lugar del 50/50.

  • Añadidos datos un poco más realistas. Detalles más vivos, iluminación, menos colores planos.

illus01 v1.7

nbep11 v0.96

  • Más imágenes de entrenamiento.

  • Luego ajuste fino en un pequeño conjunto de "wallpapers" (wallpapers de juegos reales, la mejor calidad que pude encontrar, ~100 imágenes). Más mejoras en detalles (notable en piel, cabello) y contraste.

nbep11 v0.58

  • Más imágenes. Cambié los parámetros de entrenamiento para acercarlos más al modelo base NoobAI.

illus01 v1.3

nbep11 v0.30

  • Más imágenes.

nbep11 v0.11: Entrenado sobre NoobAI epsilon pred v1.1.

  • Etiquetas del conjunto de datos mejoradas. Estructura y distribución de peso LoRA mejoradas. Debe ser más estable y afectar menos la composición de imagen.

illus01 v1.1

  • Entrenado en illustriousXL v0.1.

nbep10 v0.10

  • Entrenado en NoobAI epsilon pred v1.0.

Anterior
Estudio de retrato - Compañero (ROGER HAUSS)
Siguiente
✨ Lazy Embeddings para TODOS los modelos Illustrious NoobAI Pony SDXL LazyPositive LazyNegative (Positivos y Negativos y más) - lazynsfw

Detalles del Modelo

Tipo de modelo

LORA

Modelo base

Illustrious

Versión del modelo

illus01 v1.72

Hash del modelo

632563d18b

Discusión

Por favor log in para dejar un comentario.