modelos/Stabilizer IL/NAI - ani40 v0.1

Stabilizer IL/NAI - ani40 v0.1

12/17/2025

12:56:19 AM

Palabras Clave y Etiquetas Relacionadas

ani40 v0.1,arquitectura dora,modelo base ajustado,illus01,iluminación,lora,detalles naturales,noobai,reakaakasky,sdxl 1.0,estabilizador,stabilizer il/nai,estilo,textura,v-pred

Una ilustración hiperrealista al estilo Moebius que muestra una gran libélula robótica azul con acentos rojos y cabina visible en un paisaje desértico, frente a un astronauta con traje espacial, con una luna saliendo y montañas al fondo.

Una ciudad futurista sci-fi estilo Moebius con altos rascacielos metálicos, máquinas voladoras y una mujer solitaria con largo cabello jengibre caminando por un pasillo de puente.

Prompts Recomendados

<lora:ani40_stabilizer_v0.1:0.8>1girl, fox ears, upper body, masterpiece, best quality, high score, great score, [Trained by reakaakasky @civitai.com/user/reakaakasky and only published on civitai::0]

Parámetros Recomendados

samplers

Euler a, Euler

steps

24 - 44

cfg

3 - 6

resolution

1216x832, 832x1216

other models

ani40_stabilizer_v0.1 (919cea897bb1), animagineXL40_v40 (1d5b43ff75)

Parámetros Recomendados de Alta Resolución

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.5

denoising strength

0.2

Consejos

Carga primero el LoRA Stabilizer en tu pila de LoRAs para minimizar cambios inesperados de peso debido a la arquitectura dinámica de DoRA.

Úsalo como un modelo base ajustado sobre modelos base preentrenados (NoobAI v-pred v1.0 o NoobAI eps v1.0) para el mejor detalle natural y control de estilo.

Evita fusionar el LoRA Stabilizer con otros modelos base ajustados que ya tengan contaminación de estilo AI o sobreajuste para prevenir resultados indeseados.

Este LoRA no es un LoRA de estilo; no proporciona sesgo de estilo por defecto, por lo que especifica el estilo mediante etiquetas u otros LoRAs para guiar el modelo.

Cuidado con modelos base falsos que podrían tener fusionado este LoRA dos veces, causando degradación del modelo y comportamientos inesperados.

Usa LoRAs especializados como Dark, Contrast Controller, y Style Strength Controller del mismo autor para efectos y controles adicionales en la imagen.

Patrocinadores del Creador

Prueba el nuevo modelo Lumina 2 con avanzada arquitectura DiT, solo 2 mil millones de parámetros, tamaño eficiente de modelo y codificador de texto superior (Google Gemma 2) que soporta múltiples idiomas.

"Paquete de mejora" LoRA del autor
Accede a los modelos Lumina 2 en línea en TensorArt sin necesidad de configuración local.
Aceleración de hardware y optimizaciones: Guía de Torch compile y modo FP16, TeaCache, Lightning LoRA, Modelo base FP8 escalado.

Las imágenes de portada son salidas directas del modelo preentrenado, a resolución de 1MP. Lo que ves es lo que obtienes. No hay mejora de escala, ni correcciones de manos/rostros por inpainting, ni siquiera prompt negativo.

(21/10/2025): Es momento de mirar hacia adelante...

Este modelo no se actualizará activamente. SDXL ya es muy ... antiguo, fue lanzado hace dos años (junio 2023).

¿Por qué no probar modelos nuevos? Tienen arquitectura más reciente, mejor desempeño y pueden ser más eficientes. Por ejemplo: Lumina 2. Si acabas de oír sobre Lumina 2, información rápida:

Lanzado en enero de 2025. Código abierto. Licencia Apache 2.0.
Arquitectura DiT (la más popular actualmente, misma que Flux.1, etc.).
Pequeño y eficiente. Solo 2 mil millones de parámetros. Modelo completo (fp16) de 5GB, modelo Q8 solo 2.5GB, lo que permite cargarlo y ejecutarlo incluso en una gtx1050 sin pérdida de calidad.
Usa el mismo VAE Flux 16ch, matemáticamente 4 veces mejor que el VAE SDXL 4ch.
Utiliza Google Gemma 2 2b como codificador de texto (sí, también un LLM funcional para chat). 10 veces mejor que los antiguos CLIPs en SDXL que solo entienden etiquetas. Como LLM para chat, entiende casi todo... inglés, chino, japonés, errores tipográficos, jerga, poesías... Por ejemplo, puedes hacerlo simplemente dándole un prompt: (Nota: esta es una imagen, no cuatro, ve la imagen y el prompt completos aquí, idea que proviene de aquí).

x1_out_-euler_cfg_pp-1.0-30-2025-10-19 21-00-09-2101.webp He entrenado un LoRA "Paquete de mejora". Nombre cambiado, menos confuso, pero el conjunto de datos es el mismo.

Además, no creo que Civitai soporte Lumina 2. También subí el modelo a TensorArt. Puedes encontrarme en aquí. Y probar los modelos Lumina 2 en línea si no tienes configuración local.

Enlaces útiles:

Modelos:

Neta Lumina: modelo base, modelo ajustado estilo anime entrenado en los conjuntos de datos danbooru y e621.
NetaYume Lumina: modelo base, ajuste adicional con el conjunto de datos más reciente.

Optimizaciones:

Aceleraciones de hardware: torch.compile para GPU más nuevas (rtx 3xxx y posteriores), 30% más rápido. Activar modo fp16 para GPU antiguas que no soportan bf16 (rtx 2xxx y anteriores), 3 veces más rápido, porque por defecto GPU antiguas usan fp32, que es extremadamente lento. https://civitai.com/articles/22251
TeaCache: https://github.com/spawner1145/CUI-Lumina2-TeaCache
Lightning LoRA, 2 veces más rápido (experimental): https://civitai.com/models/2115586
Modelo base escalado fp8 (DiT+TE), solo 3GB: https://civitai.com/models/2023440

Stabilizer

¿Qué es?

Un modelo ajustado a escala media con 7k imágenes.

Muchos subconjuntos especializados, como ropa en primer plano, manos, iluminación ambiente compleja, artes tradicionales...
Solo texturas naturales, iluminación y detalles más finos. Nada de estilo plástico o brillante de IA. Porque no hay imágenes AI en el conjunto de datos. Seleccioné cada imagen manualmente. No soy fan de entrenar con imágenes AI. Es como jugar al "teléfono descompuesto"; entrenar IA con imágenes IA solo causa pérdida de información en las imágenes, haciendo que se vean peor (plástico, brillante).
Mejor comprensión de prompts. Entrenado con descripciones en lenguaje natural.
Enfoque en creatividad, más que en estilo fijo. El conjunto es muy diverso. Así que este modelo no tiene un estilo por defecto (sesgo) que limite su creatividad.
(v-pred) Mejor iluminación equilibrada, sin desbordes ni sobresaturación. ¿Quieres negro puro 0 y blanco puro 255 en la misma imagen, incluso en el mismo lugar? No hay problema.

¿Por qué no tiene estilo por defecto?

¿Qué es "estilo por defecto"?: Si un modelo tiene un estilo por defecto (sesgo), significa que no importa qué prompts des, el modelo generará siempre lo mismo (rostros, fondos, sensaciones) que conforman ese estilo por defecto.
Pros: Es fácil de usar, no necesitas indicar el estilo en el prompt.
Contras: Pero tampoco puedes sobrescribirlo. Si pones un prompt que no encaja con el estilo por defecto, el modelo lo ignorará. Si apilas más estilos, el estilo por defecto siempre se superpondrá / contaminará / limitará a los demás estilos.
"Sin estilo por defecto" significa sin sesgo, y necesitas especificar el estilo que quieres para guiar el modelo, mediante etiquetas o LoRAs. Pero no habrá superposición ni contaminación de estilos desde este modelo. Puedes obtener exactamente el estilo apilado que deseas.

Efectos:

Ahora el modelo puede generar con precisión el estilo que indicastes, en lugar de una imagen anime sobre simplificada. Sin superposición o cambio de estilos, sin rostros AI, solo mejores detalles. Mira la comparación:
- https://civitai.com/images/84145167 (estilos generales)
- https://civitai.com/images/84256995 (estilos de artista, notar el rostro)
Si quieres saber qué es "cambio de estilo y rostros AI". Mira:
- este modelo: https://civitai.com/images/107381516
- otro modelo: https://civitai.com/images/107647042. rostro femenino y fondo terriblemente brillante.
Ve más gráficos xy en las imágenes de portada. Un gráfico xy vale más que mil palabras.

¿Por qué este "modelo base ajustado" es un LoRA?

No soy un gigachad ni tengo millones de imágenes para entrenar. Ajustar todo el modelo base no es necesario, un LoRA es suficiente.
Solo tienes que cargar, y tú solo necesitas descargar, un pequeño archivo de 40MiB, en lugar de un checkpoint enorme de 7GiB, ahorrando 99.4% en datos y almacenamiento. ~~Así que puedo actualizarlo sin parar~~.
Este LoRA puede parecer pequeño, pero es potente. Porque usa una nueva arquitectura llamada DoRA de Nvidia, que es más eficiente que LoRA tradicional.

¿Entonces cómo obtengo este "modelo base ajustado"?

Carga este LoRA sobre el modelo base preentrenado con fuerza completa. Entonces el modelo base preentrenado se transformará en el modelo base ajustado. Ver más abajo "Cómo usar".

Está prohibido compartir fusiones usando este modelo. Para tu info, hay palabras clave ocultas para imprimir una marca de agua invisible. Yo mismo programé la marca de agua y el detector. No quiero usarlo, pero puedo.

Este modelo solo se publica en Civitai y TensorArt. Si ves "yo" y esta frase en otras plataformas, todas son falsas y la plataforma que usas es pirata.

Por favor, deja retroalimentación en la sección de comentarios. Para que todos la vean. No escribas retroalimentación en el sistema de reseñas de Civitai, está mal diseñado, nadie puede encontrar ni ver las reseñas.

Cómo usar

Versiones:

nbvp10 (para NoobAI v-pred v1.0).
- Colores precisos y detalles nítidos.
nbep10 (para NoobAI eps v1.0).
- Menos saturación y contraste comparado con modelos v-pred. La predicción estándar epsilon (eps) limita al modelo para alcanzar un rango de colores más amplio. Por eso existe v-pred.
illus01 (entrenado con Illustrious v0.1, pero aún se recomienda NoobAI eps v1.0).
- Si usas este modelo sobre otro modelo base ajustado, ten en cuenta que la mayoría (90%) de bases anime etiquetadas como "illustrious" actualmente son en realidad NoobAI (o principalmente). Recomiendo probar ambas versiones (illus01 y nbep10) para ver cuál es mejor.

Carga este LoRA primero en tu pila de LoRA.

Este LoRA usa una nueva arquitectura llamada DoRA de Nvidia, más eficiente que LoRA tradicional. Sin embargo, a diferencia de LoRA tradicional que tiene un peso de parche estático, el peso de parche en DoRA se calcula dinámicamente basándose en el peso del modelo base cargado actualmente (que cambia al cargar LoRAs). Para minimizar cambios inesperados, carga este LoRA primero.

Dos formas de usar este modelo:

1). Usarlo como un modelo base ajustado (Recomendado):

Si quieres los detalles y texturas más finos y construir la combinación de estilos que desees, con control total.

Aplica el LoRA encima del modelo base preentrenado. Nota: modelo preentrenado significa el modelo original, sin ajuste adicional. Ejemplo: NoobAI v-pred v1.0, NoobAI eps v1.0

2). Usarlo como LoRA sobre otro modelo base ajustado.

Después de todo, es un LoRA.

Pero cuidado:

Este no es un LoRA de estilo, literalmente vas a fusionar dos modelos base. El resultado no siempre será el esperado.
No funciona en modelos sobre fusionados hyperbebop 1girl contaminados con estilo IA sobreajustados 50 versiones de Nova furry 3D anime WAI o similares. Este modelo no puede corregir estilos AI brillantes y plásticos. Usa un modelo base preentrenado si quieres eliminar el estilo AI.
Esto es lo que debería ser Craft Lawrence (de Spice and Wolf), si viste el anime: https://civitai.com/images/107381516
Esto es lo que genera ese modelo contaminado con estilo AI sobreajustado: https://civitai.com/images/107647042

Preguntas frecuentes (FAQ):

Las imágenes de portada son salidas sin procesar del modelo preentrenado, a resolución de 1MP. No hay plugin mágico, ni aumento de escala, ni corrección de manos/rostros por inpainting, ni siquiera prompt negativo. Algunos usuarios dicen que no pueden reproducir los resultados, eso es cuestión de habilidad. (Modelo base no coincidente o demasiadas "optimizaciones" añadidas)

Si destruye tu modelo base incluso a baja fuerza (ej. <0.5), ese es problema de tu modelo base. Tu modelo base ya tiene fusionado este LoRA (y lo fusionaste dos veces). Los pesos del modelo se multiplicaron y colapsaron. Cuidado con creadores de modelos base falsos, también conocidos como ladrones. Algunos "creadores" nunca entrenan, solo toman modelos de otros, los fusionan, borran metadatos y créditos, y los venden como propios.

Otras herramientas

Algunas ideas que iban a ser o fueron parte de Stabilizer. Ahora son LoRAs separados para mayor flexibilidad. Link de colección: https://civitai.com/collections/8274233.

Dark: Un LoRA sesgado hacia entornos más oscuros. Útil para corregir el sesgo de brillo alto en algunos modelos base. Entrenado con imágenes de baja luminosidad. Sin sesgo de estilo, sin contaminación de estilo.

Contrast Controller: Un LoRA hecho a mano. Controla el contraste como si usaras un deslizador en tu monitor. A diferencia de otros "mejoradores de contraste" entrenados, el efecto de este LoRA es estable, matemáticamente lineal, y no afecta al estilo.

Útil cuando tu modelo base tiene problemas de sobresaturación, o quieres algo muy colorido.

Ejemplo:

Style Strength Controller: O reductor de efecto de sobreajuste. Puede reducir todo tipo de efectos de sobreajuste (sesgo en objetos, brillo, etc.), matemáticamente. O amplificarlo, si quieres.

Diferencias con Stabilizer:

Stabilizer fue entrenado con datos del mundo real. Solo puede "reducir" efectos de sobreajuste en textura, detalles y fondos, añadiéndolos de nuevo.
Style Controller no proviene de entrenamiento. Más bien "deshace" el entrenamiento para el modelo base, haciéndolo menos sobreajustado. Puede reducir matemáticamente todos los efectos de sobreajuste, como sesgos en brillo, objetos.

Versiones antiguas:

Puedes encontrar más info en "Registro de actualizaciones". Ten en cuenta que las versiones antiguas pueden tener efectos muy diferentes.

Línea temporal principal:

Ahora ~: Detalles y texturas naturales, comprensión estable de los prompts y más creatividad. Ya no limitado al estilo anime 2D puro.
illus01 v1.23 / nbep11 0.138 ~: Mejor estilo anime con colores vivos.
illus01 v1.3 / nbep11 0.58 ~: Mejor estilo anime.

Registro de actualizaciones

(21/10/2025): Noobai v-pred v0.280a

Versión especial, "a" significa anime. Hay un estilo anime 2D por defecto. Por lo que debería ser más fácil de usar si no quieres indicar estilos. También el conjunto de datos cambió mucho, el efecto puede ser bastante diferente de versiones anteriores.

(31/8/2025) NoobAI ep10 v0.273

Esta versión fue entrenada desde el inicio con NoobAI eps v1.0.

Comparado con la versión anterior illus01 v1.198:

Mejor y equilibrada luminosidad en condiciones extremas. (igual que nbvp v0.271)
Mejores texturas y detalles. Más pasos de entrenamiento en momentos de alto SNR. (las versiones illus01 omitían esos momentos para mejor compatibilidad. Ahora todos los modelos base son NoobAI, no es necesario omitirlos.)

(24/8/2025) NoobAI v-pred v0.271:

Comparado con la versión anterior v0.264:

Mejor y equilibrada iluminación en condiciones extremas, menos sesgo.
Alto contraste, negro puro 0 y blanco 255 en la misma imagen, incluso en el mismo lugar, sin desbordes ni sobresaturación. Ahora puedes tenerlos todos a la vez.
(la antigua v0.264 intentaba limitar la imagen entre 10~250 para evitar desbordes, y aún tenía problemas de sesgo, la imagen global podía estar muy oscura o brillante)
Igual que v0.264, prefieren fuerza alta o total (0.9~1).

(17/8/2025) NoobAI v-pred v0.264:

Primera versión entrenada en NoobAI v-pred.
Brinda mejor iluminación, menos desbordes.
Nota: prefieren fuerza alta o total (0.9~1).

(28/7/2025) illus01 v1.198

Principalmente comparado con v1.185c:

Fin de la versión "c". Aunque "visualmente impactante" es bueno, pero tiene problemas de compatibilidad. Ej.: cuando tu modelo base ya tiene mejora de contraste similar. Apilar dos mejoras de contraste es muy malo. Por eso, no más efectos post locos (alto contraste y saturación, etc.).
En su lugar, más texturas y detalles. Iluminación a nivel cinematográfico. Mejor compatibilidad.
Esta versión cambió muchas cosas, incluyendo revisión del conjunto de datos, así que el efecto será bastante diferente a versiones anteriores.
Para quien quiera los efectos locos de v1.185c de vuelta, puede encontrar estilos artísticos puros y dedicados en esta página. Si el conjunto de datos es lo suficientemente grande para un LoRA, podría entrenar uno.

(21/6/2025) illus01 v1.185c:

Comparado con v1.165c.

+100% claridad y nitidez.
-30% imágenes demasiado caóticas (difíciles de describir). Por lo que puede que esta versión ya no genere niveles de contraste tan altos, pero será más estable en casos normales.

(10/6/2025): illus01 v1.165c

Versión especial. No es una mejora de v1.164. La "c" significa "colorido", "creativo", a veces "caótico".

El conjunto contiene imágenes muy visual y llamativas, pero en ocasiones difíciles de describir, ej.: muy coloridas, alto contraste, iluminación compleja, objetos y patrones complejos por todas partes.

Por eso obtienes "impacto visual", pero a costa de "naturalidad". Puede afectar estilos con colores suaves, etc. Ejemplo: esta versión no puede generar perfectamente textura de "arte a lápiz" como la v1.164.

(4/6/2025): illus01 v1.164

Mejor comprensión del prompt. Ahora cada imagen tiene 3 descripciones en lenguaje natural, desde diferentes perspectivas. Las etiquetas danbooru son revisadas con LLM, solo se seleccionan las importantes y se combinan en la descripción natural.
Anti sobreexposición. Se añadió un sesgo para evitar que la salida del modelo alcance el nivel #ffffff blanco puro. La mayoría de veces #ffffff implica sobreexposición y pérdida de detalles.
Cambiaron algunos ajustes de entrenamiento. Lo hacen más compatible con NoobAI, tanto e-pred como v-pred.

(19/5/2025): illus01 v1.152

Continúa mejorando iluminación, texturas y detalles.
5,000 imágenes más, más pasos de entrenamiento, resultando en un efecto más fuerte.

(9/5/2025): nbep11 v0.205:

Corrección rápida de brillo y problemas de color en v0.198. Ahora no debería cambiar dramáticamente brillo y colores como una foto real. v0.198 no está mal, solo muy creativo.

(7/5/2025): nbep11 v0.198:

Más imágenes oscuras. Menos cuerpos deformados, fondos en entornos oscuros.
Eliminada la mejora de color y contraste. Ya no es necesaria. Usa Contrast Controller en su lugar.

(25/4/2025): nbep11 v0.172.

Las mismas novedades en illus01 v1.93 ~ v1.121. Resumen: nuevo conjunto de datos fotográfico "Touching Grass". Mejor textura natural, fondo, iluminación. Menor efecto en personajes para mejor compatibilidad.
Mejor precisión y estabilidad de color. (Comparado con nbep11 v0.160)

(17/4/2025): illus01 v1.121.

Regresó a illustrious v0.1. La v1.0 y versiones superiores fueron entrenadas deliberadamente con imágenes AI (quizá 30% del conjunto). Lo que no es ideal para entrenamiento LoRA. No me di cuenta hasta leer su paper.
Menor efecto de estilo en personajes. Regresa al nivel v1.23. Los personajes tendrán menos detalles de este LoRA, pero mejor compatibilidad. Es un compromiso.
El resto igual que v1.113 abajo.

(10/4/2025): illus11 v1.113 ❌.

Actualización: usa esta versión solo si sabes que tu modelo base se basa en Illustrious v1.1. De lo contrario, usa illus01 v1.121.

Entrenado en Illustrious v1.1.
Agregado nuevo conjunto "Touching Grass". Mejor textura natural, iluminación y efecto profundidad de campo. Mejor estabilidad estructural en fondos. Menos fondos deformados, como habitaciones o edificios deformados.
Descripciones completas en lenguaje natural generadas por LLM.

(30/3/2025): illus01 v1.93.

v1.72 fue entrenado demasiado intensamente. Así que reduje su fuerza general. Debería tener mejor compatibilidad.

(22/3/2025): nbep11 v0.160.

Lo mismo que en illus v1.72.

(15/3/2025): illus01 v1.72

Mismo nuevo conjunto de texturas e iluminación mencionado en ani40z v0.4 abajo. Más iluminación natural y texturas naturales.
Agregado pequeño conjunto de ~100 imágenes para mejora de manos, enfocándose en manos con diversas tareas, como sostener un vaso o taza o algo.
Eliminadas todas las imágenes con "fondo simple" del conjunto. -200 imágenes.
Cambiada herramienta de entrenamiento de kohya a onetrainer. Cambiada arquitectura LoRA a DoRA.

(4/3/2025) ani40z v0.4

Entrenado con Animagine XL 4.0 ani40zero.
Agregado conjunto de ~1k imágenes enfocado en iluminación dinámica natural y textura del mundo real.
Más iluminación natural y texturas naturales.

ani04 v0.1

Versión inicial para Animagine XL 4.0. Principalmente para corregir problemas de brillo en Animagine 4.0. Mejor contraste y mayor contraste.

illus01 v1.23

nbep11 v0.138

Agregadas algunas imágenes furry/no humano/otras para balancear el conjunto de datos.

~~nbep11 v0.129~~

mala versión, efecto muy débil, ignora esta.

nbep11 v0.114

Implementado "Colores de rango completo". Balancea automáticamente hacia "normal y atractivo". Piensa en esto como el botón "auto mejorar foto" de la mayoría de editores de fotos. Un inconveniente: previene altos sesgos. Por ejemplo, si quieres que el 95% de la imagen sea negra y 5% brillante, en lugar de 50/50.
Agregado un poco de datos realistas. Detalles más vivos, iluminación, colores menos planos.

illus01 v1.7

nbep11 v0.96

Más imágenes de entrenamiento.
Luego ajustado de nuevo con pequeño conjunto "wallpaper" (fondos de pantalla de juegos reales, la más alta calidad que pude encontrar, ~100 imágenes). Más mejoras en detalles (notable en piel, cabello) y contraste.

nbep11 v0.58

Más imágenes. Cambiado parámetros de entrenamiento para acercarse al modelo base NoobAI.

illus01 v1.3

nbep11 v0.30

Más imágenes.

nbep11 v0.11: entrenado con NoobAI epsilon pred v1.1.

Etiquetas del conjunto mejoradas. Estructura y distribución de pesos LoRA mejoradas. Debería ser más estable y afectar menos a la composición de imagen.

illus01 v1.1