DMD2 | ESCALA CFG 1 | Menos Pasos - V5 | DTLVVTT_DMD2 (LITE)
Palabras Clave y Etiquetas Relacionadas
Prompts Recomendados
hdr
by 96yottea, by porforever, by potg \(piotegu\), film grain, black background, 1girl, jane doe \(zenless zone zero\), solo, dark hair, red hand, finger to mouth, simple background, blood hand, thick eyelashes, bags under eyes, black eyeshadow, pale skin, long fingers, from side, masterpiece, best quality, sideways glance, looking at viewer, mouse ears, black lips, bandaid on nose, half-closed eyes, amazing quality, highres, (smirk:1.1), very aesthetic, hand up
Prompts Negativos Recomendados
flat color
bad quality, worst quality, worst detail, sketch, censor, patreon username, patreon logo, watermark, artist name, signature, logo, anatomical nonsense, bad anatomy, ugly, worst aesthetic, old, mismatched pupils, dirty face, extra limbs, bad hands, bad fingers, text, normal quality, low quality, web address, email address
Parámetros Recomendados
samplers
steps
cfg
resolution
other models
Consejos
Aumenta la fuerza del LoRA o añade prompts positivos como "hdr" para mejorar iluminación y detalles si se necesitan más pasos.
Usa prompts negativos como "flat color" para controlar saturación y sombras.
Reduce la fuerza del LoRA para usar escalas CFG más altas sin sobresaturar la imagen.
Experimenta con fuerza y escala CFG para encontrar el equilibrio óptimo.
Aspectos Destacados de la Versión
DTLVVTT_DMD2
Extraído de Velvette-XL_V1.1 (versión eliminada) como un LoRA (162 MB), luego fusionado en una base DMD2. Esta versión mantiene el efecto característico de reducción de pasos de DMD2 siendo más ligera, estable y fácil de usar.
Mientras que Matched opera a plena potencia (100%) explorando checkpoints para recuperar estilos incrustados — haciendo de él una herramienta más técnica que requiere prompts precisos — VVTT_DMD2 funciona aproximadamente al 70% de esa potencia. Es más suave, fácil de controlar y funciona bien incluso a fuerza 1 sin necesidad de prompts finamente ajustados.
Lo mejor: puedes usarlo solo para simplicidad, o combinarlo con Matched para añadir detalles extra. En resumen, VVTT_DMD2 es la opción más versátil si prefieres no complicarte con los prompts.
Hola, probablemente te preguntes: ¿por qué tantas versiones?
Bueno… yo también me lo preguntaría si estuviera en tu lugar. La razón es simple: está diseñado así para ofrecer más control, ya que, a diferencia de los LoRA normales, DMD2 funciona mejor en su máxima potencia.
Por ejemplo:
HD 1 Escala CFG tiene una fuerza “diluida”, por lo que necesita la ayuda de triggers o incrementar manualmente la fuerza del LoRA. Esto lo hace muy útil para combinar con PDXL LoRAs en Illustrious, ya que puedes simplemente aumentar la fuerza sin perder detalles.
DPM A1 y DPM A15 ya cuentan con fuerza y detalle potenciados, por lo que no requieren triggers. A1 es la fuerza estándar, mientras que A15 añade un extra del +15%.
V4 es un experimento para generar imágenes en 2 pasos. Fue creado de manera opuesta al HD 1 CFG: en lugar de reducir la fuerza para mejorar la estabilidad, V4 aumenta la fuerza en una proporción de 1.35 (20 más que DPM A15).
En resumen: depende de tu gusto y objetivo. Por ejemplo, V4 producirá más “ruido” (detalles) y puede sacrificar algo de realismo a menos que lo uses con un checkpoint realista.
¿Pero para qué sirve esto?
Este LoRA está basado en la arquitectura y estilo de DMD2, un enfoque conocido para optimizar modelos de difusión enfocándose en reducir el número de pasos de generación sin comprometer la calidad visual.
Entonces... ¿Qué es DMD2?
DMD2 (Modelo Probabilístico de Difusión de Ruido 2) es una variante de modelos de difusión probabilística, diseñada para generar imágenes de alta calidad desde ruido a través de un proceso iterativo de reducción de ruido.
Según la literatura (por ejemplo, Ho et al., 2020, Denoising Diffusion Probabilistic Models), DMD2 optimiza el proceso de reducción de ruido disminuyendo el número de pasos necesarios para alcanzar un nivel de calidad comparable a modelos tradicionales como DDPM.
DMD2 usa una parametrización mejorada del proceso de difusión inversa, ajustando los pesos de varianza y términos de reducción de ruido para acelerar la convergencia.
En el contexto de LoRAs, DMD2 sirve como base para entrenar módulos de Adaptación de Bajo Rango que afinan un modelo preentrenado (como Stable Diffusion) para tareas específicas, minimizando el costo computacional mientras se mantiene la calidad visual.
En conclusión:
Los LoRAs descritos aquí (HD_DMD2_1_CFG-SCALE, DPM_4STEPS_A1, DPM_4STEPS_A15 y V4) son adaptaciones que aprovechan la estructura DMD2 para operar con una escala CFG de 1.
Esto es particularmente interesante porque normalmente se requiere una escala CFG más alta para mantener la misma calidad, pero estos LoRAs pueden reducir el número de pasos a 4, 6, 8 o 10 (10 siendo el mínimo permitido en Civitai) mientras logran resultados impresionantes, reduciendo el tiempo de generación de minutos a solo unos segundos.
Características Clave
Optimizado para generación rápida: Diseñado para producir imágenes de alta calidad con un número muy bajo de pasos de inferencia (4, 6 u 8), permitiendo una generación rápida y eficiente.
Baja escala CFG efectiva: Funciona óptimamente alrededor de una escala CFG de 1, ofreciendo un equilibrio ideal entre creatividad y fidelidad sin sobreajuste.
Tres variantes para diferentes necesidades: Incluye versiones ajustadas para 8, 6 y 4 pasos, ofreciendo flexibilidad según requerimientos de velocidad y detalle.
Calidad visual robusta: Mantiene un fuerte detalle en colores, texturas y composición aun con pasos reducidos — perfecto para aplicaciones que requieren velocidad y calidad.
Amplia aplicabilidad: Adecuado para usuarios que buscan optimizar el tiempo de generación sin sacrificar definición en sus imágenes.
Instrucciones de Uso y Recomendaciones
Si el LoRA que usas requiere más pasos para lograr un buen resultado, puedes aumentar la fuerza del LoRA o agregar prompts positivos con palabras clave como "hdr" para mejorar iluminación y detalles, y prompts negativos como "flat color" para controlar saturación y sombras.
Alternativamente, puedes bajar la fuerza del LoRA, lo que te permite usar escalas CFG más altas sin sobresaturar la imagen. Sin embargo, dado que este LoRA está diseñado principalmente para escala CFG 1, la fuerza ideal puede variar según tu caso específico.
Experimenta tanto con la fuerza como con la escala CFG para encontrar el equilibrio óptimo para tu flujo de trabajo y estilo deseado.
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.

