DMD2 | 1 CFG SCALE | Meno Passi - V5 | DTLVVTT_DMD2 (LITE)
Prompt Consigliati
hdr
by 96yottea, by porforever, by potg \(piotegu\), film grain, black background, 1girl, jane doe \(zenless zone zero\), solo, dark hair, red hand, finger to mouth, simple background, blood hand, thick eyelashes, bags under eyes, black eyeshadow, pale skin, long fingers, from side, masterpiece, best quality, sideways glance, looking at viewer, mouse ears, black lips, bandaid on nose, half-closed eyes, amazing quality, highres, (smirk:1.1), very aesthetic, hand up
Prompt Negativi Consigliati
flat color
bad quality, worst quality, worst detail, sketch, censor, patreon username, patreon logo, watermark, artist name, signature, logo, anatomical nonsense, bad anatomy, ugly, worst aesthetic, old, mismatched pupils, dirty face, extra limbs, bad hands, bad fingers, text, normal quality, low quality, web address, email address
Parametri Consigliati
samplers
steps
cfg
resolution
other models
Suggerimenti
Aumenta la forza della LoRA o aggiungi prompt positivi come "hdr" per migliorare illuminazione e dettagli se servono più passaggi.
Usa prompt negativi come "flat color" per controllare saturazione e ombre.
Abbassa la forza della LoRA per usare scale CFG più alte senza sovrasaturare l’immagine.
Sperimenta sia con la forza che con la scala CFG per trovare l’equilibrio ottimale.
Punti Salienti della Versione
DTLVVTT_DMD2
Estratto da Velvette-XL_V1.1 (versione cancellata) come LoRA (162 MB), quindi fuso in una base DMD2. Questa release mantiene l’effetto caratteristico di riduzione dei passaggi di DMD2 pur essendo più leggero, stabile e facile da usare.
Mentre Matched opera a piena forza (100%) scavando nei checkpoint per recuperare stili incorporati—rendendolo uno strumento più tecnico che richiede prompt precisi—VVTT_DMD2 funziona a circa il 70% di quella potenza. È più fluido, più facile da controllare e funziona bene anche a forza 1 senza necessità di prompt finemente sintonizzati.
La parte migliore: puoi usarlo da solo per semplicità, o combinarlo con Matched per aggiungere dettagli extra. In breve, VVTT_DMD2 è l’opzione più versatile se preferisci non complicarti con i prompt.
Ciao, probabilmente ti starai chiedendo: perché così tante versioni?
Beh… mi farei la stessa domanda se fossi al tuo posto. Il motivo è semplice: è progettato in questo modo per offrire maggiore controllo, poiché, a differenza delle normali LoRA, DMD2 funziona meglio alla sua forza massima.
Per esempio:
HD 1 CFG Scale ha una forza “diluita”, quindi richiede l’uso di trigger o di aumentare manualmente la forza della LoRA. Questo lo rende molto utile per combinarlo con le LoRA PDXL in Illustrious, poiché puoi semplicemente aumentare la forza senza perdere dettagli.
DPM A1 e DPM A15 hanno già una forza e un dettaglio potenziati, quindi non richiedono trigger. A1 è la forza standard, mentre A15 aggiunge un extra del +15%.
V4 è un esperimento per generare immagini in 2 passaggi. È stato creato all’opposto rispetto a HD 1 CFG: invece di ridurre la forza per migliorare la stabilità, V4 aumenta la forza di 1.35 volte (20 in più rispetto a DPM A15).
In breve: dipende dal tuo gusto e obiettivo. Per esempio, V4 produrrà più “rumore” (dettagli) e potrebbe sacrificare un po’ di realismo a meno che non lo usi con un checkpoint realistico.
Ma a cosa serve?
Questa LoRA si basa sull’architettura e lo stile di DMD2, un approccio noto per ottimizzare i modelli di diffusione concentrandosi sulla riduzione del numero di passaggi di generazione senza compromettere la qualità visiva.
Quindi... cos’è DMD2?
DMD2 (Denoising Diffusion Probabilistic Model 2) è una variante dei modelli di diffusione probabilistici, progettata per generare immagini di alta qualità dal rumore tramite un processo iterativo di denoising.
Secondo la letteratura (ad esempio Ho et al., 2020, Denoising Diffusion Probabilistic Models), DMD2 ottimizza il processo di denoising riducendo il numero di passaggi necessari per raggiungere un livello di qualità paragonabile a modelli tradizionali come DDPM.
DMD2 utilizza una parametrizzazione migliorata del processo di diffusione inversa, regolando pesi di varianza e termini di denoising per accelerare la convergenza.
Nel contesto di LoRA, DMD2 serve come base per l’addestramento di moduli di Low-Rank Adaptation che perfezionano un modello preaddestrato (come Stable Diffusion) per compiti specifici, minimizzando il costo computazionale mantenendo la qualità visiva.
In conclusione:
Le LoRA descritte qui (HD_DMD2_1_CFG-SCALE, DPM_4STEPS_A1, DPM_4STEPS_A15 e V4) sono adattamenti che sfruttano la struttura DMD2 per operare con una scala CFG di 1.
Questo è particolarmente interessante perché normalmente è necessaria una scala CFG più alta per mantenere la stessa qualità, ma queste LoRA possono ridurre il numero di passaggi a 4, 6, 8 o 10 (10 è il minimo consentito su Civitai) ottenendo risultati impressionanti—riducendo i tempi di generazione da minuti a pochi secondi.
Caratteristiche principali
Ottimizzato per generazione veloce: Progettato per produrre immagini di alta qualità con un numero molto basso di passaggi di inferenza (4, 6 o 8), permettendo una generazione rapida ed efficiente.
Bassa scala CFG effettiva: Funziona in modo ottimale intorno a una scala CFG di 1, offrendo un equilibrio ideale tra creatività e fedeltà senza overfitting.
Tre varianti per diverse esigenze: Include versioni studiate per 8, 6 e 4 passaggi, offrendo flessibilità in base a velocità e necessità di dettaglio.
Qualità visiva robusta: Mantiene dettagli forti in colori, texture e composizione anche con passaggi ridotti—perfetto per applicazioni che richiedono velocità e qualità.
Ampia applicabilità: Adatto a utenti che vogliono ottimizzare i tempi di generazione senza sacrificare la definizione delle immagini.
Istruzioni d’uso e raccomandazioni
Se la LoRA che stai usando richiede più passaggi per un buon risultato, puoi aumentare la forza della LoRA o aggiungere prompt positivi con parole chiave come "hdr" per migliorare illuminazione e dettagli, e prompt negativi come "flat color" per controllare saturazione e ombre.
In alternativa, puoi abbassare la forza della LoRA, il che ti permette di usare scale CFG più alte senza sovrasaturare l’immagine. Tuttavia, poiché questa LoRA è progettata principalmente per scala CFG 1, la forza ideale può variare a seconda del tuo caso d’uso specifico.
Sperimenta sia con forza che scala CFG per trovare l’equilibrio ottimale per il tuo flusso di lavoro e lo stile desiderato.
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Creatore
Discussione
Per favore log in per lasciare un commento.

