UltraReal Fine-Tune - v4
Prompt Consigliati
d1g1cam, amateur photo, low-lit, Low-resolution photo, shot on a mobile phone
Parametri Consigliati
samplers
steps
cfg
Suggerimenti
Usa campionatori DPM++ 2M per output fluidi e coerenti.
Punta a 30–50 passi per catturare dettagli più fini senza sovraelaborazione.
Beta Scheduler resta la scelta migliore per questo checkpoint.
Usa prompt complessi con frasi chiare separate da virgole; mantienili concisi e descrittivi.
Una riduzione di CFG di 0,1 o 0,2 può talvolta migliorare i dettagli ma potrebbe aumentare il tempo di generazione.
Evita di usare UltraRealPhoto LoRA con questo checkpoint per prevenire immagini sovracotte; usa invece Realism Amplifier.
Usare alta risoluzione nei prompt può aiutare a evitare artefatti di output a bassa risoluzione.
Punti Salienti della Versione
aumento dell’estetica, leggero calo dell’anatomia
V4
Bene, cosa c’è di nuovo in questa versione? Ho aumentato il livello estetico, aggiunto più diversità nelle età e migliorato il modo in cui gestisce i tratti asiatici. Ma - perché c’è sempre un ma - ho notato che le mani sono diventate un po’ più strane. Eh, non si può vincere sempre.
Raccomando vivamente di abbinarlo ai miei LoRA, come il realism amplifier, 2000s analog core e altri, dato che questo checkpoint funziona meglio come base per LoRA stilizzati. Potrei fare un’altra versione (perché, diciamolo, un po’ ho pasticciato con v3 e v4), ma prima mi immergerò nel fine-tuning di Flex.Alpha.
Versioni disponibili questa volta: bf16, fp8, q8_0 - nome fp16 potato e q4_k_m - nome fp8 potato
P.S.: Non usare il mio UltraRealPhoto LoRA con questo checkpoint - ha un grande impatto sullo stile, quindi l’immagine risulta sovracotta. Se usi UltraReal Fine-Tune, usa invece Realism Amplifier per i migliori risultati. UltraRealPhoto LoRA è stato creato per correggere ombre scadenti, luci e volti, ma tutto questo è già integrato nel checkpoint, puoi semplicemente aggiungere l’amplificatore per un realismo migliore
Aggiornamento V3 (Sperimentale)
Questa release segna un passo avanti, anche se è ancora un lavoro in corso. Mi sono concentrato sul miglioramento di vari aspetti chiave, come nudi, piedi e anatomia della parte inferiore del corpo. Sebbene i risultati siano migliori rispetto a prima, non sono ancora al livello che sto puntando. Detto questo, questa versione porta miglioramenti significativi di qualità e texture, offrendo output più dettagliati e raffinati rispetto alle versioni precedenti.
Impostazioni Consigliate:
CFG Scale: 3 (invece di 2,5 usato nelle versioni precedenti)
Steps: 50 (aiuta con la stabilità, anche se una minima instabilità rimane in mani e dita)
CFG 0.9 vs. 1.0: Un valore CFG leggermente più basso, tipo 0,1 o 0,2 può a volte migliorare alcuni dettagli (ma potrebbe anche no, quindi sentiti libero di sperimentare), anche se potrebbe aumentare i tempi di generazione.
Per quanto riguarda i nudi: non funzionano ancora come previsto, ma sto lavorando attivamente su questo problema e prevedo di risolverlo nella prossima versione.
La buona notizia è che già ho i dataset pronti per V3.5, che puntò a rilasciare molto più velocemente rispetto al gap tra V2 e V3. Con più esperienza e feedback da questa versione, sono fiducioso che il prossimo aggiornamento porterà miglioramenti significativi.
Come sempre, apprezzo davvero il vostro supporto e feedback - sono preziosi mentre continuo a migliorare questo progetto ❤️
P.S.: Sento che più affino Flux, più degrada in altri aspetti. Sto anche pensando di provare il fine-tuning di Flex Alpha (progetto molto promettente)
Cosa c’è di nuovo in v2.0?
Anatomia migliorata: Mani, piedi e pose hanno subito grandi miglioramenti, offrendo risultati più naturali e accurati. Dite addio agli arti troppo deformati!
Texture e qualità migliorate: Dettagli della pelle migliorati, texture più ricche e risultati complessivi più nitidi. Le immagini sfocate succedono ancora occasionalmente, ma molto meno rispetto alla versione precedente o all’uso delle sole LoRA.
Migliorato il rendering del testo: Sono stati fatti sforzi per migliorare la generazione del testo nelle immagini, e ora è molto meglio di prima. Tuttavia, possono ancora comparire artefatti e simboli strani al posto di parole leggibili. È ancora un lavoro in corso.
Dataset ampliato: Un dataset più grande e vario (1800 immagini) introduce un migliore equilibrio tra stili, luci e composizioni.
Varianti di Checkpoint Aggiunte
Per garantire compatibilità con diversi flussi di lavoro, ho incluso più varianti di checkpoint:
BF16
FP8
Quant 8 (Q8)
Quant 4 (Q4)
NF4
Dai miei test, ho notato che Quant 8 (Q8) offre una qualità leggermente migliore rispetto a FP8, fornendo dettagli più fini mantenendo requisiti di risorse gestibili, ma anche le altre versioni funzionano bene. Scegli quella che funziona meglio per la tua configurazione.
Limitazioni Note
Capacità NSFW: Ancora un punto debole in questa versione. Comunque, un piccolo fine-tuning specifico per i contenuti NSFW è già in preparazione.
Rendering del testo: Anche se la generazione del testo è migliorata, possono ancora verificarsi artefatti come simboli strani o parole incomplete. Ho notato che l’uso del t5xxl fp16 invece di fp8 aiuta molto con il testo
Consigli per Risultati Ottimali
Campionatore: Usa i campionatori DPM++ 2M per output fluidi e consistenti.
Passi: Mira a 30–50 passi per catturare dettagli più fini senza sovraelaborazione.
Scheduler: Beta Scheduler resta la scelta migliore per questo checkpoint.
Consigli per il PromptingLo stile migliore di prompting implica prompt complessi con frasi chiare separate da virgole. Puoi essere creativo con prompt narrativi, ma descrizioni inutili come “questa roba ha aggiunto più vintage al suo stile” non migliorano i risultati. Mantieni il prompt conciso e descrittivo, concentrandoti sui dettagli visivi essenziali per il miglior output.
Piani Futuri
Mi impegno a sviluppare ulteriormente questo fine-tune. Il prossimo aggiornamento probabilmente si concentrerà su:
Espansione delle capacità NSFW
Miglioramento dei casi limite come pose dinamiche e scenari di illuminazione
Miglioramento del rendering del testo per risultati più nitidi e accurati
P.S.: Se ancora non ottieni un effetto realistico, prova ad aggiungere la mia LoRA ultrareal, di solito aiuta molto
Ultra-Realistic Flux Fine-Tune v1
Questo è il mio primo esperimento di fine-tuning di un checkpoint, costruito sulle basi della mia LoRA UltraReal e ampliato con un dataset esteso. Lo scopo? Portare il realismo a un livello superiore, trovando il giusto equilibrio tra estetica amatoriale e immagini professionali di alta qualità.
Anche se questa è solo la prima versione e vedo spazio per ulteriori miglioramenti - i risultati sono buoni, ma non ideali (mani e piedi a volte possono risultare difettosi, ma la situazione non è critica, comunque meglio del Flux di base). Questo fine-tune non si limita a produrre output di qualità amatoriale; si distingue per immagini di qualità professionale, con dettagli eccezionali, ombre realistiche e illuminazione. È un modello versatile progettato per sbloccare una vasta gamma di possibilità di generazione di immagini realistiche.
È ancora un lavoro in corso e lo condivido per raccogliere feedback e vedere come gli altri lo usano creativamente. Se lo provi, mi piacerebbe sentire cosa ne pensi o vedere i tuoi risultati!
Ho caricato entrambe le versioni: fp16 (in ComfyUI è meglio usarlo con e5m2) e fp8 e Q4_0
🌟 Cosa c’è di Nuovo in Questo Fine-Tune?
Dataset ampliato: quasi il doppio della dimensione del dataset rispetto alla LoRA originale, coprendo una vasta gamma di stili, luci e composizioni.
Realismo migliorato: dettagli più nitidi, texture più ricche e illuminazione più naturale, colmando il divario tra immagini generate con AI e realtà.
Versatilità: da scatti amatoriali casuali a rendering cinematografici di qualità professionale, questo fine-tune si adatta a varie esigenze creative.
Anatomia migliorata: mani, arti e pose più naturali rispetto al modello Flux di base.
💡 Consigli per i Migliori Risultati
Usa campionatori DPM++ 2M per output fluidi e coerenti.
Punta a 30–50 passi per dettagli più fini senza esagerare.
Seleziona il Beta Scheduler per prestazioni ottimali del rendering.
⚡ Perché il Fine-Tune?
Questo fine-tune è stato creato per superare alcune limitazioni del modello Flux predefinito. Migliora la capacità di gestire scene complesse mantenendo una qualità costante su una gamma di prompt. L’obiettivo è semplice: rendere la generazione di immagini ultra-realistiche accessibile, affidabile e visivamente impressionante, senza richiedere aggiustamenti infiniti.
P.S.: ho intenzione di continuare a addestrare questo modello per fare il checkpoint definitivo con la migliore anatomia e realismo. Questa versione non è molto buona con contenuti nsfw (questo sarà risolto nella prossima versione)
P.S.S.: finora può capitare casualmente un’immagine a bassa risoluzione (non so esattamente cosa la scateni, ma cercherò soluzioni). Però sembra che usare alta risoluzione nel prompt aiuti.
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Creatore
Discussione
Per favore log in per lasciare un commento.


