modelli/UltraReal Fine-Tune - v4

UltraReal Fine-Tune - v4

Luca Bianchi

9/1/2025

1:00:11 AM

| Discussion|

Parole Chiave e Tag Correlati

Un pilota di motocross con equipaggiamento completo salta con una moto sopra letti d'ospedale occupati mentre i pazienti fanno il tifo in una stanza d'ospedale con effetto granulosità pellicola.

Prompt Consigliati

d1g1cam, amateur photo, low-lit, Low-resolution photo, shot on a mobile phone

Parametri Consigliati

samplers

DPM++ 2M

steps

cfg

Suggerimenti

Usa campionatori DPM++ 2M per output fluidi e coerenti.

Punta a 30–50 passi per catturare dettagli più fini senza sovraelaborazione.

Beta Scheduler resta la scelta migliore per questo checkpoint.

Usa prompt complessi con frasi chiare separate da virgole; mantienili concisi e descrittivi.

Una riduzione di CFG di 0,1 o 0,2 può talvolta migliorare i dettagli ma potrebbe aumentare il tempo di generazione.

Evita di usare UltraRealPhoto LoRA con questo checkpoint per prevenire immagini sovracotte; usa invece Realism Amplifier.

Usare alta risoluzione nei prompt può aiutare a evitare artefatti di output a bassa risoluzione.

Punti Salienti della Versione

aumento dell’estetica, leggero calo dell’anatomia

V4
Bene, cosa c’è di nuovo in questa versione? Ho aumentato il livello estetico, aggiunto più diversità nelle età e migliorato il modo in cui gestisce i tratti asiatici. Ma - perché c’è sempre un ma - ho notato che le mani sono diventate un po’ più strane. Eh, non si può vincere sempre.

Raccomando vivamente di abbinarlo ai miei LoRA, come il realism amplifier, 2000s analog core e altri, dato che questo checkpoint funziona meglio come base per LoRA stilizzati. Potrei fare un’altra versione (perché, diciamolo, un po’ ho pasticciato con v3 e v4), ma prima mi immergerò nel fine-tuning di Flex.Alpha.
Versioni disponibili questa volta: bf16, fp8, q8_0 - nome fp16 potato e q4_k_m - nome fp8 potato
P.S.: Non usare il mio UltraRealPhoto LoRA con questo checkpoint - ha un grande impatto sullo stile, quindi l’immagine risulta sovracotta. Se usi UltraReal Fine-Tune, usa invece Realism Amplifier per i migliori risultati. UltraRealPhoto LoRA è stato creato per correggere ombre scadenti, luci e volti, ma tutto questo è già integrato nel checkpoint, puoi semplicemente aggiungere l’amplificatore per un realismo migliore

Aggiornamento V3 (Sperimentale)
Questa release segna un passo avanti, anche se è ancora un lavoro in corso. Mi sono concentrato sul miglioramento di vari aspetti chiave, come nudi, piedi e anatomia della parte inferiore del corpo. Sebbene i risultati siano migliori rispetto a prima, non sono ancora al livello che sto puntando. Detto questo, questa versione porta miglioramenti significativi di qualità e texture, offrendo output più dettagliati e raffinati rispetto alle versioni precedenti.

Impostazioni Consigliate:

CFG Scale: 3 (invece di 2,5 usato nelle versioni precedenti)
Steps: 50 (aiuta con la stabilità, anche se una minima instabilità rimane in mani e dita)
CFG 0.9 vs. 1.0: Un valore CFG leggermente più basso, tipo 0,1 o 0,2 può a volte migliorare alcuni dettagli (ma potrebbe anche no, quindi sentiti libero di sperimentare), anche se potrebbe aumentare i tempi di generazione.

Per quanto riguarda i nudi: non funzionano ancora come previsto, ma sto lavorando attivamente su questo problema e prevedo di risolverlo nella prossima versione.

La buona notizia è che già ho i dataset pronti per V3.5, che puntò a rilasciare molto più velocemente rispetto al gap tra V2 e V3. Con più esperienza e feedback da questa versione, sono fiducioso che il prossimo aggiornamento porterà miglioramenti significativi.

Come sempre, apprezzo davvero il vostro supporto e feedback - sono preziosi mentre continuo a migliorare questo progetto ❤️

P.S.: Sento che più affino Flux, più degrada in altri aspetti. Sto anche pensando di provare il fine-tuning di Flex Alpha (progetto molto promettente)

Cosa c’è di nuovo in v2.0?

Anatomia migliorata: Mani, piedi e pose hanno subito grandi miglioramenti, offrendo risultati più naturali e accurati. Dite addio agli arti troppo deformati!
Texture e qualità migliorate: Dettagli della pelle migliorati, texture più ricche e risultati complessivi più nitidi. Le immagini sfocate succedono ancora occasionalmente, ma molto meno rispetto alla versione precedente o all’uso delle sole LoRA.
Migliorato il rendering del testo: Sono stati fatti sforzi per migliorare la generazione del testo nelle immagini, e ora è molto meglio di prima. Tuttavia, possono ancora comparire artefatti e simboli strani al posto di parole leggibili. È ancora un lavoro in corso.
Dataset ampliato: Un dataset più grande e vario (1800 immagini) introduce un migliore equilibrio tra stili, luci e composizioni.

Varianti di Checkpoint Aggiunte

Per garantire compatibilità con diversi flussi di lavoro, ho incluso più varianti di checkpoint:

BF16
FP8
Quant 8 (Q8)
Quant 4 (Q4)
NF4

Dai miei test, ho notato che Quant 8 (Q8) offre una qualità leggermente migliore rispetto a FP8, fornendo dettagli più fini mantenendo requisiti di risorse gestibili, ma anche le altre versioni funzionano bene. Scegli quella che funziona meglio per la tua configurazione.

Limitazioni Note

Capacità NSFW: Ancora un punto debole in questa versione. Comunque, un piccolo fine-tuning specifico per i contenuti NSFW è già in preparazione.
Rendering del testo: Anche se la generazione del testo è migliorata, possono ancora verificarsi artefatti come simboli strani o parole incomplete. Ho notato che l’uso del t5xxl fp16 invece di fp8 aiuta molto con il testo

Consigli per Risultati Ottimali

Campionatore: Usa i campionatori DPM++ 2M per output fluidi e consistenti.
Passi: Mira a 30–50 passi per catturare dettagli più fini senza sovraelaborazione.
Scheduler: Beta Scheduler resta la scelta migliore per questo checkpoint.

Consigli per il Prompting
Lo stile migliore di prompting implica prompt complessi con frasi chiare separate da virgole. Puoi essere creativo con prompt narrativi, ma descrizioni inutili come “questa roba ha aggiunto più vintage al suo stile” non migliorano i risultati. Mantieni il prompt conciso e descrittivo, concentrandoti sui dettagli visivi essenziali per il miglior output.

Piani Futuri

Mi impegno a sviluppare ulteriormente questo fine-tune. Il prossimo aggiornamento probabilmente si concentrerà su:

Espansione delle capacità NSFW
Miglioramento dei casi limite come pose dinamiche e scenari di illuminazione
Miglioramento del rendering del testo per risultati più nitidi e accurati

P.S.: Se ancora non ottieni un effetto realistico, prova ad aggiungere la mia LoRA ultrareal, di solito aiuta molto

Ultra-Realistic Flux Fine-Tune v1

Questo è il mio primo esperimento di fine-tuning di un checkpoint, costruito sulle basi della mia LoRA UltraReal e ampliato con un dataset esteso. Lo scopo? Portare il realismo a un livello superiore, trovando il giusto equilibrio tra estetica amatoriale e immagini professionali di alta qualità.

Anche se questa è solo la prima versione e vedo spazio per ulteriori miglioramenti - i risultati sono buoni, ma non ideali (mani e piedi a volte possono risultare difettosi, ma la situazione non è critica, comunque meglio del Flux di base). Questo fine-tune non si limita a produrre output di qualità amatoriale; si distingue per immagini di qualità professionale, con dettagli eccezionali, ombre realistiche e illuminazione. È un modello versatile progettato per sbloccare una vasta gamma di possibilità di generazione di immagini realistiche.

È ancora un lavoro in corso e lo condivido per raccogliere feedback e vedere come gli altri lo usano creativamente. Se lo provi, mi piacerebbe sentire cosa ne pensi o vedere i tuoi risultati!
Ho caricato entrambe le versioni: fp16 (in ComfyUI è meglio usarlo con e5m2) e fp8 e Q4_0

🌟 Cosa c’è di Nuovo in Questo Fine-Tune?

Dataset ampliato: quasi il doppio della dimensione del dataset rispetto alla LoRA originale, coprendo una vasta gamma di stili, luci e composizioni.
Realismo migliorato: dettagli più nitidi, texture più ricche e illuminazione più naturale, colmando il divario tra immagini generate con AI e realtà.
Versatilità: da scatti amatoriali casuali a rendering cinematografici di qualità professionale, questo fine-tune si adatta a varie esigenze creative.
Anatomia migliorata: mani, arti e pose più naturali rispetto al modello Flux di base.

💡 Consigli per i Migliori Risultati

Usa campionatori DPM++ 2M per output fluidi e coerenti.
Punta a 30–50 passi per dettagli più fini senza esagerare.
Seleziona il Beta Scheduler per prestazioni ottimali del rendering.

⚡ Perché il Fine-Tune?

Questo fine-tune è stato creato per superare alcune limitazioni del modello Flux predefinito. Migliora la capacità di gestire scene complesse mantenendo una qualità costante su una gamma di prompt. L’obiettivo è semplice: rendere la generazione di immagini ultra-realistiche accessibile, affidabile e visivamente impressionante, senza richiedere aggiustamenti infiniti.

P.S.: ho intenzione di continuare a addestrare questo modello per fare il checkpoint definitivo con la migliore anatomia e realismo. Questa versione non è molto buona con contenuti nsfw (questo sarà risolto nella prossima versione)
P.S.S.: finora può capitare casualmente un’immagine a bassa risoluzione (non so esattamente cosa la scateni, ma cercherò soluzioni). Però sembra che usare alta risoluzione nel prompt aiuti.

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

Flux chaotic expressive lineart - v1.0

Sherri Belassen - V1

Usa questo modello