modelli/UltraRealistic Lora Project - Flux - v2

UltraRealistic Lora Project - Flux - v2

Luca Bianchi

10/8/2025

12:55:46 AM

| Discussion|

Parole Chiave e Tag Correlati

Selfie ravvicinato di una donna bulgara sorridente con pelle naturalmente luminosa sotto una luce morbida dalla finestra, che indossa orecchini d'argento e un top senza maniche a collo alto in un loft minimalista.

Figura robotica metallica bianca lucida con giunti servo visibili e placchette geometriche, caratterizzata da un alone cristallino frammentato sopra la testa, fumo nero che vortica nelle cavità oculari e una serratura circolare che rivela ingranaggi intricati sul volto contro uno sfondo a gradiente da indaco a ultravioletto.

Una donna in tuta gialla anti-inquinamento si trova su un paesaggio arido e roccioso fissando una colossale sfera organica gialla con strutture fuse simili a uova e vene sotto un cielo nuvoloso.

Parametri Consigliati

samplers

dpmpp_2m, DPM++ 2M

steps

cfg

Suggerimenti

Per ComfyUI con modello Flux: CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength tra 0.8 e 1.0 (tipicamente 1.0; riduci a 0.87 se la qualità delle mani peggiora).

Per ComfyUI con modello SD3.5: CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength tra 0.5 e 1.0 (tipicamente 0.7).

Considera di ampliare il dataset con pose più varie per migliorare l’accuratezza anatomica nei futuri aggiornamenti.

Sponsor del Creatore

Se desideri supportare il lavoro e i futuri aggiornamenti del modello Flux, visita e dona su https://ko-fi.com/danrisi.

L'obiettivo principale era creare immagini più 'vive' con emozioni più intense e pose più dinamiche e una qualità leggermente amatoriale (può anche produrre immagini di alta qualità).

P.S: Grazie a tutti per i feedback! Ho notato i commenti (non solo qui) riguardo problemi anatomici e sto raccogliendo segnalazioni ed esempi da parte vostra. Sto considerando un paio di opzioni per affrontare questo aspetto:

Allenare un checkpoint completo, che potrebbe essere l'approccio più razionale per miglioramenti costanti.
Ampliare il dataset con più foto che coprano pose diverse per migliorare l'accuratezza anatomica.

Apprezzo molto i vostri suggerimenti - mi aiutano davvero a definire i futuri aggiornamenti.

P.S.2: Ho spostato l'addestramento su RunPod per risultati costanti e di alta qualità. Se desiderate supportare il mio lavoro e futuri aggiornamenti, potete trovarmi su Ko-fi. Perché intendo perfezionare un modello, non solo una LoRa. https://ko-fi.com/danrisi

Impostazioni che uso in ComfyUI per Flux:
CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength= da 0.8 a 1.0 funziona bene, ma di solito uso 1; se le mani peggiorano, imposto 0.87

Impostazioni che uso in ComfyUI per SD3.5:
CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength= da 0.5 a 1.0 funziona bene, ma di solito uso 0.7

V2 - Flux

Porta ancora più realismo e versatilità alle tue creazioni, con miglioramenti significativi in stabilità, anatomia e qualità complessiva. Questo aggiornamento rende la LoRA più adattabile, permettendoti di raggiungere vari livelli di qualità in base ai prompt—dal realismo ad alta definizione a estetiche intenzionalmente di qualità inferiore.

Allenata su 1048 immagini.

Novità:

Miglioramenti nella stabilità: La nuova versione è più stabile e funziona meglio con prompt testuali, offrendo un output più fluido e prevedibile.

Miglioramento di mani e anatomia: Mani e anatomia del corpo sono più rifinite, migliorando la qualità realistica.

Flessibilità di qualità: Con i prompt giusti, puoi regolare estetiche sia di alta sia di bassa qualità (esempi disponibili).

V1.2 per SD3.5 - Large

Ho deciso di creare una versione per SD3.5 con quasi le stesse impostazioni. A mio parere sembra buona, ma ho notato qualche problema di anatomia (in alcuni momenti anche peggio del flux), mentre l’estetica (colori, contrasto e altro) è addirittura migliore di flux. Vedo che SD3.5 ha potenziale, forse le nuove versioni saranno anche su SD3.5.

V1.2

Ho cambiato metà delle immagini nel dataset, modificato lo stile del prompting, migliorato le mani, ridotto gli 'effetti torcia' nelle scene notturne e migliorato la qualità generale della LoRa (spero).
In questa versione non è più necessario usare un sacco di 'trigger words' come in V1. Basta aggiungere alcune di quelle che ho menzionato nelle parole chiave.

Ho addestrato un'altra lora amatoriale (cosa già fatta molte volte qui).

Ho comunque preso alcune foto dal mio dataset degli anni 2000 e ne ho aggiunte altre 700. Finora il risultato è abbastanza buono, ma c'è un punto controverso sull'ottimizzazione della qualità. Speravo potesse aiutare a controllare la qualità, ma a quanto pare ha solo confuso il modello. Nel dataset ci sono molte diverse gradazioni di qualità, come:

1) Foto ad alta risoluzione, scattata con un telefonino, senza artefatti visibili, nitida e chiara

2) Foto a bassa risoluzione, amatoriale, scattata con una fotocamera digitale, senza artefatti jpeg visibili, leggermente rumorosa

3) Foto a risoluzione media, scattata con un telefonino, leggermente granulosa a causa di scarse condizioni di luce, senza artefatti digitali significativi

e altre loro combinazioni e variazioni. Penso che rimuoverò queste nella prossima versione. Ma questa è quella che funziona meglio per me:

Foto a bassa risoluzione, amatoriale, scattata con una fotocamera digitale, senza artefatti jpeg visibili, leggermente rumorosa

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

Frieren フリーレン - 葬送のフリーレン - v2.0-alpha [FLUX]

Crimson Acryllic FLUX - V1

Usa questo modello