UltraRealistic Lora Project - Flux - v2
Parole Chiave e Tag Correlati
Parametri Consigliati
samplers
steps
cfg
Suggerimenti
Per ComfyUI con modello Flux: CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength tra 0.8 e 1.0 (tipicamente 1.0; riduci a 0.87 se la qualità delle mani peggiora).
Per ComfyUI con modello SD3.5: CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength tra 0.5 e 1.0 (tipicamente 0.7).
Considera di ampliare il dataset con pose più varie per migliorare l’accuratezza anatomica nei futuri aggiornamenti.
Sponsor del Creatore
Se desideri supportare il lavoro e i futuri aggiornamenti del modello Flux, visita e dona su https://ko-fi.com/danrisi.
L'obiettivo principale era creare immagini più 'vive' con emozioni più intense e pose più dinamiche e una qualità leggermente amatoriale (può anche produrre immagini di alta qualità).
P.S: Grazie a tutti per i feedback! Ho notato i commenti (non solo qui) riguardo problemi anatomici e sto raccogliendo segnalazioni ed esempi da parte vostra. Sto considerando un paio di opzioni per affrontare questo aspetto:
Allenare un checkpoint completo, che potrebbe essere l'approccio più razionale per miglioramenti costanti.
Ampliare il dataset con più foto che coprano pose diverse per migliorare l'accuratezza anatomica.
Apprezzo molto i vostri suggerimenti - mi aiutano davvero a definire i futuri aggiornamenti.
P.S.2: Ho spostato l'addestramento su RunPod per risultati costanti e di alta qualità. Se desiderate supportare il mio lavoro e futuri aggiornamenti, potete trovarmi su Ko-fi. Perché intendo perfezionare un modello, non solo una LoRa. https://ko-fi.com/danrisi
Impostazioni che uso in ComfyUI per Flux:
CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength= da 0.8 a 1.0 funziona bene, ma di solito uso 1; se le mani peggiorano, imposto 0.87
Impostazioni che uso in ComfyUI per SD3.5:
CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength= da 0.5 a 1.0 funziona bene, ma di solito uso 0.7
V2 - Flux
Porta ancora più realismo e versatilità alle tue creazioni, con miglioramenti significativi in stabilità, anatomia e qualità complessiva. Questo aggiornamento rende la LoRA più adattabile, permettendoti di raggiungere vari livelli di qualità in base ai prompt—dal realismo ad alta definizione a estetiche intenzionalmente di qualità inferiore.
Allenata su 1048 immagini.
Novità:
Miglioramenti nella stabilità: La nuova versione è più stabile e funziona meglio con prompt testuali, offrendo un output più fluido e prevedibile.
Miglioramento di mani e anatomia: Mani e anatomia del corpo sono più rifinite, migliorando la qualità realistica.
Flessibilità di qualità: Con i prompt giusti, puoi regolare estetiche sia di alta sia di bassa qualità (esempi disponibili).
V1.2 per SD3.5 - Large
Ho deciso di creare una versione per SD3.5 con quasi le stesse impostazioni. A mio parere sembra buona, ma ho notato qualche problema di anatomia (in alcuni momenti anche peggio del flux), mentre l’estetica (colori, contrasto e altro) è addirittura migliore di flux. Vedo che SD3.5 ha potenziale, forse le nuove versioni saranno anche su SD3.5.
V1.2
Ho cambiato metà delle immagini nel dataset, modificato lo stile del prompting, migliorato le mani, ridotto gli 'effetti torcia' nelle scene notturne e migliorato la qualità generale della LoRa (spero).
In questa versione non è più necessario usare un sacco di 'trigger words' come in V1. Basta aggiungere alcune di quelle che ho menzionato nelle parole chiave.
V1
Ho addestrato un'altra lora amatoriale (cosa già fatta molte volte qui).
Ho comunque preso alcune foto dal mio dataset degli anni 2000 e ne ho aggiunte altre 700. Finora il risultato è abbastanza buono, ma c'è un punto controverso sull'ottimizzazione della qualità. Speravo potesse aiutare a controllare la qualità, ma a quanto pare ha solo confuso il modello. Nel dataset ci sono molte diverse gradazioni di qualità, come:
1) Foto ad alta risoluzione, scattata con un telefonino, senza artefatti visibili, nitida e chiara
2) Foto a bassa risoluzione, amatoriale, scattata con una fotocamera digitale, senza artefatti jpeg visibili, leggermente rumorosa
3) Foto a risoluzione media, scattata con un telefonino, leggermente granulosa a causa di scarse condizioni di luce, senza artefatti digitali significativi
e altre loro combinazioni e variazioni. Penso che rimuoverò queste nella prossima versione. Ma questa è quella che funziona meglio per me:
Foto a bassa risoluzione, amatoriale, scattata con una fotocamera digitale, senza artefatti jpeg visibili, leggermente rumorosa
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Parole addestrate
Creatore
Discussione
Per favore log in per lasciare un commento.






