Un pilota di motocross con equipaggiamento completo salta con una moto sopra letti d'ospedale occupati mentre i pazienti fanno il tifo in una stanza d'ospedale con effetto granulosità pellicola.

Prompt Consigliati

d1g1cam, amateur photo, low-lit, Low-resolution photo, shot on a mobile phone

Parametri Consigliati

samplers

DPM++ 2M

steps

40

cfg

3

Suggerimenti

Usa campionatori DPM++ 2M per output fluidi e coerenti.

Punta a 30–50 passi per catturare dettagli più fini senza sovraelaborazione.

Beta Scheduler resta la scelta migliore per questo checkpoint.

Usa prompt complessi con frasi chiare separate da virgole; mantienili concisi e descrittivi.

Una riduzione di CFG di 0,1 o 0,2 può talvolta migliorare i dettagli ma potrebbe aumentare il tempo di generazione.

Evita di usare UltraRealPhoto LoRA con questo checkpoint per prevenire immagini sovracotte; usa invece Realism Amplifier.

Usare alta risoluzione nei prompt può aiutare a evitare artefatti di output a bassa risoluzione.

Punti Salienti della Versione

aumento dell’estetica, leggero calo dell’anatomia

V4
Bene, cosa c’è di nuovo in questa versione? Ho aumentato il livello estetico, aggiunto più diversità nelle età e migliorato il modo in cui gestisce i tratti asiatici. Ma - perché c’è sempre un ma - ho notato che le mani sono diventate un po’ più strane. Eh, non si può vincere sempre.

Raccomando vivamente di abbinarlo ai miei LoRA, come il realism amplifier, 2000s analog core e altri, dato che questo checkpoint funziona meglio come base per LoRA stilizzati. Potrei fare un’altra versione (perché, diciamolo, un po’ ho pasticciato con v3 e v4), ma prima mi immergerò nel fine-tuning di Flex.Alpha.
Versioni disponibili questa volta: bf16, fp8, q8_0 - nome fp16 potato e q4_k_m - nome fp8 potato
P.S.: Non usare il mio UltraRealPhoto LoRA con questo checkpoint - ha un grande impatto sullo stile, quindi l’immagine risulta sovracotta. Se usi UltraReal Fine-Tune, usa invece Realism Amplifier per i migliori risultati. UltraRealPhoto LoRA è stato creato per correggere ombre scadenti, luci e volti, ma tutto questo è già integrato nel checkpoint, puoi semplicemente aggiungere l’amplificatore per un realismo migliore

Aggiornamento V3 (Sperimentale)
Questa release segna un passo avanti, anche se è ancora un lavoro in corso. Mi sono concentrato sul miglioramento di vari aspetti chiave, come nudi, piedi e anatomia della parte inferiore del corpo. Sebbene i risultati siano migliori rispetto a prima, non sono ancora al livello che sto puntando. Detto questo, questa versione porta miglioramenti significativi di qualità e texture, offrendo output più dettagliati e raffinati rispetto alle versioni precedenti.

Impostazioni Consigliate:

  • CFG Scale: 3 (invece di 2,5 usato nelle versioni precedenti)

  • Steps: 50 (aiuta con la stabilità, anche se una minima instabilità rimane in mani e dita)

  • CFG 0.9 vs. 1.0: Un valore CFG leggermente più basso, tipo 0,1 o 0,2 può a volte migliorare alcuni dettagli (ma potrebbe anche no, quindi sentiti libero di sperimentare), anche se potrebbe aumentare i tempi di generazione.

Per quanto riguarda i nudi: non funzionano ancora come previsto, ma sto lavorando attivamente su questo problema e prevedo di risolverlo nella prossima versione.

La buona notizia è che già ho i dataset pronti per V3.5, che puntò a rilasciare molto più velocemente rispetto al gap tra V2 e V3. Con più esperienza e feedback da questa versione, sono fiducioso che il prossimo aggiornamento porterà miglioramenti significativi.

Come sempre, apprezzo davvero il vostro supporto e feedback - sono preziosi mentre continuo a migliorare questo progetto ❤️

P.S.: Sento che più affino Flux, più degrada in altri aspetti. Sto anche pensando di provare il fine-tuning di Flex Alpha (progetto molto promettente)


Cosa c’è di nuovo in v2.0?

  • Anatomia migliorata: Mani, piedi e pose hanno subito grandi miglioramenti, offrendo risultati più naturali e accurati. Dite addio agli arti troppo deformati!

  • Texture e qualità migliorate: Dettagli della pelle migliorati, texture più ricche e risultati complessivi più nitidi. Le immagini sfocate succedono ancora occasionalmente, ma molto meno rispetto alla versione precedente o all’uso delle sole LoRA.

  • Migliorato il rendering del testo: Sono stati fatti sforzi per migliorare la generazione del testo nelle immagini, e ora è molto meglio di prima. Tuttavia, possono ancora comparire artefatti e simboli strani al posto di parole leggibili. È ancora un lavoro in corso.

  • Dataset ampliato: Un dataset più grande e vario (1800 immagini) introduce un migliore equilibrio tra stili, luci e composizioni.


Varianti di Checkpoint Aggiunte

Per garantire compatibilità con diversi flussi di lavoro, ho incluso più varianti di checkpoint:

  • BF16

  • FP8

  • Quant 8 (Q8)

  • Quant 4 (Q4)
    NF4

Dai miei test, ho notato che Quant 8 (Q8) offre una qualità leggermente migliore rispetto a FP8, fornendo dettagli più fini mantenendo requisiti di risorse gestibili, ma anche le altre versioni funzionano bene. Scegli quella che funziona meglio per la tua configurazione.


Limitazioni Note

  • Capacità NSFW: Ancora un punto debole in questa versione. Comunque, un piccolo fine-tuning specifico per i contenuti NSFW è già in preparazione.

  • Rendering del testo: Anche se la generazione del testo è migliorata, possono ancora verificarsi artefatti come simboli strani o parole incomplete. Ho notato che l’uso del t5xxl fp16 invece di fp8 aiuta molto con il testo


Consigli per Risultati Ottimali

  • Campionatore: Usa i campionatori DPM++ 2M per output fluidi e consistenti.

  • Passi: Mira a 30–50 passi per catturare dettagli più fini senza sovraelaborazione.

  • Scheduler: Beta Scheduler resta la scelta migliore per questo checkpoint.

    Consigli per il Prompting

    Lo stile migliore di prompting implica prompt complessi con frasi chiare separate da virgole. Puoi essere creativo con prompt narrativi, ma descrizioni inutili come “questa roba ha aggiunto più vintage al suo stile” non migliorano i risultati. Mantieni il prompt conciso e descrittivo, concentrandoti sui dettagli visivi essenziali per il miglior output.


Piani Futuri

Mi impegno a sviluppare ulteriormente questo fine-tune. Il prossimo aggiornamento probabilmente si concentrerà su:

  • Espansione delle capacità NSFW

  • Miglioramento dei casi limite come pose dinamiche e scenari di illuminazione

  • Miglioramento del rendering del testo per risultati più nitidi e accurati

    P.S.: Se ancora non ottieni un effetto realistico, prova ad aggiungere la mia LoRA ultrareal, di solito aiuta molto




    Ultra-Realistic Flux Fine-Tune v1

Questo è il mio primo esperimento di fine-tuning di un checkpoint, costruito sulle basi della mia LoRA UltraReal e ampliato con un dataset esteso. Lo scopo? Portare il realismo a un livello superiore, trovando il giusto equilibrio tra estetica amatoriale e immagini professionali di alta qualità.

Anche se questa è solo la prima versione e vedo spazio per ulteriori miglioramenti - i risultati sono buoni, ma non ideali (mani e piedi a volte possono risultare difettosi, ma la situazione non è critica, comunque meglio del Flux di base). Questo fine-tune non si limita a produrre output di qualità amatoriale; si distingue per immagini di qualità professionale, con dettagli eccezionali, ombre realistiche e illuminazione. È un modello versatile progettato per sbloccare una vasta gamma di possibilità di generazione di immagini realistiche.

È ancora un lavoro in corso e lo condivido per raccogliere feedback e vedere come gli altri lo usano creativamente. Se lo provi, mi piacerebbe sentire cosa ne pensi o vedere i tuoi risultati!
Ho caricato entrambe le versioni: fp16 (in ComfyUI è meglio usarlo con e5m2) e fp8 e Q4_0


🌟 Cosa c’è di Nuovo in Questo Fine-Tune?

  • Dataset ampliato: quasi il doppio della dimensione del dataset rispetto alla LoRA originale, coprendo una vasta gamma di stili, luci e composizioni.

  • Realismo migliorato: dettagli più nitidi, texture più ricche e illuminazione più naturale, colmando il divario tra immagini generate con AI e realtà.

  • Versatilità: da scatti amatoriali casuali a rendering cinematografici di qualità professionale, questo fine-tune si adatta a varie esigenze creative.

  • Anatomia migliorata: mani, arti e pose più naturali rispetto al modello Flux di base.


💡 Consigli per i Migliori Risultati

  • Usa campionatori DPM++ 2M per output fluidi e coerenti.

  • Punta a 30–50 passi per dettagli più fini senza esagerare.

  • Seleziona il Beta Scheduler per prestazioni ottimali del rendering.


Perché il Fine-Tune?

Questo fine-tune è stato creato per superare alcune limitazioni del modello Flux predefinito. Migliora la capacità di gestire scene complesse mantenendo una qualità costante su una gamma di prompt. L’obiettivo è semplice: rendere la generazione di immagini ultra-realistiche accessibile, affidabile e visivamente impressionante, senza richiedere aggiustamenti infiniti.

P.S.: ho intenzione di continuare a addestrare questo modello per fare il checkpoint definitivo con la migliore anatomia e realismo. Questa versione non è molto buona con contenuti nsfw (questo sarà risolto nella prossima versione)
P.S.S.: finora può capitare casualmente un’immagine a bassa risoluzione (non so esattamente cosa la scateni, ma cercherò soluzioni). Però sembra che usare alta risoluzione nel prompt aiuti.

Precedente
Flux chaotic expressive lineart - v1.0
Successivo
Sherri Belassen - V1

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

Flux.1 D

Versione del modello

v4

Hash del modello

8d817e129c

Creatore

Discussione

Per favore log in per lasciare un commento.

Collezione di Modelli - UltraReal Fine-Tune

Immagini di UltraReal Fine-Tune - v4

Un pilota di motocross con equipaggiamento completo salta con una moto sopra letti d'ospedale occupati mentre i pazienti fanno il tifo in una stanza d'ospedale con effetto granulosità pellicola.

Immagini con anni 2000

Ragazza goth in un costume da strega nero che tiene un pergamena in un vicolo poco illuminato.
Immagine di moda street style di una donna che indossa un crop top mimetico e jeans a vita alta, in piedi in un vivace vicolo urbano colorato. Generata da AI usando Stable Diffusion.

Immagini con film

Foto cinematografica in stile 35mm di un Charger Hellcat SRT che guida di notte con luci cittadine e sfocatura del movimento
Vista dall'alto di una fetta di salmone salutare servita su un piatto nero con una fetta di limone come guarnizione, aneto sopra e una forchetta di lato su una superficie scura e strutturata con illuminazione drammatica.
Ritratto surreale di una ragazza con capelli biondo cenere lunghi e occhi viola luminosi seduta in un interno di un Eldritchtech pub, con maniche a rete e un vestito nero.
Una figura demoniaca iperrealistica con corna curve e linee gialle luminose su un body nero, in piedi sotto un'illuminazione cinematografica drammatica contro uno sfondo scuro.
Ritratto monocromatico fotorealistico ravvicinato di una donna che tocca delicatamente una finestra coperta di pioggia, catturato con alto dettaglio e texture.
Una creatura mostruosa con denti aguzzi e occhi arancioni luminosi si lancia in avanti in un tunnel di fogna bagnato e sporco, catturata da un angolo POV basso e drammatico.
Ritratto digitale iper-realistico ravvicinato di una bellissima donna con occhiali cyber futuristici con contorni neon rossi, che mostra labbra lucide e occhi intensi e dettagliati sotto illuminazione cinematografica.
Immagine fotorealistica in bianco e nero di una figura femminile demoniaca che indossa una mezza maschera di metallo ornamentale e vesti nere scoperte, emergendo da nebbia e ombre inquietanti.
Foto cinematografica iperdettagliata di un alieno che si trova all'interno di una vecchia cabina telefonica usurata su Marte tenendo una cornetta vintage all'orecchio, con un deserto marziano arancione visibile attraverso la finestra posteriore della cabina.
Immagine fotorealistica di un cyborg umanoide femminile rotto e crepato disteso a terra in un'astronave futuristica, circondato da una nebbia eterea blu neon e una galassia luminosa visibile attraverso la finestra.

Immagini con fotorealistico

Ritratto a figura intera di una donna con capelli rossi e lentiggini che indossa un abito lungo giallo senape con maniche corte arricciate, in piedi tra le foglie della giungla su uno sfondo scuro.
Husky siberiano fotorealistico che indossa mimetica da spec-ops innevata e si trova in una foresta di pini innevata con riflessi di luce.
Primo piano fotorealistico di donna metà umana metà cyborg in un vivace accappatoio rosso che tiene due spade samurai in una città noir anni '40, scura e fumosa.
Fotografia macro che mostra gambi di fiori selvatici in silhouette contro un grande tramonto arancione con sfere di luce bokeh sullo sfondo.
Silhouette di un uomo che indossa una corona di spine bioluminescente luminosa con luci viola su sfondo blu scuro.
Illustrazione digitale fotorealistica di una camera da letto futuristica con proiezione olografica di un personaggio a tema spaziale in toni blu sopra il letto ornato, con una donna in un abito futuristico elegante seduta sul letto in una stanza lussuosa con pareti blu e vista sulla città.
Personaggio bambola creepy-cute con arti cuciti, occhi a bottone e capelli rosa gemelli legati con nastri neri, indossa un abito verde e un grande papillon rosa, con la mano dietro la testa, in piedi contro uno sfondo testurizzato turchese e beige.
Una tazza da caffè Starbucks luminosa che emette scintille viola e ciano e vapore in un ambiente scuro.

Immagini con realismo

Una giovane principessa bionda con capelli intrecciati accovacciata accanto a un falò in una radura durante una festa tribale, circondata da figure sullo sfondo vicino ai falò.
Ritratto realistico di una donna con occhi verde smeraldo intensi, che indossa una corona fatta di delicati frammenti di cristallo e un abito che ricorda cascate ghiacciate, illuminata da luce rifratta blu ghiaccio e argento in una grotta glaciale buia.
Un impiegato seduto a una scrivania con la testa tra le mani, illuminato da uno schermo di portatile luminoso, circondato da pile di report e lattine di energy drink che assomigliano a calici dorati, sotto ricche tende barocche.
Un Tyrannosaurus Rex ruggente che insegue una giovane donna che cammina in una fitta giungla, raffigurato nello stile dettagliato di Sergey Krasovskiy.
Una donna che tiene una candela accesa con uno sfondo nero che illumina metà del suo volto con la calda luce della candela.
Un dipinto digitale dettagliato di un aereo militare a elica arrugginito che vola a mezz'aria sopra l'oceano, con eliche in rotazione e cabina aperta che mostra passeggeri, sotto un cielo azzurro limpido con nuvole.
Foto in primo piano di una ragazza rossa con lentiggini e occhi azzurri fra erbe alte sotto luce solare intensa, che mostra dettagli naturali accurati ed effetto grana di pellicola analogica.
Un volto femminile soprannaturale con occhi luminosi che emerge dal fogliame della giungla e piante luminescenti, una cascata luminosa scorre dalla sua bocca, arte fantasy digitale.
Ritratto ravvicinato drammatico di un uomo anziano con capelli bianchi e occhi gialli luminosi, che indossa un'armatura scura dettagliata e tiene uno scudo rotondo su uno sfondo nero solido.
Una macchina per caffè vintage arrugginita e malfunzionante che emana vapore sintetico, con un braccio robotico che si muove nervosamente, posata su un piano macchiato sotto luci fluorescenti tremolanti.

Immagini con sexy

Una ragazza anime stilizzata con lunghi capelli neri e occhi verdi intensi, che indossa un abito nero e calze sopra il ginocchio adornate da tatuaggi floreali rossi, che tiene una katana su sfondo rosso.
Una bella ragazza elfo con lunghi capelli biondi, occhi verdi e orecchie appuntite in un ambiente di foresta magica, indossando abiti dettagliati verdi e dorati con una corona.
Sangue rosso che gocciola in stile flat design con uno sfondo invertito minimalista, caratterizzato da texture lisce e lucenti e evidenziazioni di colore spot.
Sagoma di una seducente strega del sangue in rosso lucido su uno sfondo grigio tenue con design flat e luci al neon.
Profilo laterale dettagliato di un dinosauro preistorico tribale adornato con piume ornate arancioni e nere in stile flat color con sfondo invertito.
Una fata dai capelli argentei che indossa un vestito verde attillato e una tiara, in piedi in una foresta mistica sotto la luna piena con ali gialle luminose e fatine che la circondano.
Illustrazione in stile design piatto di una sirena che galleggia sott'acqua, con intricati motivi frattali arancioni su uno sfondo invertito scuro con effetti perlacei e neon.
Dea del peccato in silhouette con tentacoli frattali arancione neon che si irradiano dalla sua testa su uno sfondo scuro invertito in uno stile piatto senza lineart
Ritratto di una dea seducente dei fiori adornata con brillanti copricapi floreali rossi e gioielli intricati, caratterizzato da colori piatti e schema di colori triadico con sfondo verde.
Una feroce guerriera amazzone con capelli bianchi intrecciati in armatura di bronzo dettagliata, che tiene un tridente e un'ascia, in piedi tra rovine di pietra antiche con illuminazione volumetrica.