modelli/The Araminta Experiment (SDXL+Flux) - Fv5

The Araminta Experiment (SDXL+Flux) - Fv5

12/4/2025

1:04:49 PM

Parole Chiave e Tag Correlati

tuttofare,aramintastudio,modello base,checkpoint,flessibilità,flux1-a1,fv5,fv6,contenuto adulto,generazione immagini nsfw,fotorealismo,fotorealistico,realistico,sdxl 1.0,modello base sdxl gv4,modello stable diffusion,l'esperimento araminta (sdxl+flux),donna

Giraffa in bianco e nero che osserva un gigantesco tarassaco su una collina innevata sotto un cielo ventoso che disperde semi di tarassaco in toni monocromatici.

Prompt Negativi Consigliati

big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Parametri Consigliati

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, DPM++ 2M beta, sgm_uniform, DDEIS, normal, simple, beta, dpmpp_3m_sde, dpmpp_3m_sde_gpu

steps

12 - 25

cfg

1.5 - 11

Suggerimenti

Usa DPM++ 2/3M SDE con i sampler Karras o Exponential e più di 25 passaggi con CFG intorno a 5-7 per i migliori risultati SDXL.

Prova DPM++ SDE Karras con meno passaggi (es. 12) e CFG più alto (8-11) per stili alternativi.

I sampler Euler Ancestral / Normal producono risultati meno dettagliati che possono essere desiderabili con il modello Fv6 per ridurre il rumore.

Il CLIP Skip predefinito è 2, ma provare 1 può migliorare l'adesione al prompt, e 3-4 può migliorare il focus sui concetti.

Per i modelli Flux, i sampler preferiti sono DPM++ 2M beta o sgm_uniform.

Le impostazioni CFG influenzano molto la qualità dell'immagine; CFG basso (1.5-2.5) evita l'effetto pelle di plastica nelle foto, mentre negli stili di illustrazione può essere richiesto un CFG più alto (3-6+).

CFG o passaggi inappropriati causano spesso immagini sfocate o malformate, e possono essere necessari aggiustamenti a seconda dello stile.

Punti Salienti della Versione

Basato su Fv4 con una fusione con alcune versioni precedenti dei miei modelli così come BigLove_XL2 per spingere ulteriormente il realismo.

Il risultato è che Fv5 è finora la mia versione più fotorealistica con immagini più precise e sottili rispetto a F4, ma man mano che il realismo aumenta il modello è sempre meno capace di produrre immagini stilizzate, specialmente illustrazioni: una nuova versione della serie G arriverà presto per questi casi d'uso :)

Per le impostazioni, DPM++ 2/3M SDE / Karras o Exponential sono sempre una buona scelta con più di 25 passaggi e CFG intorno a 5-7. Ma DPM++ SDE / Karras con meno passaggi (es. 12) e CFG più alto (8-11) vale la pena provare. Il default CLIP SKIP di 2 è anche una buona scelta, ma vale la pena provare anche 1 o 3-4.

Sponsor del Creatore

Se apprezzi il mio contributo a questa comunità, sentiti libero di offrirmi un caffè: più caffeina bevo, più modelli posso creare 😅

Galleria confronto qui: Fv6-Fv5 e confronto illustrazioni NSFW tra Gv1-Cv6-Fv2.

Modello SOTA attuale nel mio esperimento:

Modello base SDXL: Gv4 è il modello più equilibrato che permette immagini sia realistiche che stilizzate NSFW e SFW. Migliore estetica rispetto a Fv6 ma meno fotorealistico.
Modello SDXL fotorealistico (SFW e NSFW): Fv6 è la scelta per l'iper-realismo, comprese immagini realistiche NSFW, ma manca in gran parte delle capacità stilistiche di Gv4.
Illustrazione SDXL: Gv4 (SFW e NSFW). Tuttavia Cv6 vale ancora la pena provare se non ti interessano immagini NSFW.

Modello Flux: Flux1-A1

Impostazioni di generazione immagini per modelli SDXL

DPM++ 2/3M SDE / Karras o Exponential sono sempre una buona scelta con più di 25 passaggi e CFG intorno a 5-7. Ma DPM++ SDE / Karras con meno passaggi (es. 12) e CFG più alto (8-11) vale la pena provare così come Euler Ancestral / Normal per un risultato meno dettagliato che può essere interessante con un modello come Fv6 per ottenere qualcosa di meno "rumoroso".

Il default CLIP Skip di 2 è anche una buona scelta, ma usare 1 o 3-4 vale la pena provarlo: 1 spinge più verso l'adesione al prompt e 3-4 a volte danno risultati migliori del default focalizzandosi più sui "concetti".

Impostazioni di generazione immagini per modelli Flux

Le mie impostazioni preferite sono DPM++ 2M / beta o sgm_uniform o DDEIS / normal per sampler/scheduler, beta produce un'immagine più audace e marcata. Per un'immagine più sottile, Euler / simple o beta sembrano una buona scelta.

Il CFG sembra avere un grande impatto sull'immagine finale ed è molto sensibile anche a piccole variazioni.

Per le foto, il CFG dovrebbe rimanere basso (1.5-2.5) per evitare l'effetto pelle di plastica.
Per arte fine e illustrazione è più complicato perché dipende dal medium. Per stili "ruvidi" (pittura, acquerelli ecc.), il CFG dovrebbe rimanere piuttosto basso nel range 1.5-2.5, ma per stile anime o fumetti il CFG deve spesso essere spinto più in alto per ottenere lo stile desiderato (3-6 o più).

Se l'immagine è confusa/malformata o sfocata, spesso è perché CFG/passaggi sono inappropriati per quell'immagine, ma non è sempre facile sapere se CFD/passaggi debbano essere aumentati o diminuiti (almeno per me 😊).

Ci sarà sicuramente molto da imparare riguardo al comportamento di Flux, che è piuttosto diverso da SDXL e dovremo adattarci.

Flusso di lavoro

Tutte le mie immagini sono caricate con flusso di lavoro ComfyUI incorporato che purtroppo è incompatibile con il processamento CivitAI e spesso il prompt non può essere recuperato. Tuttavia, puoi scaricare l'immagine PNG originale con il flusso di lavoro incluso cliccando sull'icona "DOWNLOAD" nel visualizzatore immagini.

Perché cerco di pubblicare principalmente immagini direttamente dal mio modello con forse un po' di Lora (mia o qualche miglioratore di dettagli), a volte uso anche Controlnet per ottenere composizioni più dettagliate più facilmente: in questo caso l'immagine sorgente ovviamente non è nel flusso di lavoro, ma immagino tu possa comunque usare l'immagine che pubblico come sorgente se vuoi fare una variazione :)

Passato

A partire dalla serie E, i modelli evolvono a volte fondendosi con altri modelli (grazie ad altri contributori!), ma principalmente tramite addestramento sul mio dataset: un dataset modesto (~2000 immagini attualmente), ma cerco in qualche modo di compensare con qualità e originalità.

A partire da Fv1, ho incluso molte immagini sintetiche che ho creato usando versioni precedenti: giocando intensamente con il prompt e ritoccando quando necessario il risultato in Photoshop per avere un dataset che contiene molte immagini originali.

L'idea centrale dietro questo modello era creare uno strumento versatile fondendo alcuni dei migliori modelli esistenti che si adattassero al mio gusto personale (fotografia e arte fantasy per semplificare). I miei obiettivi principali erano:

Fotorealismo: la capacità di produrre immagini straordinariamente realistiche di persone e oggetti/natura.
Flessibilità: la capacità di creare immagini altamente stilizzate, permettendo espressione artistica tramite vari stili e combinazioni di artisti. Sono di una generazione più vecchia e provengo dall'Europa quindi "stile" per me non significa "kawaii giapponese con tette" o "cartone DC Comics con tanti supereroi e bionde voluttuose" ma piuttosto un universo di Frank Frazetta, Milo Manara, Boris Vallejo, H.R.Giger, Wojtek Siudmak e altri maestri dell'arte fantasy: ci sono tette di sicuro, ma lo stile è un po' diverso :P
Poiché non mi piace essere limitato nella mia esplorazione del corpo umano, l'idea è anche avere un modello NSFW abbastanza capace. Tuttavia, a causa della natura delle immagini disponibili nei dataset, NSFW spesso comporta un forte bias verso foto porno o anime porno giapponesi e impatta la flessibilità (tipicamente appena usi la parola "sexy" nel prompt devi bilanciare lo stile). Questo punto NON è la priorità per il modello base ma viene spinto nel modello NSFW.

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

ICBINP XL - v4

MonsterCoffeeBang! Mix - v1.1 No VAE

Usa questo modello