The Araminta Experiment (SDXL+Flux) - Fv3
Prompt Consigliati
(photography by Jimmy Nelson and Sally Mann:1.0), (anus gaping), eye contact, (petite-bodied African) girl with her ass spread apart, hairy asshole, rear view, beautiful out of focus background
Prompt Negativi Consigliati
child, big boobs, ((watermark)), ((make-up)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb
Parametri Consigliati
samplers
steps
cfg
Suggerimenti
Per i modelli SDXL, usa più di 25 passi e CFG intorno a 5-7 con sampler come DPM++ 2/3M SDE Karras o Exponential.
Prova DPM++ SDE Karras con meno passi (es. 12) e CFG più alto (8-11) per risultati diversi.
Il sampler Euler Ancestral / Normal può dare risultati meno dettagliati, utile con Fv6 per immagini meno rumorose.
Il default di CLIP Skip è 2; 1 aumenta l'aderenza al prompt, 3-4 a volte migliora il focus sul concetto.
Il CFG nel modello Flux è sensibile; per foto mantieni il CFG basso (1.5-2.5) per evitare effetto pelle plastica.
Per stili ruvidi in Flux, mantieni il CFG basso (1.5-2.5); per stile anime/fumetto è consigliato CFG più alto (3-6+).
Punti Salienti della Versione
Versione F migliorata con rappresentazione NSFW più realistica: migliore comprensione dei concetti e texture della pelle migliorata (vedi immagini di confronto)
Basato su Fv2 con l'unione di batchXLPHOTOREAL_v1 e alcune Lora addestrate personalmente.
Sponsor del Creatore
Se apprezzi il mio contributo a questa comunità, sentiti libero di offrirmi un caffè: più caffeina bevo, più modelli posso creare 😅
Se apprezzi il mio contributo a questa comunità, sentiti libero di offrirmi un caffè: più caffeina bevo, più modelli posso creare 😅
Galleria comparativa qui: Fv6-Fv5 e confronto illustrativo NSFW tra Gv1-Cv6-Fv2.

Modello SOTA attuale nel mio esperimento:
Modello base SDXL: Gv4 è il modello più equilibrato che permette immagini NSFW e SFW sia realistiche che stilizzate. Estetica migliore di Fv6 ma meno fotorealistica.
Modello SDXL fotorealistico (SFW e NSFW): Fv6 è la scelta per l'iper-realismo, incluse immagini NSFW realistiche, ma manca principalmente delle capacità stilistiche di Gv4.
Illustrazione SDXL : Gv4 (SFW e NSFW). Cv6 vale comunque la pena di essere provato se non ti interessano immagini NSFW.
Modello Flux: Flux1-A1
Impostazioni di generazione immagine per i modelli SDXL
DPM++ 2/3M SDE / Karras o Exponential sono sempre una buona scelta con 25+ passi e CFG intorno a 5-7. Ma DPM++ SDE / Karras con meno passi (es. 12) e CFG più alto (8-11) vale la pena provarlo, così come Euler Ancestral / Normal per un risultato meno dettagliato che può essere interessante con un modello come Fv6 per ottenere qualcosa di meno "rumoroso".
Il default CLIP Skip di 2 è una buona scelta, ma usare 1 o 3-4 vale la pena di provare: 1 spinge di più verso l'aderenza al prompt e 3-4 a volte danno un risultato migliore del default concentrandosi più sui "concetti".
Impostazioni di generazione immagine per modelli Flux
Le mie impostazioni preferite sono DPM++ 2M / beta o sgm_uniform o DDEIS / normal per il sampler / scheduler, beta offre un'immagine più audace e forte. Per un'immagine più sottile, Euler / simple o beta sembrano una buona scelta.
Il CFG sembra avere un enorme impatto sull'immagine finale ed è molto sensibile anche a piccole variazioni.
Per le foto, il CFG dovrebbe rimanere basso (1.5-2.5) per evitare l'effetto pelle di plastica.
Per l'arte raffinata e l'illustrazione è più complicato perché dipende dal mezzo. Per stili "ruvidi" (pittura, acquerelli ecc.), il CFG dovrebbe restare abbastanza basso nell'intervallo 1.5-2.5, ma per lo stile anime o fumetto, spesso il CFG deve essere aumentato per raggiungere lo stile desiderato (3-6 o più).
Se l'immagine è disordinata/malformata o sfocata, spesso è perché il CFG/passi sono inappropriati per quell'immagine, ma non è sempre facile sapere se aumentando o diminuendo CFG/passi (almeno per me 😊).
C'è sicuramente molto da imparare riguardo al comportamento di Flux che è abbastanza diverso da SDXL e dovremo adattarci.
Workflow
Tutte le mie immagini sono caricate con il workflow ComfyUI incorporato che purtroppo è incompatibile con l'elaborazione di CivitAI e spesso il prompt non può essere recuperato. Puoi comunque scaricare l'immagine PNG originale con il workflow incluso cliccando sull'icona "DOWNLOAD" nel visualizzatore immagini.
Perché provo a pubblicare per lo più immagini direttamente dal mio modello con magari un po' di Lora (mia o qualche miglioratore di dettagli), uso anche a volte ora Controlnet per ottenere composizioni migliori e più dettagliate più facilmente: in questo caso l'immagine sorgente ovviamente non è nel workflow, ma suppongo tu possa comunque usare l'immagine che pubblico come sorgente se vuoi fare una variazione :)
Passato
Partendo dalla serie E, i modelli si evolvono a volte unendosi con altri modelli (grazie ad altri contributori!), ma soprattutto tramite l'addestramento sul mio set di dati personale: un modesto set di dati (~2000 immagini attualmente), ma cerco in qualche modo di compensare con qualità e originalità.
A partire da Fv1, ho incluso molte immagini sintetiche che ho creato usando versioni precedenti: lavorando molto con il prompt e ritoccando se necessario il risultato in Photoshop per avere un set di dati che contiene molte immagini originali.
L'idea principale dietro questo modello era di creare uno strumento versatile unendo alcuni dei migliori modelli esistenti che si adattano al mio gusto personale (fotografia e arte fantasy per semplificare). I miei obiettivi primari erano:
Fotorealismo: la capacità di produrre immagini sorprendentemente realistiche sia di persone che di oggetti/natura.
Flessibilità: la capacità di creare immagini altamente stilizzate, permettendo l’espressione artistica tramite vari stili e combinazioni di artisti. Vengo da una generazione più anziana e dall'Europa, quindi "stile" per me non significa "kawaii giapponese con tette" o "cartone DC Comics con tanti supereroi e bionde voluttuose" ma più dall'universo di Frank Frazetta, Milo Manara, Boris Vallejo, H.R.Giger, Wojtek Siudmak e simili maestri dell’arte fantasy: ci sono certo seni coinvolti, ma lo stile è un po' diverso :P
Dal momento che non mi piace essere limitato nella mia esplorazione del corpo umano, l'idea è anche avere un modello NSFW abbastanza capace. Tuttavia, a causa della natura delle immagini di addestramento disponibili nei dataset, NSFW spesso viene con un forte bias verso foto porno o anime porno giapponesi e impatta la flessibilità (tipicamente non appena usi la parola "sexy" nel prompt devi pesare nello stile). Questo punto quindi NON è la priorità per il modello base ma viene spinto nel modello NSFW.
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Creatore
Discussione
Per favore log in per lasciare un commento.
