Una giovane donna con ali di insetto e orecchie rosse da gatto su pattini a rotelle che scivola rapidamente attraverso una strada cittadina sfocata, indossando un corsetto, gonna stampata e stivali rossi con tacco alto.

Prompt Consigliati

(photography by Jimmy Nelson and Sally Mann:1.0), (anus gaping), eye contact, (petite-bodied African) girl with her ass spread apart, hairy asshole, rear view, beautiful out of focus background

Prompt Negativi Consigliati

child, big boobs, ((watermark)), ((make-up)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Parametri Consigliati

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, dpmpp_3m_sde, dpmpp_3m_sde_gpu, DPM++ 3M SDE Exponential

steps

12 - 25

cfg

4 - 11

Suggerimenti

Per i modelli SDXL, usa più di 25 passi e CFG intorno a 5-7 con sampler come DPM++ 2/3M SDE Karras o Exponential.

Prova DPM++ SDE Karras con meno passi (es. 12) e CFG più alto (8-11) per risultati diversi.

Il sampler Euler Ancestral / Normal può dare risultati meno dettagliati, utile con Fv6 per immagini meno rumorose.

Il default di CLIP Skip è 2; 1 aumenta l'aderenza al prompt, 3-4 a volte migliora il focus sul concetto.

Il CFG nel modello Flux è sensibile; per foto mantieni il CFG basso (1.5-2.5) per evitare effetto pelle plastica.

Per stili ruvidi in Flux, mantieni il CFG basso (1.5-2.5); per stile anime/fumetto è consigliato CFG più alto (3-6+).

Punti Salienti della Versione

Versione F migliorata con rappresentazione NSFW più realistica: migliore comprensione dei concetti e texture della pelle migliorata (vedi immagini di confronto)

Basato su Fv2 con l'unione di batchXLPHOTOREAL_v1 e alcune Lora addestrate personalmente.

Sponsor del Creatore

Se apprezzi il mio contributo a questa comunità, sentiti libero di offrirmi un caffè: più caffeina bevo, più modelli posso creare 😅

Se apprezzi il mio contributo a questa comunità, sentiti libero di offrirmi un caffè: più caffeina bevo, più modelli posso creare 😅

Galleria comparativa qui: Fv6-Fv5 e confronto illustrativo NSFW tra Gv1-Cv6-Fv2.

Modello SOTA attuale nel mio esperimento:

  • Modello base SDXL: Gv4 è il modello più equilibrato che permette immagini NSFW e SFW sia realistiche che stilizzate. Estetica migliore di Fv6 ma meno fotorealistica.

  • Modello SDXL fotorealistico (SFW e NSFW): Fv6 è la scelta per l'iper-realismo, incluse immagini NSFW realistiche, ma manca principalmente delle capacità stilistiche di Gv4.

  • Illustrazione SDXL : Gv4 (SFW e NSFW). Cv6 vale comunque la pena di essere provato se non ti interessano immagini NSFW.

  • Modello Flux: Flux1-A1

Impostazioni di generazione immagine per i modelli SDXL

DPM++ 2/3M SDE / Karras o Exponential sono sempre una buona scelta con 25+ passi e CFG intorno a 5-7. Ma DPM++ SDE / Karras con meno passi (es. 12) e CFG più alto (8-11) vale la pena provarlo, così come Euler Ancestral / Normal per un risultato meno dettagliato che può essere interessante con un modello come Fv6 per ottenere qualcosa di meno "rumoroso".

Il default CLIP Skip di 2 è una buona scelta, ma usare 1 o 3-4 vale la pena di provare: 1 spinge di più verso l'aderenza al prompt e 3-4 a volte danno un risultato migliore del default concentrandosi più sui "concetti".

Impostazioni di generazione immagine per modelli Flux

Le mie impostazioni preferite sono DPM++ 2M / beta o sgm_uniform o DDEIS / normal per il sampler / scheduler, beta offre un'immagine più audace e forte. Per un'immagine più sottile, Euler / simple o beta sembrano una buona scelta.

Il CFG sembra avere un enorme impatto sull'immagine finale ed è molto sensibile anche a piccole variazioni.

  • Per le foto, il CFG dovrebbe rimanere basso (1.5-2.5) per evitare l'effetto pelle di plastica.

  • Per l'arte raffinata e l'illustrazione è più complicato perché dipende dal mezzo. Per stili "ruvidi" (pittura, acquerelli ecc.), il CFG dovrebbe restare abbastanza basso nell'intervallo 1.5-2.5, ma per lo stile anime o fumetto, spesso il CFG deve essere aumentato per raggiungere lo stile desiderato (3-6 o più).

Se l'immagine è disordinata/malformata o sfocata, spesso è perché il CFG/passi sono inappropriati per quell'immagine, ma non è sempre facile sapere se aumentando o diminuendo CFG/passi (almeno per me 😊).

C'è sicuramente molto da imparare riguardo al comportamento di Flux che è abbastanza diverso da SDXL e dovremo adattarci.

Workflow

Tutte le mie immagini sono caricate con il workflow ComfyUI incorporato che purtroppo è incompatibile con l'elaborazione di CivitAI e spesso il prompt non può essere recuperato. Puoi comunque scaricare l'immagine PNG originale con il workflow incluso cliccando sull'icona "DOWNLOAD" nel visualizzatore immagini.

Perché provo a pubblicare per lo più immagini direttamente dal mio modello con magari un po' di Lora (mia o qualche miglioratore di dettagli), uso anche a volte ora Controlnet per ottenere composizioni migliori e più dettagliate più facilmente: in questo caso l'immagine sorgente ovviamente non è nel workflow, ma suppongo tu possa comunque usare l'immagine che pubblico come sorgente se vuoi fare una variazione :)

Passato


Partendo dalla serie E, i modelli si evolvono a volte unendosi con altri modelli (grazie ad altri contributori!), ma soprattutto tramite l'addestramento sul mio set di dati personale: un modesto set di dati (~2000 immagini attualmente), ma cerco in qualche modo di compensare con qualità e originalità.

A partire da Fv1, ho incluso molte immagini sintetiche che ho creato usando versioni precedenti: lavorando molto con il prompt e ritoccando se necessario il risultato in Photoshop per avere un set di dati che contiene molte immagini originali.


L'idea principale dietro questo modello era di creare uno strumento versatile unendo alcuni dei migliori modelli esistenti che si adattano al mio gusto personale (fotografia e arte fantasy per semplificare). I miei obiettivi primari erano:

  1. Fotorealismo: la capacità di produrre immagini sorprendentemente realistiche sia di persone che di oggetti/natura.

  2. Flessibilità: la capacità di creare immagini altamente stilizzate, permettendo l’espressione artistica tramite vari stili e combinazioni di artisti. Vengo da una generazione più anziana e dall'Europa, quindi "stile" per me non significa "kawaii giapponese con tette" o "cartone DC Comics con tanti supereroi e bionde voluttuose" ma più dall'universo di Frank Frazetta, Milo Manara, Boris Vallejo, H.R.Giger, Wojtek Siudmak e simili maestri dell’arte fantasy: ci sono certo seni coinvolti, ma lo stile è un po' diverso :P

  3. Dal momento che non mi piace essere limitato nella mia esplorazione del corpo umano, l'idea è anche avere un modello NSFW abbastanza capace. Tuttavia, a causa della natura delle immagini di addestramento disponibili nei dataset, NSFW spesso viene con un forte bias verso foto porno o anime porno giapponesi e impatta la flessibilità (tipicamente non appena usi la parola "sexy" nel prompt devi pesare nello stile). Questo punto quindi NON è la priorità per il modello base ma viene spinto nel modello NSFW.

Precedente
YFG Rounded Architecture and Vehicles [Flux] - v1.0
Successivo
(O.D.O.R.) - feet_anime_flux - v1

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

SDXL 1.0

Versione del modello

Fv3

Hash del modello

cc103f3491

Discussione

Per favore log in per lasciare un commento.

Immagini di The Araminta Experiment (SDXL+Flux) - Fv3

Una giovane donna con ali di insetto e orecchie rosse da gatto su pattini a rotelle che scivola rapidamente attraverso una strada cittadina sfocata, indossando un corsetto, gonna stampata e stivali rossi con tacco alto.

Immagini con modello base

Scena fotorealistica di personaggi non morti tra zombie e scheletri che camminano attraverso un cimitero spettrale illuminato da jack-o'-lantern luminosi sotto un cielo scuro e minaccioso.

Immagini con contenuto adulto

Una giovane donna posata che indossa una tuta rossa vibrante con dettaglio colletto nero, seduta elegantemente su una sedia in legno rivestita cremisi, con capelli scuri lisci e volto dettagliato.
Vista di profilo di una guerriera cyberpunk con lunghi capelli rosa intrecciati, tatuaggi sul braccio, che indossa un giubbotto d'armatura turchese e tiene una katana, ambientata in uno sfondo industriale illuminato al neon.
Illustrazione in stile anime di una ragazza bionda con occhi azzurri che indossa un bikini rosso, che posa con sicurezza sulla spiaggia con gocce d'acqua sulla pelle e onde sullo sfondo.
Un dipinto digitale dettagliato di una feroce guerriera con lunghi capelli rossi accovacciata su un piedistallo di pietra in un cimitero, con una spada sulla schiena. Indossa un'armatura scura e un mantello turchese, illuminata da fulmini mistici nel cielo notturno.
Una giovane donna con cappello di paglia e vestito si appoggia alla sua bicicletta su un sentiero di campagna circondato da fiori selvatici, osservando il tramonto su un villaggio e dolci colline.
Ritratto in primo piano di una principessa guerriera vichinga con mohawk bianco, occhi azzurri, gioielli intricati, abiti di pelliccia e tatuaggi, su uno sfondo notturno con nebulosa e stelle.
Una donna steampunk con capelli intrecciati e occhiali sulla testa, con torso meccanico a orologeria trasparente con ingranaggi e pistoni visibili, posata con sicurezza in un paesaggio urbano meccanico.
Vista ravvicinata di una donna petite che indossa occhiali da sole e una giacca di pelle, illuminata da luci al neon in una città futuristica di notte con stile synthwave retrò anni '80.
Una donna cyborg cyberpunk con corna rosse oni e capelli neri, che indossa una maschera nera e braccia meccaniche blu, che tiene una spada katana blu luminosa in un corridoio futuristico oscuro.
Una ragazza in stile cyberpunk con capelli corti neri, indossa una maglia gialla e pantaloni neri a vita alta, tiene un'arma futuristica davanti a un grande carro mecha e uno sfondo industriale.

Immagini con fotorealistico

Immagine fotorealistica di un modello alato che posa drammaticamente con tacchi alti in un'ambientazione da sfilata di moda in stile film vintage e fumoso.
Ritratto a figura intera di una donna con capelli rossi e lentiggini che indossa un abito lungo giallo senape con maniche corte arricciate, in piedi tra le foglie della giungla su uno sfondo scuro.
Husky siberiano fotorealistico che indossa mimetica da spec-ops innevata e si trova in una foresta di pini innevata con riflessi di luce.
Primo piano fotorealistico di donna metà umana metà cyborg in un vivace accappatoio rosso che tiene due spade samurai in una città noir anni '40, scura e fumosa.
Fotografia macro che mostra gambi di fiori selvatici in silhouette contro un grande tramonto arancione con sfere di luce bokeh sullo sfondo.
Silhouette di un uomo che indossa una corona di spine bioluminescente luminosa con luci viola su sfondo blu scuro.
Illustrazione digitale fotorealistica di una camera da letto futuristica con proiezione olografica di un personaggio a tema spaziale in toni blu sopra il letto ornato, con una donna in un abito futuristico elegante seduta sul letto in una stanza lussuosa con pareti blu e vista sulla città.
Personaggio bambola creepy-cute con arti cuciti, occhi a bottone e capelli rosa gemelli legati con nastri neri, indossa un abito verde e un grande papillon rosa, con la mano dietro la testa, in piedi contro uno sfondo testurizzato turchese e beige.

Immagini con realistico

Una giovane ragazza con lunghi capelli bianchi che indossa una tuta nera da Iron Man e una maschera futuristica nera, in piedi davanti a un alieno dalla pelle nera con occhi rossi luminosi all'interno di un’astronave buia.
Uomo realistico che indossa un'armatura potenziata scifi high-tech con peli del viso e occhi azzurri, in piedi in un ambiente urbano con sfondo sfocato.
Primo piano di una donna bionda che indossa un'armatura metallica dettagliata e riflettente con spalline e corazza, con uno sfondo sfocato di antichi pilastri di pietra.
Donna muscolosa resa in 3D con lentiggini e capelli neri in una tuta lucida, che posa su sfondo rosso semplice con illuminazione cinematografica e stile atompunk.
Un soldato futuristico cyberpunk che indossa un'armatura e un elmetto high-tech, con due armi in mano, in piedi su uno sfondo bianco semplice con vivaci luci neon.
Inquadratura ampia di rovine futuristiche di fantascienza avvolte nella nebbia e nelle nuvole sotto un cielo nuvoloso, con strutture imponenti e un'atmosfera oscura.
Una enorme astronave incastrata si staglia su una palude morta con fuoco brillante e nebbia fitta sotto un cielo giallo-arancione, con illuminazione drammatica e inquietante ed elementi sci-fi dettagliati.
Un topo realistico che indossa un'armatura d'oro dettagliata e un mantello scuro, in piedi su una strada di ciottoli con illuminazione cinematografica drammatica ed effetti di grana della pellicola.
Una giovane donna realistica distesa sul suolo della foresta con le cosce incrociate e le mani sulle ginocchia, con espressione preoccupata. La luce del sole crea un riflesso con sfondo sfocato di alberi misti sempreverdi e decidui.

Immagini con donna

Una donna che tiene una candela accesa con uno sfondo nero che illumina metà del suo volto con la calda luce della candela.
Ritratto di una donna con capelli biondo platino e occhi viola, che indossa un crop top nero off-shoulder, in piedi contro un muro testurizzato marrone giallastro, con un tatuaggio sul braccio superiore e fisico tonico.
Donna muscolosa resa in 3D con lentiggini e capelli neri in una tuta lucida, che posa su sfondo rosso semplice con illuminazione cinematografica e stile atompunk.
Ritratto ravvicinato di una donna con occhi verdi sdraiata su un letto, illuminata dalla calda luce del tramonto all'interno.
Ritratto ravvicinato di una donna con capelli medi disordinati e luce calda sulle labbra, incorniciata da una finestra vintage con un'ombra parziale e riflesso della Torre Eiffel.
Donna in stile anime con capelli verdi a forma di serpente seduta su una sedia da ufficio blu alla sua scrivania, indossa abbigliamento da lavoro e tacchi alti neri.
Una donna somigliante a Medusa con serpenti verdi come capelli, che indossa occhiali e un vestito rosso, che saluta l'osservatore con grandi occhi verdi.
Ritratto di moda in bianco e nero di una donna elegante seduta sul bordo di una barca, nello stile malinconico ispirato a Peter Lindbergh.
Una rappresentazione realistica e surreale di una donna in un abito nero illuminata da un vibrante bagliore rosso, in piedi in un’illuminazione drammatica.
Elegante donna elfo con capelli rosso-arancio fluenti, abito nero e oro intricato, in piedi in una metropoli fantasy distopica