Giraffa in bianco e nero che osserva un gigantesco tarassaco su una collina innevata sotto un cielo ventoso che disperde semi di tarassaco in toni monocromatici.

Prompt Negativi Consigliati

big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Parametri Consigliati

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, DPM++ 2M beta, sgm_uniform, DDEIS, normal, simple, beta, dpmpp_3m_sde, dpmpp_3m_sde_gpu

steps

12 - 25

cfg

1.5 - 11

Suggerimenti

Usa DPM++ 2/3M SDE con i sampler Karras o Exponential e più di 25 passaggi con CFG intorno a 5-7 per i migliori risultati SDXL.

Prova DPM++ SDE Karras con meno passaggi (es. 12) e CFG più alto (8-11) per stili alternativi.

I sampler Euler Ancestral / Normal producono risultati meno dettagliati che possono essere desiderabili con il modello Fv6 per ridurre il rumore.

Il CLIP Skip predefinito è 2, ma provare 1 può migliorare l'adesione al prompt, e 3-4 può migliorare il focus sui concetti.

Per i modelli Flux, i sampler preferiti sono DPM++ 2M beta o sgm_uniform.

Le impostazioni CFG influenzano molto la qualità dell'immagine; CFG basso (1.5-2.5) evita l'effetto pelle di plastica nelle foto, mentre negli stili di illustrazione può essere richiesto un CFG più alto (3-6+).

CFG o passaggi inappropriati causano spesso immagini sfocate o malformate, e possono essere necessari aggiustamenti a seconda dello stile.

Punti Salienti della Versione

Basato su Fv4 con una fusione con alcune versioni precedenti dei miei modelli così come BigLove_XL2 per spingere ulteriormente il realismo.

Il risultato è che Fv5 è finora la mia versione più fotorealistica con immagini più precise e sottili rispetto a F4, ma man mano che il realismo aumenta il modello è sempre meno capace di produrre immagini stilizzate, specialmente illustrazioni: una nuova versione della serie G arriverà presto per questi casi d'uso :)

Per le impostazioni, DPM++ 2/3M SDE / Karras o Exponential sono sempre una buona scelta con più di 25 passaggi e CFG intorno a 5-7. Ma DPM++ SDE / Karras con meno passaggi (es. 12) e CFG più alto (8-11) vale la pena provare. Il default CLIP SKIP di 2 è anche una buona scelta, ma vale la pena provare anche 1 o 3-4.

Sponsor del Creatore

Se apprezzi il mio contributo a questa comunità, sentiti libero di offrirmi un caffè: più caffeina bevo, più modelli posso creare 😅

Se apprezzi il mio contributo a questa comunità, sentiti libero di offrirmi un caffè: più caffeina bevo, più modelli posso creare 😅

Galleria confronto qui: Fv6-Fv5 e confronto illustrazioni NSFW tra Gv1-Cv6-Fv2.

Modello SOTA attuale nel mio esperimento:

  • Modello base SDXL: Gv4 è il modello più equilibrato che permette immagini sia realistiche che stilizzate NSFW e SFW. Migliore estetica rispetto a Fv6 ma meno fotorealistico.

  • Modello SDXL fotorealistico (SFW e NSFW): Fv6 è la scelta per l'iper-realismo, comprese immagini realistiche NSFW, ma manca in gran parte delle capacità stilistiche di Gv4.

  • Illustrazione SDXL: Gv4 (SFW e NSFW). Tuttavia Cv6 vale ancora la pena provare se non ti interessano immagini NSFW.

  • Modello Flux: Flux1-A1

Impostazioni di generazione immagini per modelli SDXL

DPM++ 2/3M SDE / Karras o Exponential sono sempre una buona scelta con più di 25 passaggi e CFG intorno a 5-7. Ma DPM++ SDE / Karras con meno passaggi (es. 12) e CFG più alto (8-11) vale la pena provare così come Euler Ancestral / Normal per un risultato meno dettagliato che può essere interessante con un modello come Fv6 per ottenere qualcosa di meno "rumoroso".

Il default CLIP Skip di 2 è anche una buona scelta, ma usare 1 o 3-4 vale la pena provarlo: 1 spinge più verso l'adesione al prompt e 3-4 a volte danno risultati migliori del default focalizzandosi più sui "concetti".

Impostazioni di generazione immagini per modelli Flux

Le mie impostazioni preferite sono DPM++ 2M / beta o sgm_uniform o DDEIS / normal per sampler/scheduler, beta produce un'immagine più audace e marcata. Per un'immagine più sottile, Euler / simple o beta sembrano una buona scelta.

Il CFG sembra avere un grande impatto sull'immagine finale ed è molto sensibile anche a piccole variazioni.

  • Per le foto, il CFG dovrebbe rimanere basso (1.5-2.5) per evitare l'effetto pelle di plastica.

  • Per arte fine e illustrazione è più complicato perché dipende dal medium. Per stili "ruvidi" (pittura, acquerelli ecc.), il CFG dovrebbe rimanere piuttosto basso nel range 1.5-2.5, ma per stile anime o fumetti il CFG deve spesso essere spinto più in alto per ottenere lo stile desiderato (3-6 o più).

Se l'immagine è confusa/malformata o sfocata, spesso è perché CFG/passaggi sono inappropriati per quell'immagine, ma non è sempre facile sapere se CFD/passaggi debbano essere aumentati o diminuiti (almeno per me 😊).

Ci sarà sicuramente molto da imparare riguardo al comportamento di Flux, che è piuttosto diverso da SDXL e dovremo adattarci.

Flusso di lavoro

Tutte le mie immagini sono caricate con flusso di lavoro ComfyUI incorporato che purtroppo è incompatibile con il processamento CivitAI e spesso il prompt non può essere recuperato. Tuttavia, puoi scaricare l'immagine PNG originale con il flusso di lavoro incluso cliccando sull'icona "DOWNLOAD" nel visualizzatore immagini.

Perché cerco di pubblicare principalmente immagini direttamente dal mio modello con forse un po' di Lora (mia o qualche miglioratore di dettagli), a volte uso anche Controlnet per ottenere composizioni più dettagliate più facilmente: in questo caso l'immagine sorgente ovviamente non è nel flusso di lavoro, ma immagino tu possa comunque usare l'immagine che pubblico come sorgente se vuoi fare una variazione :)

Passato


A partire dalla serie E, i modelli evolvono a volte fondendosi con altri modelli (grazie ad altri contributori!), ma principalmente tramite addestramento sul mio dataset: un dataset modesto (~2000 immagini attualmente), ma cerco in qualche modo di compensare con qualità e originalità.

A partire da Fv1, ho incluso molte immagini sintetiche che ho creato usando versioni precedenti: giocando intensamente con il prompt e ritoccando quando necessario il risultato in Photoshop per avere un dataset che contiene molte immagini originali.


L'idea centrale dietro questo modello era creare uno strumento versatile fondendo alcuni dei migliori modelli esistenti che si adattassero al mio gusto personale (fotografia e arte fantasy per semplificare). I miei obiettivi principali erano:

  1. Fotorealismo: la capacità di produrre immagini straordinariamente realistiche di persone e oggetti/natura.

  2. Flessibilità: la capacità di creare immagini altamente stilizzate, permettendo espressione artistica tramite vari stili e combinazioni di artisti. Sono di una generazione più vecchia e provengo dall'Europa quindi "stile" per me non significa "kawaii giapponese con tette" o "cartone DC Comics con tanti supereroi e bionde voluttuose" ma piuttosto un universo di Frank Frazetta, Milo Manara, Boris Vallejo, H.R.Giger, Wojtek Siudmak e altri maestri dell'arte fantasy: ci sono tette di sicuro, ma lo stile è un po' diverso :P

  3. Poiché non mi piace essere limitato nella mia esplorazione del corpo umano, l'idea è anche avere un modello NSFW abbastanza capace. Tuttavia, a causa della natura delle immagini disponibili nei dataset, NSFW spesso comporta un forte bias verso foto porno o anime porno giapponesi e impatta la flessibilità (tipicamente appena usi la parola "sexy" nel prompt devi bilanciare lo stile). Questo punto NON è la priorità per il modello base ma viene spinto nel modello NSFW.

Precedente
ICBINP XL - v4
Successivo
MonsterCoffeeBang! Mix - v1.1 No VAE

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

SDXL 1.0

Versione del modello

Fv5

Hash del modello

17b3e65f07

Discussione

Per favore log in per lasciare un commento.

Immagini di The Araminta Experiment (SDXL+Flux) - Fv5

Giraffa in bianco e nero che osserva un gigantesco tarassaco su una collina innevata sotto un cielo ventoso che disperde semi di tarassaco in toni monocromatici.

Immagini con modello base

Scena fotorealistica di personaggi non morti tra zombie e scheletri che camminano attraverso un cimitero spettrale illuminato da jack-o'-lantern luminosi sotto un cielo scuro e minaccioso.

Immagini con contenuto adulto

Una giovane donna posata che indossa una tuta rossa vibrante con dettaglio colletto nero, seduta elegantemente su una sedia in legno rivestita cremisi, con capelli scuri lisci e volto dettagliato.
Vista di profilo di una guerriera cyberpunk con lunghi capelli rosa intrecciati, tatuaggi sul braccio, che indossa un giubbotto d'armatura turchese e tiene una katana, ambientata in uno sfondo industriale illuminato al neon.
Illustrazione in stile anime di una ragazza bionda con occhi azzurri che indossa un bikini rosso, che posa con sicurezza sulla spiaggia con gocce d'acqua sulla pelle e onde sullo sfondo.
Un dipinto digitale dettagliato di una feroce guerriera con lunghi capelli rossi accovacciata su un piedistallo di pietra in un cimitero, con una spada sulla schiena. Indossa un'armatura scura e un mantello turchese, illuminata da fulmini mistici nel cielo notturno.
Una giovane donna con cappello di paglia e vestito si appoggia alla sua bicicletta su un sentiero di campagna circondato da fiori selvatici, osservando il tramonto su un villaggio e dolci colline.
Ritratto in primo piano di una principessa guerriera vichinga con mohawk bianco, occhi azzurri, gioielli intricati, abiti di pelliccia e tatuaggi, su uno sfondo notturno con nebulosa e stelle.
Una donna steampunk con capelli intrecciati e occhiali sulla testa, con torso meccanico a orologeria trasparente con ingranaggi e pistoni visibili, posata con sicurezza in un paesaggio urbano meccanico.
Vista ravvicinata di una donna petite che indossa occhiali da sole e una giacca di pelle, illuminata da luci al neon in una città futuristica di notte con stile synthwave retrò anni '80.
Una donna cyborg cyberpunk con corna rosse oni e capelli neri, che indossa una maschera nera e braccia meccaniche blu, che tiene una spada katana blu luminosa in un corridoio futuristico oscuro.
Una ragazza in stile cyberpunk con capelli corti neri, indossa una maglia gialla e pantaloni neri a vita alta, tiene un'arma futuristica davanti a un grande carro mecha e uno sfondo industriale.

Immagini con fotorealistico

Hyper-realistic emerald green snake coiled on a moss-covered tree branch with mouth wide open, revealing venomous fangs dripping with venom, surrounded by lush tropical foliage and soft sunlight.
Primo piano di una testa umanoide rettiliana fotorealistica con pelle squamosa testurizzata e altamente dettagliata illuminata da una luce calda drammatica.
Ritratto di una dama medievale bassa che indossa un'armatura brigandina rinforzata con piastra metallica sul petto e bracciali alle braccia, in piedi in una piazza medievale con occhi gialli e capelli neri corti.
Immagine fotorealistica di un modello alato che posa drammaticamente con tacchi alti in un'ambientazione da sfilata di moda in stile film vintage e fumoso.
Ritratto a figura intera di una donna con capelli rossi e lentiggini che indossa un abito lungo giallo senape con maniche corte arricciate, in piedi tra le foglie della giungla su uno sfondo scuro.
Husky siberiano fotorealistico che indossa mimetica da spec-ops innevata e si trova in una foresta di pini innevata con riflessi di luce.
Primo piano fotorealistico di donna metà umana metà cyborg in un vivace accappatoio rosso che tiene due spade samurai in una città noir anni '40, scura e fumosa.
Fotografia macro che mostra gambi di fiori selvatici in silhouette contro un grande tramonto arancione con sfere di luce bokeh sullo sfondo.

Immagini con realistico

Stylized portrait of a cat girl with blue skin, glowing red eyes, white hair, and futuristic makeup wearing a black armor-like outfit against a vibrant red and blue background with neon lighting and red smoke.
Ritratto animato di Lois Lane che indossa una giacca di abito viola e gonna nera, in piedi su una strada urbana con grattacieli sullo sfondo, che tiene una borsa viola e sorride.
Una giovane ragazza con lunghi capelli bianchi che indossa una tuta nera da Iron Man e una maschera futuristica nera, in piedi davanti a un alieno dalla pelle nera con occhi rossi luminosi all'interno di un’astronave buia.
Uomo realistico che indossa un'armatura potenziata scifi high-tech con peli del viso e occhi azzurri, in piedi in un ambiente urbano con sfondo sfocato.
Primo piano di una donna bionda che indossa un'armatura metallica dettagliata e riflettente con spalline e corazza, con uno sfondo sfocato di antichi pilastri di pietra.
Donna muscolosa resa in 3D con lentiggini e capelli neri in una tuta lucida, che posa su sfondo rosso semplice con illuminazione cinematografica e stile atompunk.
Un soldato futuristico cyberpunk che indossa un'armatura e un elmetto high-tech, con due armi in mano, in piedi su uno sfondo bianco semplice con vivaci luci neon.
Inquadratura ampia di rovine futuristiche di fantascienza avvolte nella nebbia e nelle nuvole sotto un cielo nuvoloso, con strutture imponenti e un'atmosfera oscura.
Una enorme astronave incastrata si staglia su una palude morta con fuoco brillante e nebbia fitta sotto un cielo giallo-arancione, con illuminazione drammatica e inquietante ed elementi sci-fi dettagliati.

Immagini con donna

Una donna elfo dai capelli argento che indossa un'armatura futuristica si erge contro un cielo vorticoso e colorato con nuvole, raffigurata in uno stile vivido di pittura a olio cyberpunk.
Ritratto animato di Lois Lane che indossa una giacca di abito viola e gonna nera, in piedi su una strada urbana con grattacieli sullo sfondo, che tiene una borsa viola e sorride.
Ritratto a figura intera di una donna con lentiggini e lunghi capelli rossi che indossa un abito fluente multicolore nei toni dell'arancione, viola e blu.
Una donna che tiene una candela accesa con uno sfondo nero che illumina metà del suo volto con la calda luce della candela.
Ritratto di una donna con capelli biondo platino e occhi viola, che indossa un crop top nero off-shoulder, in piedi contro un muro testurizzato marrone giallastro, con un tatuaggio sul braccio superiore e fisico tonico.
Donna muscolosa resa in 3D con lentiggini e capelli neri in una tuta lucida, che posa su sfondo rosso semplice con illuminazione cinematografica e stile atompunk.
Ritratto ravvicinato di una donna con occhi verdi sdraiata su un letto, illuminata dalla calda luce del tramonto all'interno.
Ritratto ravvicinato di una donna con capelli medi disordinati e luce calda sulle labbra, incorniciata da una finestra vintage con un'ombra parziale e riflesso della Torre Eiffel.
Donna in stile anime con capelli verdi a forma di serpente seduta su una sedia da ufficio blu alla sua scrivania, indossa abbigliamento da lavoro e tacchi alti neri.
Una donna somigliante a Medusa con serpenti verdi come capelli, che indossa occhiali e un vestito rosso, che saluta l'osservatore con grandi occhi verdi.