modelli/kegant - v1.0 / PDXL

kegant - v1.0 / PDXL

11/5/2025

12:45:18 PM

Parole Chiave e Tag Correlati

anime,checkpoint,tag danbooru,crudo,kegant,illuminazione,effetti di illuminazione,noobai-vpred,pony,modello basato su Pony,ponyv6,retro,retro ruvido,skyger,stable diffusion,stile,v1.0 / pdxl

Ritratto in primo piano di Harley Quinn con occhi blu intensi, capelli rossi legati a due codini, lacrime di mascara che scorrono sulle guance e un'espressione neutra su sfondo bianco solido.

Prompt Consigliati

score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up, solo

Prompt Negativi Consigliati

dark,night,blur,jpeg artifacts,plants,flowers,cyberpunk,1girl

Parametri Consigliati

samplers

Euler A, DPM++A, euler_ancestral_karras, dpmpp_2s_ancestral_karras

steps

20 - 30

cfg

2 - 6

resolution

832x1216, 768x1344

Parametri Consigliati per Alta Risoluzione

upscaler

Euler A, DPM++A

upscale

1.5 - 2

steps

Suggerimenti

Usa 'dark' o 'night' nei prompt negativi per evitare immagini troppo scure.

Aggiungi 'blur' nel prompt negativo per ridurre forti effetti di profondità di campo.

Gli scatti a figura intera sono difficili; specifica 'shoes', 'boots' o 'feet/toes' per migliorare i risultati.

Usa face detailer semplici per volti migliori negli scatti da lontano; sono più veloci degli upscaler latenti.

Abbassa CFG e passi nell’upscaler latente per un aspetto più morbido e 'dipinto'; un CFG più alto produce un aspetto più lucido e 'cottura'.

Evita di sovraccaricare i prompt; a volte meno è meglio con il tagging in stile danbooru.

Aggiungi 'jpeg artifacts', 'plants', 'flowers' e 'cyberpunk' ai prompt negativi per rimuovere artefatti indesiderati.

Specificare '1girl' nei prompt negativi aiuta con la generazione di soggetti maschili.

Punti Salienti della Versione

questa è una semplice fusione. non è stato effettuato alcun addestramento con questa versione.

kegant

✨ semplice workflow comfyui: ✨ https://civitai.com/models/861472?modelVersionId=963859

AGGIORNAMENTO V4: V4 deriva in gran parte dal dataset V3, anche se alcune immagini sono state eliminate, ma soprattutto è un passaggio da pony a noobai-vpred come modello base. Di conseguenza, seguite le convenzioni appropriate a come noobai è stato addestrato con i corretti tag danbooru. Per aiuto, considerate alcune delle mie immagini pubblicate per gli stili di tagging che solitamente metto all’inizio dei miei prompt. Questa versione non è perfetta e probabilmente richiederà una revisione poiché alcuni tag come blur e darkness sono ancora un po’ problematici (molte immagini generate risulteranno più scure). Usate termini come 'dark' o 'night' nei prompt negativi se le immagini rimangono troppo scure, o 'blur' se la profondità di campo è troppo marcata per i vostri gusti; ciò dovrebbe correggere il problema. Il compromesso passando da pony a NAIXL è vasto, soprattutto per quanto riguarda elementi che adoro come illuminazione, bokeh, blur e altri effetti fotografici su cui kegant si basa sin dalla v1. Nessuna delle immagini mostrate è stata photoshoppata o modificata dopo comfy, né ho usato i2i, ma sto usando un face detailer. Questo checkpoint fatica più dei precedenti pony nelle inquadrature a distanza, come 'full_body' o 'wide_angle'. Usate un semplice face detailer, è facile da impostare e gira più veloce di un latent ed è molto efficace per migliorare i volti da lontano. Sto usando questa guida (e funziona molto bene):
https://www.youtube.com/watch?v=gDBeKIa4sHA

AGGIORNAMENTO V3: La V3 è principalmente un aggiornamento sui mostri, con qualche comparsa ma soprattutto introduce un controllo più raffinato sugli elementi artistici. Ho fatto cose piuttosto spinte con questa versione, come modificare manualmente molte immagini sorgente in gimp per rimuovere quanti più artefatti jpeg possibile. Le filigrane sono inesistenti e non sono necessarie negative tag, sono stati risolti problemi con piante e fauna e spero che sia più facile generare soggetti maschili, poiché ne ho aggiunti molti. Per vedere la lista completa dei tag delle immagini incluse in questo aggiornamento, è sotto 'about the version'. Molte immagini in v3 sono state taggate con termini molto potenti, ovvero 'film grain, halftone effect, dark fantasy, muted colors, sepia'. Li potete vedere frequentemente perché le immagini fonte da cui i miei prompt attingono contenevano questi elementi. Se non volete vederli, usate questi termini nei prompt negativi. Lo stile è talmente forte da poter trapelare anche se non viene esplicitato nel prompt. Sono state aggiunte alcune armi, in particolare spade, la 'massive sword' di Guts e il katana (da Cis). Generare immagini con armi è sempre complicato a causa dei limiti di SDXL, ma spero che le immagini aggiunte di katane e spade aiutino a guidare il modello verso pose più accurate con queste armi.

AGGIORNAMENTO V2: la V2 è la prima versione che ho addestrato e influenzato manualmente. Rimane per lo più la stessa struttura di V1, anche se alcuni pesi sono stati ridotti e le immagini aggiunte e addestrate hanno risolto alcuni problemi di V1. La V2 si concentra maggiormente su illuminazione e effetti in stile deserto, modificando leggermente lo stile artistico con occhi e labbra un po' più piccoli. L’illuminazione in questa versione è diventata ancora più estrema e temo che tentare ulteriori cambiamenti potrebbe compromettere tutto. Potremmo chiamarla l’aggiornamento dune di kegant.

kegant PDXL è un modello basato su pony focalizzato a trasformare pony in un aspetto più retro e grintoso, con forte attenzione agli effetti di illuminazione.

Si basa principalmente sulla versione bake di 5 diverse lora e 1 embedding nel modello ponyv6. Questi modelli sono:

https://civitai.com/models/366990/pony-custom-styles?modelVersionId=454703

https://civitai.com/models/341353/expressiveh-hentai-lora-style?modelVersionId=382152

https://civitai.com/models/550871/bss-styles-for-pony?modelVersionId=669776

https://civitai.com/models/122359/detail-tweaker-xl?modelVersionId=135867

https://civitai.com/models/118418/negativexl?modelVersionId=134583

https://civitai.com/models/264290/styles-for-pony-diffusion-v6-xl-not-artists-styles?modelVersionId=330475

Se non vedete l’immagine, durante il bake sono state usate le seguenti impostazioni:

Kenva: .8
ExpressiveH: .8
GLSHS: .8
add_detail: .5
negativeXL_D: 1
Concept Art Twilight: .3

Si noti che questo modello ha una preferenza per la generazione di soggetti femminili, preferendo che non siano né troppo lontani né troppo vicini. Generare figure a tutto corpo può essere difficile, ma se specificate termini come 'shoes', 'boots' o 'feet'/'toes', sarà più incline a fornirvi esempi a tutto corpo. Ricordate — Questo è un checkpoint basato su pony. Preferisce lo stile di tagging danbooru rispetto all’inglese semplice. A volte, meno è meglio. Sovraccaricare un prompt con troppi tag rende più difficile per il modello capire cosa fare. Se il full body è importante, mettetelo all’inizio del prompt, perché più su è nel prompt, più importanza gli viene data. Potete anche pesare manualmente questo tag, cosa che aiuta ulteriormente. Lascio aperti tutti i miei prompt su questo checkpoint per chi cerca indicazioni sul suo utilizzo.

Detto questo, questo checkpoint non è flessibile come il goat (cioè v6), ma ciò che perde in flessibilità guadagna in illuminazione, stile artistico e velocità di generazione. Generare la stessa serie di immagini con tutte le lora integrate è circa 3 volte più veloce rispetto all’uso di v6 con l’intero stack, che era il focus principale di questo checkpoint.

✨ Per favore condividete le vostre creazioni qui sotto! ✨

Grazie a tutti per aver provato il mio primo checkpoint.

Si prega di fare riferimento alla pagina del modello Pony V6 per linee guida più dettagliate sul prompting.

☄️ Raccomandazioni per la generazione

* Tutte le immagini di anteprima sono state generate senza LORA tranne le ultime due con Haruko Haruhara e Lain poiché pony non ha il concetto di questi personaggi e sono personaggi altamente stilizzati, difficili da promtpare da soli. Non sono state usate altre risorse, solo testo a immagine con un secondo passaggio di upscaling latente (senza upscaling pixel).

La maggior parte delle immagini di esempio è stata generata con sampler ancestrali di questi tipi per il passaggio iniziale:

Sampler: Euler A / DPM++A
Schedule Type: Karras
Passi: 20 - 30
CFG: 2 - 6
Clip Skip: 2
Denoise: 1

L’upscaler latente usato è molto simile, generalmente scegliendo una variante Euler in quanto più veloce nel produrre immagini.

Sampler: Euler A / DPM++A
Schedule Type: Karras
Passi: 15
CFG: 2 - 6
Denoise - 0.5
Upscale di: 1.5-2.0

Per alcuni consigli sulla generazione, più abbassate CFG e passi nell’upscaler latente, più l’immagine avrà un aspetto 'dipinto', con tratti più morbidi e meno definiti che crea un effetto 'nebbia' in alcune immagini. Al contrario, più CFG si aggiunge, più l’immagine appare 'cottura' e lucida. Un CFG di 3.0 forse è il migliore compromesso tra tutte le lora per enfatizzarle al meglio. Nell’immagine di Harley Quinn allegata, ho esagerato con un CFG di 10 per mostrare l’effetto, ma è molto astratto.

GUARDA il mio workflow allegato che spiega come manipolare kegant al massimo, che preferiate un design lucido e elegante o vibrazioni retro estreme con effetti di grana film.

Un’ultima nota – questo checkpoint tende ad aggiungere 'artefatti jpeg' e varie faune come 'piante' e 'fiori'. Inoltre tende ad aggiungere elementi 'cyberpunk'. Inseriteli nel prompt negativo se non volete vederli, e dovrebbe gestire bene la loro rimozione. Per soggetti maschili, specificare '1girl' nel prompt negativo aiuta molto, sebbene il checkpoint come detto preferisca fortemente soggetti femminili.

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

Nova Flat XL - v3.0

AutismMix SDXL - AutismMix_DPO

Usa questo modello