Vanillaware Style PonyXL - v0.1
Parole Chiave e Tag Correlati
Prompt Consigliati
score_9, score_8_up, score_7_up, <lora:vanillawareStyle:1>, 1girl, solo, looking at viewer, full body, light particles
Prompt Negativi Consigliati
thumbnail,3d
3d, bad anatomy, watermark
Parametri Consigliati
samplers
steps
cfg
clip skip
resolution
vae
other models
Parametri Consigliati per Alta Risoluzione
upscaler
upscale
denoising strength
Suggerimenti
Componi i prompt nell'ordine: [caratteristiche del personaggio] + [stile] + [espressione] + [abbigliamento] + [fotocamera e azione] + [sfondo], modificando secondo necessità.
Se l’immagine è sfocata, aggiungi "thumbnail" ai prompt negativi e aumenta il peso per migliorare la chiarezza.
Aggiungere '3d' ai prompt negativi può migliorare i risultati.
Aggiungere tag come 'realistic' o 'realism' può migliorare le caratteristiche della figura.
Regola il peso consigliato tra 1.0 e 0.6 per l'aspetto desiderato del personaggio.
Migliora la qualità del dataset e usa un tagging accurato per un addestramento migliore.
Inserisci i tag delle immagini di qualità inferiore nei prompt negativi per ridurne l’influenza durante la generazione.
L'addestramento di questo modello e le immagini generate sono esclusivamente a scopo didattico.
Non ho fatto nulla, sono solo un portatore.
Questo modello è più simile a un pacchetto di personaggi e il suo effetto collaterale è lo stile che porta.
Ha richiesto più di 30 ore di tentativi ripetuti, durante i quali ho quasi mollato, ma alla fine ho raggiunto un effetto più bilanciato. La cosa più importante è che la mia ipotesi di addestramento è stata verificata. In futuro, potrei organizzare queste esperienze in un articolo.
Ma i problemi delle mani cattive esistono ancora.
Parola di attivazione: vanillastyle
Puoi trovare i prompt di esempio dalle immagini sopra.
I prompt della versione precedente del modello funzionavano in gran parte anch'essi.
I miei prompt sono fondamentalmente composti nell'ordine [caratteristiche del personaggio] + [stile] + [espressione] + [abbigliamento] + [fotocamera e azione] + [sfondo], e puoi eliminarli o modificarli secondo necessità.
Se la situazione è particolarmente sfocata, considera di aggiungere "thumbnail" ai prompt negativi e aumentare il suo peso fino a quando l’immagine diventa chiara.
Aggiungere '3d' al prompt negativo può produrre un risultato migliore, mentre aggiungere tag come 'realistic' o 'realism' può migliorare le caratteristiche della figura.
Peso consigliato: 1.0~0.6, regola secondo necessità finché l'aspetto del personaggio non soddisfa le tue esigenze.
Valore di upscaling consigliato intorno a 1.2~2.0, forza di denoising 0.2
Il dataset si è concentrato principalmente sui lavori di George Kamitani.
20240907v0.2
In questa versione, ho taggato più immagini, e per il resto ho rimosso i loro tag, lasciando solo le parole di attivazione per evitare conflitti con i tag accurati. (Questo metodo potrebbe essere sbagliato.)
Durante il processo di addestramento, ci sono stati troppi casi in cui le immagini nel dataset non erano rappresentate accuratamente tramite il prompt. Ho provato a cambiare vari tag e riaddestrare, con lo stesso risultato. La ripetitività di queste immagini nel dataset non è nemmeno alta, manca continuità.
Infine, ho letto un articolo che menzionava di aumentare il numero di ripetizioni di addestramento per certi personaggi per evitare che il modello non imparasse sufficientemente queste immagini.
Quindi ho messo tutte le immagini singole presenti nel dataset in una sotto-cartella, impostato le ripetizioni di addestramento a 2, e lasciato inalterate le immagini già ben apprese.
Tuttavia, poiché ci sono diversi problemi di qualità con queste immagini discontinue, e non le ho riparate per ora, aumentare le loro ripetizioni di addestramento ha avuto un certo impatto sullo stile generale.
Per migliorare la prossima versione, l'approccio più fondamentale è migliorare la qualità del dataset e anche fare buon uso delle tecniche di didascalia, aggiungendo lo stesso tag a quelle immagini di qualità leggermente inferiore e poi inserendole tutte nel prompt negativo durante l'esecuzione del modello.
20240715v0.1
Questo modello può essere considerato solo come v0.1, non è molto facile da usare normalmente, e penso sia meglio taggare più immagini nel dataset in dettaglio per risultati migliori. In futuro, potrei completare lentamente l’addestramento di questo modello.
Le prestazioni di questa versione non sono molto buone, le immagini generate potrebbero apparire spesso caotiche.
Ho raccolto oltre 100 immagini come dataset, ma il numero è ancora troppo elevato per il tagging manuale. Inizialmente ho usato wd1.4 per taggare tutte le immagini, ma la qualità dei tag non è ancora buona, (forse il mio uso non è abbastanza corretto, e accetto volentieri suggerimenti).
Perché volevo vedere i risultati rapidamente, per questo dataset ho taggato manualmente solo alcune immagini che rispecchiano le mie preferenze personali, quindi l'effetto dell'output del modello sarà migliore per queste immagini.
Dettagli del Modello
Discussione
Per favore log in per lasciare un commento.






