modelli/Vanillaware Style PonyXL - v0.1

Vanillaware Style PonyXL - v0.1

|
10/17/2025
|
1:06:36 AM
| Discussion|
0
Strega fantasy a figura intera con lunghi capelli rossi, che indossa un corsetto nero e un grande cappello da strega, che tiene un bastone di legno sotto un cielo notturno
Una fatina bionda con orecchie appuntite e ali verdi traslucide che indossa un vestito verde, circondata da farfalle blu luminose e particelle di luce di notte.
Ritratto di Miyuki Inaba con capelli castani corti e occhi marroni, che indossa una canotta grigia, posa con la mano sulla fronte su uno sfondo bianco.
Ritratto di una donna calma dai capelli bianchi con occhi marroni che indossa un corsetto nero e un colletto di pizzo, adornata con piume blu, su sfondo nero.
Ritratto fotorealistico di una ragazza dai capelli bianchi con acconciatura a treccia che indossa un corsetto nero con scollatura, circondata da piume blu luminose e particelle di luce su sfondo nero.

Prompt Consigliati

score_9, score_8_up, score_7_up, <lora:vanillawareStyle:1>, 1girl, solo, looking at viewer, full body, light particles

Prompt Negativi Consigliati

thumbnail,3d

3d, bad anatomy, watermark

Parametri Consigliati

samplers

Euler a

steps

20

cfg

7

clip skip

2

resolution

768x1344

vae

sdxl_vae.safetensors

other models

vanillawareStyle (272b477439ee), ponyDiffusionFor_v10 (7ad8ce957e)

Parametri Consigliati per Alta Risoluzione

upscaler

4xUltrasharp_4xUltrasharpV10

upscale

1.2 - 2

denoising strength

0.2

Suggerimenti

Componi i prompt nell'ordine: [caratteristiche del personaggio] + [stile] + [espressione] + [abbigliamento] + [fotocamera e azione] + [sfondo], modificando secondo necessità.

Se l’immagine è sfocata, aggiungi "thumbnail" ai prompt negativi e aumenta il peso per migliorare la chiarezza.

Aggiungere '3d' ai prompt negativi può migliorare i risultati.

Aggiungere tag come 'realistic' o 'realism' può migliorare le caratteristiche della figura.

Regola il peso consigliato tra 1.0 e 0.6 per l'aspetto desiderato del personaggio.

Migliora la qualità del dataset e usa un tagging accurato per un addestramento migliore.

Inserisci i tag delle immagini di qualità inferiore nei prompt negativi per ridurne l’influenza durante la generazione.

L'addestramento di questo modello e le immagini generate sono esclusivamente a scopo didattico.

Non ho fatto nulla, sono solo un portatore.

Questo modello è più simile a un pacchetto di personaggi e il suo effetto collaterale è lo stile che porta.

Ha richiesto più di 30 ore di tentativi ripetuti, durante i quali ho quasi mollato, ma alla fine ho raggiunto un effetto più bilanciato. La cosa più importante è che la mia ipotesi di addestramento è stata verificata. In futuro, potrei organizzare queste esperienze in un articolo.

Ma i problemi delle mani cattive esistono ancora.

Parola di attivazione: vanillastyle

Puoi trovare i prompt di esempio dalle immagini sopra.

I prompt della versione precedente del modello funzionavano in gran parte anch'essi.

I miei prompt sono fondamentalmente composti nell'ordine [caratteristiche del personaggio] + [stile] + [espressione] + [abbigliamento] + [fotocamera e azione] + [sfondo], e puoi eliminarli o modificarli secondo necessità.

Se la situazione è particolarmente sfocata, considera di aggiungere "thumbnail" ai prompt negativi e aumentare il suo peso fino a quando l’immagine diventa chiara.

Aggiungere '3d' al prompt negativo può produrre un risultato migliore, mentre aggiungere tag come 'realistic' o 'realism' può migliorare le caratteristiche della figura.

Peso consigliato: 1.0~0.6, regola secondo necessità finché l'aspetto del personaggio non soddisfa le tue esigenze.

Valore di upscaling consigliato intorno a 1.2~2.0, forza di denoising 0.2

Il dataset si è concentrato principalmente sui lavori di George Kamitani.

20240907v0.2

In questa versione, ho taggato più immagini, e per il resto ho rimosso i loro tag, lasciando solo le parole di attivazione per evitare conflitti con i tag accurati. (Questo metodo potrebbe essere sbagliato.)

Durante il processo di addestramento, ci sono stati troppi casi in cui le immagini nel dataset non erano rappresentate accuratamente tramite il prompt. Ho provato a cambiare vari tag e riaddestrare, con lo stesso risultato. La ripetitività di queste immagini nel dataset non è nemmeno alta, manca continuità.

Infine, ho letto un articolo che menzionava di aumentare il numero di ripetizioni di addestramento per certi personaggi per evitare che il modello non imparasse sufficientemente queste immagini.

Quindi ho messo tutte le immagini singole presenti nel dataset in una sotto-cartella, impostato le ripetizioni di addestramento a 2, e lasciato inalterate le immagini già ben apprese.

Tuttavia, poiché ci sono diversi problemi di qualità con queste immagini discontinue, e non le ho riparate per ora, aumentare le loro ripetizioni di addestramento ha avuto un certo impatto sullo stile generale.

Per migliorare la prossima versione, l'approccio più fondamentale è migliorare la qualità del dataset e anche fare buon uso delle tecniche di didascalia, aggiungendo lo stesso tag a quelle immagini di qualità leggermente inferiore e poi inserendole tutte nel prompt negativo durante l'esecuzione del modello.

20240715v0.1

Questo modello può essere considerato solo come v0.1, non è molto facile da usare normalmente, e penso sia meglio taggare più immagini nel dataset in dettaglio per risultati migliori. In futuro, potrei completare lentamente l’addestramento di questo modello.

Le prestazioni di questa versione non sono molto buone, le immagini generate potrebbero apparire spesso caotiche.

Ho raccolto oltre 100 immagini come dataset, ma il numero è ancora troppo elevato per il tagging manuale. Inizialmente ho usato wd1.4 per taggare tutte le immagini, ma la qualità dei tag non è ancora buona, (forse il mio uso non è abbastanza corretto, e accetto volentieri suggerimenti).

Perché volevo vedere i risultati rapidamente, per questo dataset ho taggato manualmente solo alcune immagini che rispecchiano le mie preferenze personali, quindi l'effetto dell'output del modello sarà migliore per queste immagini.

Precedente
Breakdancing PONY XL (Concept) - v1.0
Successivo
Goose Ambush - Illustrious - v1.0

Dettagli del Modello

Tipo di modello

LORA

Modello base

Pony

Versione del modello

v0.1

Hash del modello

33ee0b8061

Creatore

Discussione

Per favore log in per lasciare un commento.

Collezione di Modelli - Vanillaware Style PonyXL

Immagini di Vanillaware Style PonyXL - v0.1

Immagini con stile

Immagini con vanillaware