Tponynai3 - v5
Parole Chiave e Tag Correlati
Prompt Consigliati
score_9,score_8_up,score_7_up
score_8_up,score_7_up,1girl,solo
Prompt Negativi Consigliati
score_4,score_3,score_2,worst quality, bad hands, bad feet
score_4,score_3,score_2,score_1,ugly,bad feet
Parametri Consigliati
samplers
steps
cfg
clip skip
resolution
other models
Parametri Consigliati per Alta Risoluzione
upscaler
upscale
steps
denoising strength
Suggerimenti
Usa high-fix a risoluzione moderata per i migliori risultati.
Prova style_3 o 4 per migliorare i dettagli degli occhi.
Punti Salienti della Versione
In questa versione il materiale di training è stato ridotto. Dato il passo falso di v4, ho avviato un altro progetto per testare una mia idea con minor consumo di VRAM, addestrando quattro diversi stili lora adattati a T-ponynai3, naturalmente il modello originale è stato anche caricato su civitai. Dopo aver testato l’adattabilità, ho iniziato ad addestrare questi quattro stili come additivi in T-ponynai3-v5. Sorprendentemente, la texture delle linee in v5 è migliorata molto, probabilmente perché ho addestrato materiali molto raffinati. Per contrassegnare questi stili ho utilizzato prompt da style_1 a style_4. Sfortunatamente, per qualche motivo questi stili non sono separati o hanno effetto debole, ma si sono integrati bene nello stile originale. Anche se non si è raggiunto l’obiettivo di supportare più stili, la qualità dello stile nai3 originale è stata migliorata notevolmente. Forse nella prossima versione si potrà fare di più. (Mi piace molto giocare ai videogiochi, è difficile non poter giocare durante l’addestramento.)
The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it's too difficult for me to play computer games every time I train.)
Sponsor del Creatore
[Non certificato] Tonade è l’autore del modello T-ponynai3, ID CivitaI: Tonade, | Aifadian (afdian.net)
Questo è il canale di sponsorizzazione su Aifadian, se trovate il modello utile e potete supportare è molto apprezzato! Per favore non obbligatevi, grazie di tutto il supporto, continuerò a esplorare come migliorare il modello!
Numero del piccolo gruppo QQ personale 929721518, potete chiedere qualsiasi dubbio riguardante tpony. Ricordate di specificare CivitAI.
Il modello ha già integrato il vae, non è necessario aggiungere vae aggiuntivo
Il modello ha già incluso vae, non è necessario aggiungere un vae supplementare
La migliore strategia di generazione è usare una risoluzione moderata con high-fix, piuttosto che usare direttamente l’output in alta risoluzione
La migliore strategia di generazione è utilizzare high-fix a risoluzione moderata, invece di usare direttamente l’output ad alta risoluzione
[Non certificato] Tonade è l’autore del modello T-ponynai3, ID CivitaI: Tonade, | Aifadian (afdian.net)
Questo è il canale di sponsorizzazione su Aifadian, se trovate il modello utile e potete supportare è molto apprezzato! Per favore non obbligatevi, grazie di tutto il supporto, continuerò a esplorare come migliorare il modello!
(33) T-ponynai3-v5 - (versione modificata pesi) | Stable Diffusion Checkpoint | Tusi tusi.cn (tusiart.com) link generazione online su tusiart (versione tensor cinese)
(Poiché il modello può esistere solo simultaneamente su Tusi e Tensor, è meglio usarlo su Tusi. Se ci sono problemi con l’utilizzo, per favore segnalatemeli)
La versione v5 ha aggiunto 4 nuovi stili, che possono essere usati da style_1 a style_4 per affinare i dettagli dell’immagine (teoricamente, ma l’effetto reale è più mistico)
La versione V5 ha aggiunto 4 nuovi stili, che possono essere usati per affinare i dettagli dell’immagine da style_1 a style_4 (teoricamente questo è valido, ma l’effetto reale è più mistico o più leggero)
Questo modello supporta perfettamente i modelli Lora basati su ponyv6, ani3 e sdxl1.0 sono adattabili in una certa misura
Questo modello supporta perfettamente Lora addestrati con ponyv6 come modello base, e il Lora di ani3 e sdxl1.0 può essere adattato in certa misura.
Test di image inpaint basato su v4.1 (questa parte era stata trascurata nelle versioni precedenti)
Image inpaint test basato su v4.1 (questa è una parte precedentemente trascurata)
pony è divino, piena compatibilità. Questo modello supporta i lora di ani e pony
Parole chiave essenziali e prompt sono gli stessi di ponydiffusion
positivo:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)
OPPURE (score_9,score_8_up,score_7_up)
Negativi opzionali:
negativo: (score_4,score_3,score_2,score_1),
Si possono aggiungere anche parole negative classiche tipo NAI, per esempio:
negativo: worst quality, bad hands, bad feet
Spero vi piaccia ᕕ(◠ڼ◠)ᕗ basato su nai3 e ponyv6
Istruzioni di addestramento: v1 ha usato 94 immagini, v2 119, v3 348, v3.5 474 generate da nai3, il lora è stato integrato nel modello base per il fine-tuning, supporta tutti i tag artistici supportati da ponyv6, l’uso di più di due tag artistici può causare crash di sfondo. Attualmente si sa che può generare personaggi di Genshin Impact, gli altri non li conosco, non ho effettuato molti test su questo modello, ammiro la sua fedele riproduzione dello stile di nai3. Il modello base è una fusione di T-anime-xl, ponyv6 e ani3, non ancora rilasciato.
La scheda grafica usata per l’addestramento è una 3090 personale, con tempi di 7, 12, 35 e 47 ore da v1 a v3.5 rispettivamente
Istruzioni di addestramento: Merge Lora ha usato 94 immagini per v1, 119 per v2, 348 per v3, 474 per v3.5, generate da NAI3 nel modello base per fine-tuning. Pony supporta tutti i tag artistici di ponyv6, senza tag aggiuntivi da nai3. Usare più di due tag artistici può causare crash di sfondo. Attualmente risulta possibile generare personaggi di Genshin Impact. Non ho testato molto questo modello. Ammirate la riproduzione dello stile di pittura di NAI3. Il modello base è una fusione di T-anime-xl, ponyv6 e ani3, non ancora rilasciato.
La scheda grafica usata per l’addestramento è una mia 3090, con durata di 7, 12, 35 e 47 ore da v1 a v3.5 rispettivamente.
v1
Un tentativo interessante
Un tentativo interessante
v2
Rispetto a v1 il set di addestramento è leggermente aumentato, con circa 30 ore di prova ed errore sui parametri, ma lo stile presenta ancora qualche overfitting come doppio ombelico e capelli disordinati
Rispetto a v1, il set di addestramento è stato leggermente aumentato e sono state fatte 30 ore circa di test, ma lo stile addestrato presenta ancora un po’ di overfitting, come doppi ombelichi e capelli disordinati.
v3
Gli arti in v3 sono migliori di v2, v3 comprende meglio il footfocus e può generare piedi più impattanti visivamente e prospettive più ardite. L’effetto AI sui capelli v3 è meno evidente di v2, perché v2 aveva un addestramento insufficiente, con overfitting sui capelli e doppio ombelico a volte presente in v2 sparito. In generale un set di addestramento triplo rispetto a v2 e parametri dim più grandi hanno reso lo stile più naturale e più efficace nei prompt lunghi.
Gli arti di v3 sono migliori di v2. Per la comprensione del footfocus v3 può generare piedi con maggior impatto visivo e prospettive più difficili. L’effetto AI nei capelli di v3 è inferiore a v2, causa set troppo piccolo di v2 che porta a un leggero overfitting, e il doppio ombelico occasionalmente presente in v2 è sparito. Complessivamente il triplo della dimensione del set di v2 e parametri dim più grandi fanno lo stile più naturale e la performance migliore sotto prompt lunghi.
v3.5
In questa versione le richieste sulle parole qualità non sono rigide, si possono evitare le parole di qualità delle valutazioni estetiche di pony senza problemi; in test talvolta succede che l’immagine generi blocchi di colore senza senso, basta sostituire le parole di qualità con parole comuni tipo score_1 o score_2 con worst quality. Ho aggiunto circa 150 immagini al set per bilanciare e arricchire lo stile, e ridotto la pendenza iniziale della curva di apprendimento, il che riduce l’overfitting e consente più lora e prompt fantasiosi. In generale questa versione è più libera di v3 e migliore nel rappresentare soggetti maschili, i colori e lo stile sono meno vividi e oleosi con certi prompt.
In questa versione i requisiti per le parole di qualità non sono così rigorosi, si può evitare completamente di usare parole di qualità dal punteggio estetico di pony; a volte in test appaiono blocchi colorati senza senso e basta sostituire le parole di qualità Ponydiffusion con parole comuni tipo score_1 o score_2 con worst quality. Ho aggiunto circa 150 immagini per bilanciare e arricchire lo stile, e ridotto la pendenza iniziale della curva di apprendimento, rendendo il modello meno overfittato e adattabile a più lora e prompt fantasiosi. Complessivamente è una versione più libera della v3 e rafforza la caratterizzazione maschile, con colori e stile meno splendidi e untuosi in certi casi.
v4
Questa versione ha usato 798 immagini per addestramento, con 90 ore di training su scheda 3090. Rispetto a v3.5 ha composizione e dettagli delle parti del corpo migliorati in certi prompt, ad esempio ghosting delle dita e sovrapposizioni del corpo. Come prompt ho usato principalmente prompt di lunghezza media o corta, perché non piace scrivere prompt lunghi per buone immagini. Togliendo le parole di qualità del punteggio estetico pony, la qualità dell’immagine è migliorata rispetto a v3.5, tendendo a immagini più piatte e meno tridimensionali, più vicine allo stile anime classico. Il test di fine tuning del numero di immagini con ponyv6 sta finendo, il passo successivo sarà migliorare i prompt di training per aggiungere più prompt regolabili in un numero limitato di addestramento pony (ad esempio aggiungendo punteggi estetici, aumentando la copertura delle parole qualità mainstream su quelle di pony), e continuare ad aggiungere materiale adatto come scene e più materiale per piedi (v4 ha poco materiale per piedi).
Questa versione ha usato 798 immagini per l’addestramento e 90 ore con scheda 3090. Rispetto a v3.5, alcune composizioni e dettagli di parti del corpo sono meglio resi, tipo sovrapposizione e ghosting di dita. Come prompt ho usato lunghezza media e corta, perché pochi amano scrivere prompt lunghi per immagini di qualità. Togliendo le parole di qualità del punteggio estetico pony, la qualità è cresciuta rispetto a v3.5, con immagini più piatte e meno 3D, vicine allo stile anime classico. I test sulla quantità di immagini per fine tuning ponyv6 stanno finendo. Il passo successivo è migliorare i tag prompt per aggiungere più prompt regolabili nel limitato materiale di pony, tipo aggiungere punteggi estetici, perché ora la logica usa parole qualità mainstream che coprono quelle pony. Continuerò ad aggiungere materiale adatto come scene e più materiale per piedi, perché v4 ne ha poco.
v4.1
Chiedo scusa agli utenti per il rilascio di una nuova versione così ravvicinata, è una grande sfida per la memoria del computer e la velocità di rete. O_O
Prima di tutto, mi scuso con tutti gli utenti per aver rilasciato una nuova versione in così poco tempo, questo mette alla prova la memoria del computer e la velocità della rete. O_O
Questa nuova versione si basa sulla versione di debug degli arti di v4, poiché gli effetti degli arti di v4 erano difficili da controllare, la perfezione delle mani nei test non ha raggiunto le aspettative. Io e il mio amico 木猫猫猫 abbiamo fatto degli aggiustamenti e miglioramenti a v4, alla fine v4.1 ha raggiunto le mie aspettative sugli arti. Pubblicherò diversi grafici xy per mostrare chiaramente il miglioramento di v4.1 rispetto a v4 con gli stessi parametri.
Questa nuova versione si basa sul debug degli arti di v4, dato che il controllo sugli arti in v4 è stato difficile e la perfezione delle mani non ha soddisfatto le mie aspettative durante i test degli ultimi giorni, io e il mio amico 木猫猫猫 abbiamo fatto aggiustamenti e miglioramenti, che hanno portato v4.1 agli standard desiderati per gli arti. Fornirò grafici xy per mostrare chiaramente il miglioramento di v4.1 rispetto a v4 con gli stessi parametri.
v5
In questa versione il materiale di training è stato ridotto. Dato il passo falso di v4, ho avviato un altro progetto per testare una mia idea con minor consumo di VRAM, addestrando quattro diversi stili lora adattati a T-ponynai3, naturalmente il modello originale è stato anche caricato su civitai. Dopo aver testato l’adattabilità, ho iniziato ad addestrare questi quattro stili come additivi in T-ponynai3-v5. Sorprendentemente, la texture delle linee in v5 è migliorata molto, probabilmente perché ho addestrato materiali molto raffinati. Per contrassegnare questi stili ho utilizzato prompt da style_1 a style_4. Sfortunatamente, per qualche motivo questi stili non sono separati o hanno effetto debole, ma si sono integrati bene nello stile originale. Anche se non si è raggiunto l’obiettivo di supportare più stili, la qualità dello stile nai3 originale è stata migliorata notevolmente. Forse nella prossima versione si potrà fare di più. (Mi piace molto giocare ai videogiochi, è difficile non poter giocare durante l’addestramento.)
Materiale di training ridotto in questa versione. A causa del fallimento di v4, ho iniziato un progetto per testare un’idea con basso consumo di VRAM, addestrando quattro stili lora adattati a T-ponynai3, con caricamento anche del modello originale su civitai. Dopo i test, ho iniziato ad addestrare questi quattro stili come additivi in T-ponynai3-v5. Sorprendentemente la texture delle linee di v5 è migliorata molto, presumibilmente per materiali più raffinati. Ho usato prompt style_1 a style_4 per marcare questi stili. Sfortunatamente non si sono separati o hanno effetto blando, ma si sono fusi bene nello stile originale. Anche se non raggiunge il supporto per più stili, eleva la qualità dello stile nai3. Forse nella prossima versione ulteriori progressi. (Mi piace giocare, è difficile non poterlo fare durante l’addestramento.)
Riassumo alcuni problemi della versione v5.
1. Compatibilità lora, arti e occhi sfocati. La compatibilità lora soffre perché ho usato pesi finali troppo alti, causando sovraccarico in certi casi. La versione ottimizzata ha pesi ridotti, dovrebbe migliorare rotture degli arti e compatibilità con alcuni lora; ho fatto confronti con lora basati su v4.1. Il problema degli occhi sfocati è causato da style_1, perché il materiale originale ha occhi sfocati; si può migliorare usando style_3 o 4.
2. Problemi di esposizione della luce volumetrica. Durante i test non si è presentato, probabilmente dovuto al parametro noise offset che aumenta la sensibilità al light prompt, rendendo più luminose le stesse parole di peso luminoso, suggerisco di non usare parentesi e numeri per aumentare peso, ma ripetere le stesse parole. Questo parametro era per correggere un problema di giallo con pochi prompt, ho fatto confronti a riguardo.
3. Complessità ridotta del modello. In teoria e pratica v5 dovrebbe essere più pulito e versatile del precedente, e ottenere performance più precise con certi prompt, ho fatto confronti. Il training non ha usato materiali troppo complessi, perché possono causare overfitting e perdita di dettagli.
Scopo: voglio un modello con differenze significative dal precedente e non uno uguale. I vostri feedback sono una buona occasione di prova, da solo ho pochi costi d’errore. Nella prossima versione cercherò di aumentare materiale per vari stili per integrare e separare meglio stili, usando prompt specifici, forse servono nuove tecniche di training. Grazie per i feedback!
Riassumo alcuni problemi riguardo la versione v5.
1, compatibilità Lora e problemi con arti e occhi sfocati. La compatibilità Lora soffre perché ho usato pesi troppo alti, causando sovra-adattamento. Questa versione ottimizzata riduce i pesi per migliorare compatibilità e stabilità degli arti; ho comparazioni con Lora di v4.1. Gli occhi sfocati sono dovuti a style_1, dato che il materiale originale ha occhi sfocati, si migliora con style_3 o 4.
2, problemi di esposizione luce volumetrica. Non riscontrati in test, ma probabilmente causati dal parametro noise offset che aumenta sensibilità alle parole di luce, rendendo i risultati più luminosi con peso simile. Consiglio di non usare parentesi o numeri per aumentare peso, ma ripetere stesso prompt, per evitare risultati estremi. Questo parametro serve a correggere generazione gialla con pochi prompt; ho fatto confronti a riguardo.
3, complessità del modello ridotta. V5 dovrebbe essere più pulito e versatile del precedente, ottenendo performance più precise con alcuni prompt, come mostrano le comparazioni. Il set di training non usa materiali troppo complessi, perché tendono a causare overfitting e perdita di dettagli.
Scopo: ottenere un modello significativamente diverso dai precedenti, non quasi identico. I feedback raccolti sono una buona occasione di miglioramento, da solo ho pochi margini di errore. La prossima versione aumenterà i materiali di diversi stili per integrare e separare meglio gli stili, usando prompt mirati. Potrebbe servire una nuova tecnica di training. Grazie dei feedback!
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Creatore
Discussione
Per favore log in per lasciare un commento.