modelli/Pony: People's Works v1-v6 - v6_noobEv1.1

Pony: People's Works v1-v6 - v6_noobEv1.1

|
7/4/2025
|
1:29:14 PM
| Discussion|
0
Giovane donna con lunghi capelli biondi in un vestito viola seduta a un tavolo di legno in una stanza studio, che scrive in un libro aperto sotto una luce calda.
Un primo piano di una rana con occhi verdi seduta accanto a uno stagno di notte, illuminata dalla luce della luna e circondata da lucciole luminose e vegetazione naturale.
Ritratto di una ragazza anime con capelli biondi e corna da demone nere che indossa un'uniforme scolastica blu e bianca con un fazzoletto rosso, su sfondo giallo.
Un dettagliato robot umanoide con armatura gialla che indossa un grande cappello da cowboy marrone e una sciarpa rosa, su uno sfondo di cielo con nuvole rosa e bianche. Il robot ha occhi circolari rosa luminosi e cavi visibili.
Ragazza anime con capelli biondi e occhi verdi che indossa cuffie a forma di orecchie di gatto, tiene un cucchiaio e un dessert di frutta verde guarnito con uva e arance su uno sfondo verde.
Una monster girl bionda con corna e corpo inferiore centauroid sta con le mani giunte davanti a sé, contro uno sfondo vibrante di foresta rossa.
Illustrazione digitale di una ballerina femminile in un body leopardato a gamba alta e cappello a tesa larga, che posa elegantemente in uno studio illuminato da luce viola con pavimento riflettente e pilastri luminosi verticali.
Una scena fiabesca di una giovane ragazza con corona di fiori e vestito rosa sdraiata su un libro a forma di letto, circondata da tende stellate e una lampada luminosa a forma di stella.
Una feroce ragazza demone con occhi blu luminosi e calze a righe si erge con fiducia davanti a un mostro imponente con punte adornato di teschi e occhi luminosi, circondato da fulmini e piccole creature scheletriche.
Una figura incappucciata senza volto con ali che cammina per una strada cittadina viola illuminata al neon in un'illustrazione vettoriale piatta in stile cyberpunk.
Una figura maschile senza volto che indossa un mantello con cappuccio e piccole ali, che tiene una spada gigante luminosa, in piedi nel mezzo di una strada cittadina a tema viola di notte, illustrata in stile vettoriale piatto.
Un'illustrazione digitale di un personaggio femminile con capelli viola fluenti sdraiata su lenzuola bianche, tenendo una ciliegia in bocca con occhi espressivi e scintillanti in stile anime.

Prompt Consigliati

masterpiece,best quality,very aesthetic

masterpiece, best quality, very aesthetic, 1girl, solo, long hair, upper body

Prompt Negativi Consigliati

worst quality,low quality,displeasing

worst quality, low quality, displeasing, hair intakes, text

Parametri Consigliati

samplers

Euler a

steps

25 - 30

cfg

4 - 5

Suggerimenti

Per le versioni precedenti alla V2, usa i tag di qualità forniti con il modello corrispondente poiché non ci sono parole trigger specifiche.

Aggiungere 'hair intakes' ai prompt potrebbe in qualche modo alleviare i problemi di acconciatura legati ai sollevamenti triangolari alle radici dei capelli.

Le versioni recenti di NoobAI presentano artefatti; circa 30 immagini sono state usate come esempi negativi per contrastarli.

Il modello non replica lo stile di un artista specifico ma potrebbe riflettere le preferenze estetiche della comunità.

Nella versione di test 4, i tag di qualità di Animagine v3.1 possono cambiare lo stile artistico generato; usare cautela con i tag di qualità.

Intro. 简介:

Un style LoCon addestrato su immagini di modelli basati su pony raccolte dal sito Civitai con "più collezioni" e "più reazioni".

这是一个训练自Civitai上点赞最多和收藏最多的pony系模型图片画风LoCon

Questo lora non intende simulare lo stile o la tecnica di un artista specifico. Potrebbe RIFLETTERE il gusto della comunità e l'attrattiva visiva di un'immagine in una certa misura. Gli stili potrebbero cambiare sottilmente a seconda dei diversi prompt.

这个lora并不意于还原某个特定的画师画风或者绘画技巧。它在某种程度上可能反应了社区审美图片的视觉吸引力。 不同的提示词下可能会有微妙的画风变化。

Usage 使用方法:

Le versioni precedenti alla V2 non hanno parole trigger specifiche. Si prega di usare i tag di qualità forniti con il modello corrispondente.

Per V3 e versioni successive, sono stati addestrati i seguenti tag:

V2以前的版本没有特定触发词。请使用对应模型自带的质量提示词。

对于v3及后续版本,训练了以下标签:

positivo:

masterpiece, best quality, very aesthetic

negativo:

worst quality, low quality, displeasing

Puoi modificare i prompt su questa base.

Data Generation 数据版本:

v6:

Aggiunte oltre 500 nuove immagini, alcune selezionate da Flux. Ho rimosso alcune immagini più vecchie che ritenevo di qualità inferiore.

Il numero totale di immagini nel dataset ora supera 3.000, con più di 20 concetti migliorati/modificati manualmente attraverso 6 versioni del dataset.

La posizione del modello è stata aumentata.

新添加了500+张图片其中有一部分选自flux生成的图像。删除了一部分我认为品质不佳的旧图片。

现在总的图片数超过了3000,6个版本的数据总共手动增强/修正了20多条概念。

增加了模型的rank。

v5.9:

La prestazione del modello non è come previsto, ma credo che le immagini nel dataset di addestramento vadano bene. Ho intenzione di modificare manualmente i tag e vedere come cambiano i risultati.

模型效果不如预期,但是我觉得训练集的图片本身应该没什么问题。打算先手动修正tag看看效果。

2025/1/3更新:

Aggiornati manualmente alcuni tag, ma sembrano non essere correlati a luminosità e colori. Ipotesi temporanea: potrebbe essere collegato al noise offset.

手动更新了一部分标签,但是它们和明暗色彩无甚干系。暂时猜测可能和noise offset有关。

v5:

Il dataset è stato ampliato a 2.154 immagini, con circa 1.000 immagini di Pony come obiettivo principale di addestramento.

Sebbene i modelli V-pred possano usare LoRA addestrato su modelli basati su Eps-pred, la qualità dell'output diminuisce significativamente. Questa versione sarà addestrata separatamente su due tipi diversi di modelli.

Le versioni recenti di NoobAI mostrano artefatti evidenti, ma il tag 'jpeg artifact' da Danbooru sembra non funzionare efficacemente. Per risolvere questo problema, sono state selezionate circa 30 immagini tipiche e ben visibili come esempi negativi.

È stato osservato un fenomeno: Pony v6 e NoobAI tendono a generare un sollevamento triangolare alla radice delle acconciature con ciocche laterali. Su Danbooru, questo sollevamento a volte è etichettato come 'hair intakes' o 'curtained hair', ma Pony applica questa struttura a ogni personaggio. Questa è una delle ragioni principali per cui le acconciature generate da Pony spesso non corrispondono al design previsto durante l'addestramento dei personaggi. Un problema simile è stato osservato con NoobAI. La mia ipotesi è che questa caratteristica sia prevalente in un dataset esterno a Danbooru e non sia stata etichettata correttamente.

Le immagini nel dataset sono state filtrate e circa due terzi sono state annotate correttamente. Attualmente, aggiungere 'hair intakes' nel prompt potrebbe in qualche modo alleviare questo problema, ma non ho ancora trovato una soluzione completa.

数据集扩充到2154张图。其中作为主要训练目标的pony图片约1000张。

虽然V-pred模型也能使用基于Eps-pred技术的模型训练的lora,但是生成质量会大打折扣。这个版本将会分别在两个不同类型的模型上训练。

noobAI近期版本有比较明显的伪影,但是danbooru上的“jpeg artifact”并没有起作用。因此专门针对这个问题选择了约30张较为典型的、肉眼可见的图片作为负面案例。

观察到一个现象:pony v6和noobAI在生成有侧发的发型时,倾向于在发根处生成一个三角形的翘起。在danbooru里,这种翘起有时会被标注为“hair intakes”和“curtained hair”,但是pony会给每一个角色都套上这样的结构。这也是pony训练角色时,发型训练不像的一个重要原因。noob也观察到了类似的现象,我的猜测是danbooru以外的某个训练集大量存在这个特征,但没有对这个特征进行正确标注。

对数据集里的图片进行了筛选,其中约2/3的图片进行了正确的标注。现在,在prompt里写上“hair intakes”可能可以一定程度上减轻这个现象,但是我还没有找到根治这个毛病的办法。

v4:

Parzialmente ottimizzati i tag del dataset. Addestrato basandosi su NoobAI Epsilon-pred v1.

I modelli basati su Pony hanno una forte tendenza a generare orecchini, piercing alle orecchie e altri tipi di accessori, a volte alterando la struttura dell'orecchio dei personaggi. Ho riorganizzato i tag correlati, tagliato e modificato manualmente alcune immagini nel dataset con piccoli problemi strutturali, e rimosso foto troppo difficili da correggere.

对数据集的标注方式进行了部分优化。基于NoobAI Epsilon-pred v1训练。

Pony系模型有很强烈的生成耳环、耳钉以其他类型的耳部饰品的倾向,有时还会破坏人物耳部的结构。对相关的标注进行了整理。剪裁、手工修改了数据集中一部分结构错误不严重的图,剔除了一些太难修改的图片。

v3:

Dataset esteso a 1429 immagini, includendo esempi con tag positivi e negativi.

774 delle immagini sono nello stile più "desiderato".

Addestrato su Illustrious v0.1.

数据集扩展到了1429张图片,包括了正反两种例子。

其中774张是训练的目标风格。

基于Illustrious v0.1训练。

v2:

Dataset esteso a 374 immagini. Usa tag di qualità e tag estetici forniti con i modelli per controllare la qualità della generazione.

训练数据集扩展到了374张。尝试使用模型自带的质量提示词来稳定生成质量。

v1:

Addestrate 224 immagini da Civitai, 393 immagini per la regolarizzazione.

Addestrate 2 versioni basate su Animagine v3.1 e Pony v6.

训练了C站上224张图片,393张正则数据集。

有Animagine v3.1和Pony v6两个版本。

test ver.4:

È un po' sotto-addestrato ma funziona ancora. Ho scoperto che i tag di qualità e autenticità (best quality, masterpiece, very aesthetic, ...) con cui Animagine v3.1 è stato addestrato possono cambiare lo stile artistico generato da questo checkpoint. Lo risolverò nella prossima versione di test.

有些欠拟合但是目前是有效的。我发现Animagine v3.1自带的质量控制词和美学提示词会改变生成图片的画风,所以这个实验版本需要不填写质量词。下一版会修复。

Precedente
Former Splendor - v2.0
Successivo
WAI-NSFW-illustrious-SDXL - v12.0

Dettagli del Modello

Tipo di modello

LORA

Modello base

NoobAI

Versione del modello

v6_noobEv1.1

Hash del modello

096d658fc1

Creatore

Discussione

Per favore log in per lasciare un commento.