Pony: People's Works v1-v6 - v4_noobEv1.0
推薦提示詞
masterpiece,best quality,very aesthetic
1girl, solo, full lower lip, narrow mouth, long hair, blue eyes, looking at viewer, upper body, masterpiece, best quality, very aesthetic
推薦反向提示詞
worst quality,low quality,displeasing
worst quality, low quality, displeasing
推薦參數
samplers
steps
cfg
clip skip
resolution
提示
對於V3及以後版本,請使用正面標籤如「masterpiece」、「best quality」及「very aesthetic」。
負面提示詞包括「worst quality」、「low quality」及「displeasing」。
在提示詞中加入「hair intakes」或有助於緩解髮型偽影問題。
V2之前版本無特定觸發詞,請使用對應模型自帶的品質提示詞。
注意,Animagine v3.1的品質與美學標籤可能會改變LoRA所生成的畫風。
Intro. 简介:
A style LoCon 訓練於 從 Civitai 網站收集的「最多收藏」與「最多反應」pony主題模型圖片。
這是一個從 Civitai 上點贊最多和收藏最多的pony系模型圖片 訓練而成的 畫風 LoCon。
此 lora 不用意模擬任何特定畫師的風格或繪畫技巧。它 可能 在某種程度上反映 社區審美 與 圖片的視覺吸引力。不同提示詞下風格會有細微變化。
這個 lora 並不意於還原某個特定的畫師畫風或者繪畫技巧。它在某種程度上可能反映了社區審美和圖片的視覺吸引力。不同的提示詞下可能會有微妙的畫風變化。
Usage 使用方法:
V2 之前的版本無特定觸發詞,請使用各版本模型自帶的品質提示詞。
V3 及之後版本訓練了以下提示詞:
V2以前的版本沒有特定觸發詞。請使用對應模型自帶的品質提示詞。
對於 v3 及後續版本,訓練了以下標籤:
positive:
masterpiece, best quality, very aestheticnegative:
worst quality, low quality, displeasing你可在此基礎上編輯提示詞。
Data Generation 數據版本:
v6:
新增超過500張圖片,其中部分選自 Flux。我刪除了一些品質較低的舊圖片。
目前數據集圖片總數超過3,000張,在6個數據版本中手動增強/修正超過20個概念。
模型的排名也有所提升。
新添加了500+張圖片其中有一部分選自flux生成的圖像。刪除了一部分我認為品質不佳的舊圖片。
現在總的圖片數超過了3000,6個版本的數據總共手動增強/修正了20多條概念。
增加了模型的rank。
v5.9:
模型表現未達預期,但我認為訓練數據集中的圖片沒問題。計劃手動調整標籤觀察效果變化。
2025/1/3 更新:
手動更新了部分標籤,但似乎與明暗及色彩無關,暫且推測可能與噪點偏移有關。
模型效果不如預期,但是我覺得訓練集的圖片本身應該沒什麼問題。打算先手動修正 tag 看看效果。
2025/1/3更新:
手動更新了一部分標籤,但是它們和明暗色彩無甚干系。暫時猜測可能和 noise offset 有關。
v5:
數據集擴展至2,154張圖片,其中約1,000張 Pony 圖片為主要訓練目標。
儘管 V-pred 模型能使用基於 Eps-pred 模型訓練的 LoRA,輸出品質會顯著下降。此版本將分別在兩種模型上進行訓練。
NoobAI近期版本出現較明顯的偽影,但 Danbooru 上的“jpeg artifact”標籤效果不佳。因而特選約30張典型且肉眼可見的圖片作負面範例。
發現現象:Pony v6 與 NoobAI 在生成有側髮的髮型時,傾向於在髮根處產生三角形翹起。Danbooru 中此翹起有時被標為“hair intakes”或“curtained hair”,但 Pony 為每位角色添加了此結構。此為 Pony訓練髮型不符合設計的重要原因,NoobAI 亦有類似問題。推測此特徵在 Danbooru 以外數據集廣泛存在但標註不足。
對數據集圖片篩選後約三分之二有正確標註。目前在提示詞中加入“hair intakes”或能在一定程度上緩解此問題,但尚未找到徹底解決方案。
數據集擴充到2154張圖。其中作為主要訓練目標的pony圖片約1000張。
雖然V-pred模型也能使用基於Eps-pred技術的模型訓練的lora,但是生成質量會大打折扣。這個版本將會分別在兩個不同類型的模型上訓練。
noobAI近期版本有比較明顯的偽影,但是danbooru上的“jpeg artifact”並沒有起作用。因此專門針對這個問題選擇了約30張較為典型的、肉眼可見的圖片作為負面案例。
觀察到一個現象:pony v6和noobAI在生成有側發的髮型時,傾向於在髮根處生成一個三角形的翹起。在danbooru裡,這種翹起有時會被標註為“hair intakes”和“curtained hair”,但是pony會給每一個角色都套上這樣的結構。這也是pony訓練角色時,髮型訓練不像的一個重要原因。noob也觀察到了類似的現象,我的猜測是danbooru以外的某個訓練集大量存在這個特徵,但沒有對這個特徵進行正確標註。
對數據集裡的圖片進行了篩選,其中約2/3的圖片進行了正確的標註。現在,在prompt裡寫上“hair intakes”可能可以一定程度上減輕這個現象,但是我還沒有找到根治這個毛病的辦法。
v4:
部分優化數據集標籤。基於 NoobAI Epsilon-pred v1 訓練。
Pony主題模型強烈生成耳環、耳洞及其他耳部飾品傾向,有時破壞角色耳部結構。整理相關標籤,裁剪並手動修改數據集中部分結構錯誤輕微的圖片,刪除了較難修正的圖片。
對數據集的標註方式進行了部分優化。基於NoobAI Epsilon-pred v1訓練。
Pony系模型有很強烈的生成耳環、耳釘以其他類型的耳部飾品的傾向,有時還會破壞人物耳部的結構。對相關的標註進行了整理。剪裁、手工修改了數據集中一部分結構錯誤不嚴重的圖,剔除了一些太難修改的圖片。
v3:
數據集擴展至1429張圖片,包括正反兩種標籤範例。
其中774張圖片為目標風格。
基於 Illustrious v0.1 訓練。
數據集擴展到了1429張圖片,包括了正反兩種例子。
其中774張是訓練的目標風格。
基於 Illustrious v0.1 訓練。
v2:
數據集擴展至374張圖片。使用模型自帶的品質及美學提示詞控管生成質量。
訓練數據集擴展到了374張。嘗試使用模型自帶的品質提示詞來穩定生成質量。
v1:
訓練224張 Civitai 圖片,393張正則化圖片。
基於 Animagine v3.1 和 Pony v6 兩版本訓練。
訓練了 C 站上 224 張圖片,393 張正則數據集。
有 Animagine v3.1 和 Pony v6 兩個版本。
test ver.4:
稍有欠擬合但仍可用。我發現 Animagine v3.1自帶的品質及美學標籤(best quality, masterpiece, very aesthetic 等)會影響該 checkpoint 生成的風格,下一版本將修復此問題。
有些欠擬合但目前有效。我發現 Animagine v3.1 自帶的品質控制詞和美學提示詞會改變生成圖片的畫風,所以這個實驗版本需要不填寫品質詞。下一版會修復。







