Pony: People's Works v1-v6 - v3_illu0.1
推薦提示詞
masterpiece,best quality,very aesthetic
1girl, solo, masterpiece, best quality, very aesthetic
推薦反向提示詞
worst quality,low quality,displeasing
lowres, bad, text, worst quality, low quality, displeasing
推薦參數
samplers
steps
cfg
提示
對於v3及以後版本,使用正面標籤如 'masterpiece'、'best quality' 和 'very aesthetic'。
負面提示詞包括 'worst quality'、'low quality' 及 'displeasing'。
在提示詞中加入 'hair intakes' 可能在一定程度上緩解髮型偽影問題。
v2以前版本沒有特定觸發詞,請搭配相應模型使用質量標籤。
注意 Animagine v3.1 的質量及美學標籤可能改變 LoRA 所生成的藝術風格。
Intro. 简介:
A style LoCon trained on pony-based model images collected from Civitai site with "most collections" and "most reactions".
這是一個訓練自Civitai上點讚最多和收藏最多的pony系模型圖片的畫風LoCon。
This lora does not intend to simulate any specific artist style or technique. It MIGHT reflects community taste and the visual attractiveness of a picture to a certain extent. Styles may change subtly depending on different prompts.
這個lora並不意於還原某個特定的畫師畫風或者繪畫技巧。它在某種程度上可能反映了社區審美和圖片的視覺吸引力。不同提示詞下可能會有微妙的畫風變化。
Usage 使用方法:
Versions before V2 do not have specific trigger words. Please use the quality tags provided with the corresponding model.
For V3 and later versions, the following tags were trained:
V2以前的版本沒有特定觸發詞。請使用對應模型自帶的質量提示詞。
對於v3及後續版本,訓練了以下標籤:
positive:
masterpiece, best quality, very aestheticnegative:
worst quality, low quality, displeasing你可以在此基礎上編輯提示詞。
Data Generation 數據版本:
v6:
新增超過500張新圖片,其中部分選自Flux。我刪除了一些我認為品質較低的舊圖。
數據集總圖片數現在超過3000張,6個版本中共手動增強/編輯了20多個概念。
模型的rank也有所提升。
新添加了500+張圖片其中有一部分選自flux生成的圖像。刪除了一部分我認為品質不佳的舊圖片。
現在總的圖片數超過了3000,6個版本的數據總共手動增強/修正了20多條概念。
增加了模型的rank。
v5.9:
模型表現不如預期,但我認為訓練數據集的圖片本身沒問題。我計劃手動調整標籤,看結果如何變化。
2025/1/3更新:
手動更新了一些標籤,但它們似乎與亮度和色彩無關。暫時猜測可能與 noise offset 有關。
v5:
數據集擴展至2154張圖片,約1000張Pony圖片作為主要訓練目標。
雖然V-pred模型可以使用基於Eps-pred模型訓練的LoRA,但輸出質量會大幅下降。本版本將在兩種不同模型類型上分別訓練。
近期NoobAI版本有明顯的偽影,但Danbooru的“jpeg artifact”標籤似乎沒有效果。針對此問題,專門選取約30張典型且肉眼可見的負面圖片作為負例。
觀察到現象:Pony v6 和 NoobAI 在生成有側發的髮型時,傾向於在髮根處生成三角形翹起。在 Danbooru,該翹起有時標記為“hair intakes”或“curtained hair”,但 Pony 為每個角色套用此結構。這也是 Pony 訓練角色時髮型與預期不符的重要原因。NoobAI 也有類似現象。猜測此特徵在 Danbooru 外的數據集普遍存在,且未被正確標註。
圖片經過篩選,約2/3有正確標註。當前在提示詞中加入“hair intakes”可能可在一定程度上緩解,但尚未找到根治方法。
數據集擴充到2154張圖。其中作為主要訓練目標的pony圖片約1000張。
雖然V-pred模型也能使用基於Eps-pred技術的模型訓練的lora,但是生成質量會大打折扣。這個版本將會分別在兩個不同類型的模型上訓練。
noobAI近期版本有比較明顯的偽影,但是danbooru上的“jpeg artifact”並沒有起作用。因此專門針對這個問題選擇了約30張較為典型的、肉眼可見的圖片作為負面案例。
觀察到一個現象:pony v6和noobAI在生成有側發的髮型時,傾向於在髮根處生成一個三角形的翹起。在danbooru裡,這種翹起有時會被標註為“hair intakes”和“curtained hair”,但是pony會給每一個角色都套上這樣的結構。這也是pony訓練角色時,髮型訓練不像的一個重要原因。noob也觀察到了類似的現象,我的猜測是danbooru以外的某個訓練集大量存在這個特徵,但沒有對這個特徵進行正確標註。
對數據集裡的圖片進行了篩選,其中約2/3的圖片進行了正確的標註。現在,在prompt裡寫上“hair intakes”可能可以一定程度上減輕這個現象,但是我還沒有找到根治這個毛病的辦法。
v4:
部分優化數據集標籤。基於NoobAI Epsilon-pred v1訓練。
Pony系模型傾向生成耳環、耳洞及其他類型耳飾,有時破壞角色耳部結構。我整理了相關標籤,剪裁並手動修改部分有輕微結構問題的圖像,刪除了過於難以修正的圖片。
對數據集的標註方式進行了部分優化。基於NoobAI Epsilon-pred v1訓練。
Pony系模型有強烈生成耳環、耳釘及其他類型耳部飾品的傾向,有時還會破壞人物耳部結構。對相關的標註進行整理。剪裁、手工修改數據集中部分結構錯誤不嚴重的圖片,剔除一些太難修改的圖片。
v3:
數據集擴展至1429張圖片,包括正面及負面標籤的樣本。
774張圖片為最「受歡迎」的風格。
基於Illustrious v0.1訓練。
數據集擴展到了1429張圖片,包括了正反兩種例子。
其中774張是訓練的目標風格。
基於Illustrious v0.1訓練。
v2:
數據集擴展到374張圖片。使用模型自帶的質量提示詞和美學提示詞來控制生成品質。
訓練數據集擴展到了374張。嘗試使用模型自帶的質量提示詞來穩定生成品質。
v1:
訓練使用了Civitai上的224張圖片與393張正則化圖片。
基於Animagine v3.1及Pony v6訓練了兩個版本。
訓練了C站上224張圖片,393張正則數據集。
有Animagine v3.1和Pony v6兩個版本。
test ver.4:
雖有些欠擬合但仍有效。我發現Animagine v3.1自帶的質量控制詞和美學提示詞會改變此checkpoint生成的畫風,故此實驗版本需避免填寫質量詞。下一版將修復此問題。
有些欠擬合但是目前是有效的。我發現Animagine v3.1自帶的質量控制詞和美學提示詞會改變生成圖片的畫風,所以這個實驗版本需要不填寫質量詞。下一版會修復。







