模型/Tponynai3 - v55

Tponynai3 - v55

陳嘉欣 (Chan Ka-yan)

5/23/2025

1:41:32 AM

| Discussion|

提示

使用中等分辨率並開啟高清修復以獲得最佳效果。

嘗試 style_3 或 style_4 來改善眼部細節。

版本亮點

此版本為對 5.1 的優化，改進了眼部細節、足部合理性、對提示詞敏感度及肢體重疊合理度。但畫面明暗處理仍未達預期，測試中使用 style_4 使畫面更暗，或為短期解決方案。我使用了額外訓練，因直接訓練效果不佳，花費了些時間。如有更多問題，請務必於評論區告知！

This version is an optimization to 5.1, optimizing the details of the eyes, the rationality of the feet, the sensitivity to cues, and the rationality of limb overlap. In my tests, the use of style_4 made the picture darker, perhaps a short-term solution, and I used some additional training, because the direct training did not work so well, so I wasted some time. If you have more questions, please be sure to let me know in the comments section!

創作者贊助

[未認證]Tonade 正在創作 T-ponynai3 模型，c 站 id：Tonade， | 愛發電 (afdian.net )

這裡是愛發電的贊助通道，覺得模型好用且有餘力的話可以支持一下！絕不勉強，感謝你們每一份支持，我會繼續探索如何把模型練好！

929721518 本人的 qq 小群群號，有什麼不懂的關於 tpony 的問題可以進來詢問。記得註明 c 站哦

模型已內置 vae，無需額外添加 vae

模型已內置 VAE，無需添加額外 VAE

最佳出圖策略為使用中等分辨率搭配高清修復，而非直接使用大分辨率直出

最佳出圖策略是於中等分辨率使用高清修復，而非直接採用高分辨率直出

[未認證]Tonade 正在創作 T-ponynai3 模型，c 站 id：Tonade， | 愛發電 (afdian.net )

這裡是愛發電的贊助通道，覺得模型好用且有餘力的話可以支持一下！絕不勉強，感謝你們每一份支持，我會繼續探索如何把模型練好！

(33) T-ponynai3-v5 - （權重修改版本） | Stable Diffusion Checkpoint | 吐司 tusi.cn (tusiart.com) tusiart（中國版 tensor）線上生成連結

（由於該模型只能同時存在於 Tusi 與 Tensor，建議優先於 Tusi 使用。如使用中有問題，請多向我反饋）

v5 版本新增 4 個 style，可透過 style_1 至 style_4 微調畫面細節（理論如此，實際效果略帶玄學）

v5 版本新增 4 個 style，可以用來透過 style_1 到 style_4 微調畫面細節（理論上如此，實際效果較為玄妙或較差）

本模型完美支援以 ponyv6 為底模訓練的 lora，ani3 及 sdxl1.0 的 lora 亦在一定程度上可適配

本模型完美支持由 ponyv6 為底模訓練的模型，ani3 和 sdxl1.0 的 lora 亦可在一定程度上適配。

基於 v4.1 的圖生圖測試（此為之前版本忽略部分）

基於 v4.1 的圖像修補測試（之前版本忽略的部分）

Pony 是神，兼容性滿分。本模型支援 ani 及 pony 的 lora

必備前置效果詞與 ponydiffusion 相同

positive：(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)

或 (score_9,score_8_up,score_7_up)

負面可加：

negative： (score_4,score_3,score_2,score_1),

也可以加常見的 nai 系負面詞，例如：

negative：worst quality, bad hands, bad feet

希望你喜歡 ᕕ(◠ڼ◠)ᕗ 基於 nai3 和 ponyv6

訓練須知：v1 使用了 94 張圖片，v2 用了 119 張，v3 用了 348 張，v3.5 用了 474 張，這些均為由 nai3 生成並用於將 lora 融入底模進行微調，pony 支援的畫師標籤均可用，使用超過兩個畫師標籤可能導致背景崩潰。目前可生成原神人物，其他未廣泛測試，對於此模型我測試尚少，讚嘆其對 nai3 畫風的高度還原。底模為 T-anime-xl、ponyv6 與 ani3 的融合模型，尚未公開發佈。

訓練使用自有 3090 顯卡，v1 至 v3 分別耗時 7 小時、12 小時、35 小時及 47 小時

訓練說明：合併 Lora 使用了 94 張圖片於 v1，119 張圖片於 v2，348 張於 v3，474 張於 v3.5，均由 NAI3 生成用以訓練底模微調，Pony 支援 ponyv6 既有所有畫師標籤，nai3 沒有新增畫師標籤。使用超過兩個畫師標籤可能導致背景崩潰。已發現能生成原神角色。其他未知。此模型測試有限，驚嘆於對 NAI3 畫風的還原。底模為 T-anime-xl、ponyv6 及 ani3 融合模型，尚未發佈。

訓練用顯卡為我的 3090，v1 至 v3.5 分別耗時 7 小時、12 小時、35 小時及 47 小時。

v1

一次有趣的嘗試

v2

在 v1 基礎上略增訓練集並進行約 30 小時參數試錯，但畫風仍有過擬合現象，如雙肚臍眼及亂髮

基於 v1，增加了部分訓練集並進行約 30 小時的參數試驗，但訓練出的畫風仍有些過擬合，如雙肚臍眼和雜亂頭髮

v3

v3 肢體比 v2 更佳，對 footfocus 理解更深，能生成視覺衝擊力強的腳及更困難透視視角。因 v2 訓練集少，頭髮部分有過擬合及偶見雙肚臍眼，v3 改善了這些。整體來說，三倍於 v2 的訓練集及更大 dim 參數使畫風更自然，且長提示詞下表現遠勝 v2。

v3 的肢體表現比 v2 好，對 footfocus 理解更深，可生成更具視覺衝擊的腳部與更高難度透視。v3 的頭髮 AI 感弱於 v2，因 v2 訓練集較少，頭髮部分有過擬合及偶發雙肚臍眼，v3 已消除。總體而言，三倍於 v2 的訓練量與更大 dim 參數使畫風更自然且長提示下表現遠優於 v2。

v3.5

本版本對質量詞要求不嚴，可不用 pony 美學評分的質量詞出圖，有時測試中會生成無意義色塊，只需將美學評分質量詞換為常用的 1.5 版本質量詞，如 score_1、score_2 改為 worst quality。本版本新增約 150 張訓練集以平衡及豐富畫風，降低學習曲線初始斜率，使模型不那麼過擬合，可適配更多 lora 與奇思妙想提示詞。整體而言，此版本較 v3 自由，且男性刻畫較 v3 強，某些提示詞下色彩與畫風不過於鮮豔與油膩。

此版本對質量詞要求寬鬆，完全可不使用 pony 的美學評分質量詞，有時會生成無意義色塊，僅需將質量詞替換為 1.5 常用質量詞如 worst quality 即可。我添加約 150 張訓練資料平衡及豐富畫風，並降低學習曲線初始斜率，減少過擬合，能適配更多 lora 及創意提示詞。整體來說，此版比 v3 更自由，且男性刻畫較強，色彩畫風亦較柔和。

v4

本版本使用 798 張圖片訓練，3090 顯卡訓練 90 小時。較 v3.5 在某些提示詞下構圖與部位刻畫更準確，如手指殘影與部位重疊。以中等及稍短提示詞為主要訓練目標，避免長提示詞產生高質量圖像的繁複情況。移除 pony 美學質量提示詞後，圖像質量較 v3.5 大幅提升，風格傾向平面而非立體，更接近經典動漫風。ponyv6 圖片數微調效果測試接近尾聲，下一步將從提示詞訓練標籤入手，嘗試在 pony 限量訓練素材中添加更多可調控提示詞（例如加入美學分數，目前訓練策略仍以主流質量詞覆蓋 pony 美學分數質量詞），並持續加入合適新素材，如場景及更多足部素材（v4 足部素材稍嫌不足）。

此版本使用 798 張圖訓練，3090 顯卡訓練 90 小時。相較於 v3.5，在某些提示詞下構圖及局部刻畫更精確，如手指殘影和部位重疊。主要以中短提示詞為訓練目標，避免因長提示詞而需複雜描述。移除 pony 美學分數質量提示詞後，圖質較 v3.5 明顯提升，畫面更平面，接近經典動漫風。ponyv6 微調圖數測試將結束，下一步將嘗試從提示詞標籤入手，增添可調控提示詞（如加入美學分數，現行邏輯為主流質量詞覆蓋 pony 美學提示詞），並持續添加合適新訓練素材，如場景與足部素材（v4 足部素材略少）。

v4.1

向各位用戶道歉，短時間內又放出新版本，這大考驗電腦記憶及網速。O_O

首先，對各位用戶表示歉意，短期內再次發佈新版本，對電腦的記憶體及網絡速度是一大考驗。O_O

本版本基於 v4 肢體調試版，因 v4 肢體效果難控，手部完美率未達近期測試期待。故我與朋友木貓貓貓對 v4 進行調整改良，最終令 v4.1 肢體達預期，將釋出多張 xy 圖清楚展示 v4.1 在相同參數下對比 v4 改善。

此版本為基於 v4 肢體調整版，因 v4 手部效果難控且未達測試預期，我與朋友木貓貓貓進行改良，v4.1 肢體達標，將發布多張 xy 圖展現對比。

v5

本版本訓練素材減少，因 v4 失利，我開啟新項目，嘗試從顯存占用角度出發，訓練四個不同畫風適配 T-ponynai3 的 lora，原始模型同樣上傳至 civitai。適配測試後，將四種畫風作為添加劑訓練入 T-ponynai3-v5。令人驚艷的是，v5 線條質感提升顯著，或因訓練了細膩素材。打標使用 style_1 至 style_4 提示詞，但四種畫風未分開顯現或效果微弱，反倒良好融合原始畫風。雖未達多畫風支持目標，卻成功提升原始 nai3 畫風質感。或許下版可嘗試更進一步。（我熱愛打遊戲，訓練時不能玩真的很難）

本版本訓練素材減少。v4 失利後，我著手新專案，從小顯存占用角度測試想法，訓練四種不同畫風 Lora 適配 T-ponynai3，原模型亦上傳 civitai。測試適配性後，將四種畫風作為添加劑訓練至 T-ponynai3-v5。驚喜發現 v5 線條質感大幅提升，可能因訓練了細膩素材。用 style_1 至 style_4 提示詞標註四風格，無法分離畫風且效果微弱，反而融入原始畫風。未達支持多畫風目標，但極大提升原始 Nai3 畫風質感。下個版本可能嘗試更進一步。（我很愛玩遊戲，訓練時無法玩真的好難）

針對 v5 版本問題總結如下。

1，lora 兼容性、肢體及眼睛模糊問題。lora 兼容問題因我此次訓練權重使用偏高，部分情況下出現過擬合。此優化版降低相應權重，肢體崩壞率及部分 lora 兼容性有所改善，並附上基於 v4.1 訓練畫風 lora 對比圖參考。眼睛模糊問題源自訓練 style_1，原素材眼睛即模糊，可用 style_3 或 style_4 改善。

2，體積光曝光問題。測試中未遇此問題，可能因我使用 noise offset 參數，提升了對光相關提示詞的敏感度，使得相同權重的光提示詞生成結果更亮。我建議可嘗試不使用括號及數字來提升權重，且因 sdxl 對提示詞極敏感，可重複同提示詞減少極端結果。同時用該參數為修復少量提示詞下黃化問題，我也附上對比圖參考。

3，模型複雜度降低問題。理論及實測均顯示，v5 應比先前版本更純淨、多元，部分提示詞下能獲得更精準表現。我亦附上多張對比圖。本訓練集未用過於複雜素材，避免過擬合造成細節流失。

目的：我希望得到與先前版本有足夠差異的模型，而非發佈幾乎相同版本。此次反饋是良好試錯機會，獨自嘗試代價高昂。下版將嘗試增加不同畫風素材量，使其融合且可分離，透過特定提示詞切換畫風，或需新訓練技術。感謝支持！

針對 v5 版本彙整的問題：

1、lora 兼容及肢體、眼睛模糊問題。因本次訓練權重過高，部份情況出現過擬合。優化版降低權重，肢體崩壞及 lora 兼容性改善，附帶基於 v4.1 訓練的畫風 lora 對比圖參考。眼睛模糊因訓練 style_1，原素材眼睛模糊，可用 style_3 或 style_4 改善。

2、體積光曝光問題。測試未遇，可能因使用 noise offset 參數，提高對光提示詞敏感度，造成光提示同權重下畫面更亮。建議嘗試不用括號和數字提升權重。因 sdxl 對提示詞敏感，重複提示詞可減少極端結果。同時此參數修復少量提示詞黃化問題，附對比圖參考。

3、模型複雜度下降問題。理論及實測顯示 v5 模型更純淨多元，部分提示詞下能獲更精準玩法，附多張對比圖。訓練集無使用過度複雜素材，避免過擬合及細節流失。

目標為打造差異顯著的新模型，而非重複先前版本。此次反饋是寶貴的試錯機會，獨自嘗試成本太高。下版計畫增多畫風素材使其融合且分離，可透過指定提示詞切換畫風，或需新訓練技術。感謝大家支持！