Animagine XL V3.1 - v3.1
推薦提示詞
masterpiece, best quality, very aesthetic, absurdres
outdoors, masterpiece, very aesthetic, best quality, absurdres
推薦反向提示詞
nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]
nsfw, worst quality, low quality
推薦參數
samplers
steps
cfg
resolution
other models
推薦高解析度參數
upscaler
upscale
steps
denoising strength
提示
使用結構化提示模板:'1girl/1boy, 角色名稱, 來自哪個系列, 其他內容順序不限。'
使用專門的質素、評級、年份及美學標籤,讓生成結果更精確。
模型優化為 Danbooru 風格標籤格式,而非自然語言提示。
使用較低的 CFG Scale 約 5-7 且採樣步數低於 30,以提升質素。
美學標籤源自專門訓練於動漫數據的 ViT 圖像分類模型。
創作者贊助
Animagine XL 3.1 是 Animagine XL V3 系列中的更新版本,進一步提升了先前的 Animagine XL 3.0。這款開源動漫主題的文字轉圖像模型被優化以生成更高質素的動漫風格圖片。其包含了來自知名動漫系列的更廣泛角色,優化的數據集以及新增的美學標籤以改進圖像創建。基於 Stable Diffusion XL,Animagine XL 3.1 致力成為動漫迷、藝術家及內容創作者的寶貴資源,精確且細緻地呈現動漫角色。
模型詳情
合作夥伴: SeaArt.ai
模型類型: 基於擴散的文字轉圖像生成模型
模型描述: Animagine XL 3.1 可從文字提示生成高質素動漫圖片。具備增強的手部解剖、改進的概念理解及先進的提示解析功能。
基於: Animagine XL 3.0
使用指南
標籤排序
為獲得最佳效果,建議遵循結構化提示模板,因為模型正是基於此方式訓練:
1girl/1boy, 角色名稱, 來自哪個系列, 其他內容順序不限。
特殊標籤
Animagine XL 3.1 利用特殊標籤引導生成結果,涵蓋質素、評級、創作年份及美學。模型可在無此標籤生成圖片,但使用可獲得更佳效果。
質素修飾詞
質素標籤現考慮了分數及帖文評級,以確保質素分佈平衡。我們改良了標籤,使之更清晰,例如將「high quality」改為「great quality」。
質素修飾詞 分數標準
masterpiece > 95%
best quality > 85% & ≤ 95%
great quality > 75% & ≤ 85%
good quality > 50% & ≤ 75%
normal quality > 25% & ≤ 50%
low quality > 10% & ≤ 25%
worst quality ≤ 10%評級修飾詞
我們也簡化了評級標籤以達到簡潔明瞭,並期望建立可於不同模型間通用的全球標準。例如「rating: general」現簡化為「general」,「rating: sensitive」改為「sensitive」。
評級修飾詞 評級標準
safe 一般
sensitive 敏感
nsfw 有疑慮
explicit, nsfw 明確露骨年份修飾詞
重新定義了年份範圍,以更精確引導生成傾向現代或復古動漫藝術風格。此更新簡化範圍,重點關注與當代及過去時代的關聯性。
年份標籤 年份範圍
newest 2021 至 2024
recent 2018 至 2020
mid 2015 至 2017
early 2011 至 2014
oldest 2005 至 2010美學標籤
我們增強了標籤系統,加入依據視覺吸引力細分的美學標籤。這些標籤源自專門訓練於動漫資料的 ViT (Vision Transformer) 圖像分類模型。為此,我們使用了模型 shadowlilac/aesthetic-shadow-v2,用以評估內容的美學價值,確保內容既精確又具視覺吸引力。
美學標籤 分數範圍
very aesthetic > 0.71
aesthetic > 0.45 & < 0.71
displeasing > 0.27 & < 0.45
very displeasing ≤ 0.27推薦設置
為引導模型產出高美學圖像,使用負面提示詞如下:
nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]
若需更高質素,可在提示前加上:
masterpiece, best quality, very aesthetic, absurdres
建議使用較低的 classifier-free guidance (CFG Scale) 約 5-7,採樣步數控制在 30 以下,並以 Euler Ancestral (Euler a) 作為採樣器。
多長寬比解像度支持
本模型支援以下維度生成:
尺寸 長寬比
1024 x 1024 1:1 正方形
1152 x 896 9:7
896 x 1152 7:9
1216 x 832 19:13
832 x 1216 13:19
1344 x 768 7:4 橫向
768 x 1344 4:7 縱向
1536 x 640 12:5 橫向
640 x 1536 5:12 縱向致謝
Animagine XL 3.1 的開發與發布離不開以下個人及組織的寶貴貢獻與支持:
SeaArt.ai:我們的合作夥伴及贊助商。
Shadow Lilac:提供美學分類模型 aesthetic-shadow-v2。
Derrian Distro:其自訂的學習率調度器,改編自 LoRA Easy Training Scripts。
Kohya SS:全面的訓練腳本提供者。
Cagliostrolab 合作團隊:負責模型訓練、專案管理與數據策劃。
早期測試者:寶貴的反饋與質量保證支持。
NovelAI:其創新美學標籤方法啟發了本實作。
感謝各位的支持與專業,推動動漫風格圖像生成的邊界。
限制
雖然 Animagine XL 3.1 在動漫風格圖像生成上取得顯著進展,但仍需認識以下限制:
專注動漫:本模型專為生成動漫風格圖片設計,不適合創建現實照片。
提示複雜度:對於期待從簡短或簡單提示獲得高質素結果的用戶,本模型可能不適合。訓練重點在概念理解而非美學細化,可能需更詳細精確的提示詞以達理想輸出。
提示格式:Animagine XL 3.1 最佳使用 Danbooru 風格標籤,而非自然語言提示。建議使用者按照適當標籤和語法格式化提示以獲最佳效果。
解剖及手部渲染:儘管在解剖學及手部渲染有改良,但模型在這些方面仍可能偶爾產生不理想結果。
數據集規模:用於訓練 Animagine XL 3.1 的數據集約有 87 萬張圖片。與先前版本(120 萬張)合併,總數據達約 210 萬張。雖然規模龐大,但對於 "究極" 動漫模型來說仍有局限。
NSFW 內容:Animagine XL 3.1 設計上生成較平衡的 NSFW 內容,但模型仍可能生成 NSFW 結果,即使未明確提示。
透過認識這些限制,我們旨在提供透明度及設定用戶合理期望。儘管如此,我們相信此模型代表動漫風格圖像生成上的重要進步,為藝術家、設計師與愛好者提供強大工具。
授權
基於 Animagine XL 3.0,Animagine XL 3.1 採用 Fair AI 公共許可證 1.0-SD,與 Stable Diffusion 模型授權相容。重點如下:
修改共享:若修改 Animagine XL 3.1,必須同時分享改動及原始授權。
源代碼可及性:若修改版本可透過網絡訪問,須提供途徑(如下載連結)讓他人獲取源代碼。衍生模型同樣適用。
分發規範:任何分發必須在本授權下或具相似規定的授權下進行。
合規:不合規情況必須於 30 天內修正,避免授權終止,強調透明及遵守開源價值。
此授權旨在保持 Animagine XL 3.1 開放及可修改,符合開源社群精神。保障貢獻者與用戶,促進協作且具倫理的開源社區。確保模型受益於社群貢獻並尊重開源自由。
最後 Cagliostro Lab 伺服器公開邀請加入 https://discord.gg/cqh9tZgbGc
歡迎加入我們的 Discord 伺服器。
如果想捐款或請我們喝咖啡,可在此捐款 這裡
非常感謝 ^_^
