モデル/Animagine XL V3.1 - v3.1

Animagine XL V3.1 - v3.1

沢岡美纪子

7/21/2025

1:18:49 PM

| Discussion|

推奨プロンプト

masterpiece, best quality, very aesthetic, absurdres

outdoors, masterpiece, very aesthetic, best quality, absurdres

推奨ネガティブプロンプト

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

nsfw, worst quality, low quality

推奨パラメータ

samplers

Euler Ancestral (Euler a), Euler a

steps

28 - 30

cfg

5 - 7

resolution

1024x1024, 1152x896, 896x1152, 1216x832, 832x1216, 1344x768, 768x1344, 1536x640, 640x1536, 896x1152, 1216x832

other models

animagine-xl-3.1 (9f86289b6a)

推奨ハイレゾパラメータ

upscaler

Latent (nearest-exact), R-ESRGAN 4x+ Anime6B

upscale

1.5

steps

15 - 30

denoising strength

0.4 - 0.55

ヒント

構造化されたプロンプトテンプレートを使用してください： '1girl/1boy, キャラクター名, どのシリーズか, その他すべて自由な順序。'

品質、評価、年、審美の特別タグを使用して生成結果をより正確に制御してください。

モデルは自然言語プロンプトよりDanbooruスタイルのタグに最適化されています。

より良い品質のためにCFGスケールは5-7前後、サンプリングステップは30以下を使用してください。

審美タグはアニメデータで訓練された専門のViT画像分類モデルから派生しています。

クリエイタースポンサー

Cagliostro Lab Server Discordに参加：

https://discord.gg/cqh9tZgbGc

寄付やコーヒーのおねだりがあればこちらからどうぞ

誠にありがとうございます ^_^

Animagine XL 3.1 はAnimagine XL V3シリーズのアップデートで、前バージョンのAnimagine XL 3.0を強化しています。このオープンソースのアニメテーマのテキスト画像生成モデルは、より高品質なアニメスタイルの画像生成に改良されており、有名なアニメシリーズの幅広いキャラクター、最適化されたデータセット、新しい審美タグを含み、より良い画像作成を実現しています。Stable Diffusion XLを基盤に、Animagine XL 3.1はアニメファン、アーティスト、コンテンツクリエイターに正確で詳細なアニメキャラクター表現を提供することを目指しています。

モデル詳細

開発者: Cagliostro Research Lab
協力: SeaArt.ai
モデルタイプ: 拡散ベースのテキストから画像生成モデル
モデル説明: Animagine XL 3.1はテキストプロンプトから高品質なアニメ画像を生成します。手の解剖学の強化、コンセプト理解の向上、先進的なプロンプト解析を特徴とします。
ライセンス: Fair AI Public License 1.0-SD
ファインチューニング元: Animagine XL 3.0

使用ガイドライン

タグの順序

最適な結果を得るために、構造化されたプロンプトテンプレートに従うことを推奨します。モデルは以下のように訓練されています:

1girl/1boy, キャラクター名, どのシリーズか, その他すべて自由な順序。

特別タグ

Animagine XL 3.1は品質、評価、作成年、審美性に基づいた特別なタグを利用して結果を制御します。これらのタグ無しでも画像生成は可能ですが、使用することでより良い結果が期待できます。

品質修飾子

品質タグはスコアと投稿評価の両方を考慮し、バランスの取れた品質分布を保証します。『high quality』を『great quality』に変更するなど、明確さを向上させています。


品質修飾子	スコア基準
masterpiece	        > 95%
best quality	        > 85% & ≤ 95%
great quality	        > 75% & ≤ 85%
good quality	        > 50% & ≤ 75%
normal quality	        > 25% & ≤ 50%
low quality	        > 10% & ≤ 25%
worst quality	        ≤ 10%

評価修飾子

評価タグも単純化と明確化を進め、異なるモデルに適用可能なグローバルルールの確立を目指しています。例えば『rating: general』は『general』に、『rating: sensitive』は『sensitive』に簡素化されています。


評価修飾子	評価基準
safe	            一般
sensitive	    敏感
nsfw	            疑わしい
explicit, nsfw	    明示的

年修飾子

年タグは特定の現代的またはヴィンテージなアニメアートスタイルにより正確に誘導するために再定義されました。この更新により、現在および過去の時代に関連したシンプルな範囲設定が可能です。


年タグ	年の範囲
newest	        2021 から 2024
recent	        2018 から 2020
mid	        2015 から 2017
early	        2011 から 2014
oldest	        2005 から 2010

審美タグ

視覚的魅力に基づきコンテンツ分類を洗練するため、専門のViT（Vision Transformer）画像分類モデル（アニメデータで訓練）による審美タグを導入しました。評価にはshadowlilac/aesthetic-shadow-v2モデルを利用し、トレーニング前にコンテンツの審美価値を評価しています。これにより、関連性・正確性だけでなく視覚的にも魅力的なコンテンツを保証します。


審美タグ	       スコア範囲
very aesthetic	       > 0.71
aesthetic	       > 0.45 & < 0.71
displeasing	       > 0.27 & < 0.45
very displeasing       ≤ 0.27

推奨設定

高審美の画像生成を促すために、以下のネガティブプロンプトを使用してください:

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

より高品質な結果には、プロンプトの先頭に以下を付けることを推奨します:

masterpiece, best quality, very aesthetic, absurdres

また、低めのCFGスケール（約5-7）、30以下のサンプリングステップ、サンプラーにEuler Ancestral（Euler a）の使用が推奨されます。

マルチアスペクト解像度

このモデルは以下の解像度での画像生成をサポートしています:

解像度	アスペクト比
1024 x 1024	1:1 正方形
1152 x 896	9:7
896 x 1152	7:9
1216 x 832	19:13
832 x 1216	13:19
1344 x 768	7:4 横長
768 x 1344	4:7 縦長
1536 x 640	12:5 横長
640 x 1536	5:12 縦長

謝辞

Animagine XL 3.1の開発とリリースは、以下の個人と組織の多大な貢献と支援がなければ実現しませんでした:

SeaArt.ai: コラボレーションパートナー兼スポンサー。
Shadow Lilac: aesthetic-shadow-v2 審美分類モデルの提供。
Derrian Distro: LoRA Easy Training Scriptsから改変したカスタム学習率スケジューラの提供。
Kohya SS: 包括的なトレーニングスクリプトの提供。
Cagliostrolab共同開発者: モデル訓練、プロジェクト管理、データキュレーションへの献身。
初期テスター: 貴重なフィードバックと品質保証への貢献。
NovelAI: 審美タグ付け手法の革新的アプローチにより、当実装にインスピレーションを提供。

皆様のご支援と専門知識により、アニメスタイル画像生成の限界を押し広げることができました。心より感謝申し上げます。

制限事項

Animagine XL 3.1はアニメスタイル画像生成の大きな前進ですが、以下の制限があります：

アニメ特化: 本モデルはアニメスタイル画像生成に特化しており、リアルな写真生成には適していません。
プロンプトの複雑さ: 短く単純なプロンプトから高品質な結果を期待するユーザーには不向きです。訓練は概念理解に重点を置いており、美的洗練にはより詳細かつ特定的なプロンプトが必要な場合があります。
プロンプト形式: Animagine XL 3.1は自然言語プロンプトよりもDanbooruスタイルのタグ向けに最適化されています。最良の結果を得るには適切なタグと構文でプロンプトを構成してください。
解剖学と手の描画: 解剖学と手の描画は改善されましたが、依然として最適でない結果が出ることがあります。
データセットサイズ: 訓練に使用されたデータセットは約87万枚の画像で、前バージョンの120万枚と合わせて約210万枚の画像です。十分な規模ですが「究極の」アニメモデルとしては限定的かもしれません。
NSFWコンテンツ: バランスの良いNSFWコンテンツ生成を目指していますが、明示的でなくともNSFWな結果を生成する可能性があります。

これらの制限を認識しつつ、Animagine XL 3.1ユーザーに透明性と現実的な期待値を提供したいと考えています。これらの制約にもかかわらず、本モデルはアニメスタイル画像生成における重要な進歩を示し、アーティストやデザイナー、愛好家に強力なツールを提供します。

ライセンス

Animagine XL 3.0を基にしたAnimagine XL 3.1は、Stable Diffusionモデルのライセンスに互換性のあるFair AI Public License 1.0-SDの下にあります。主なポイントは以下の通りです：

改変共有: Animagine XL 3.1を改変した場合は、変更内容と元のライセンスの両方を共有しなければなりません。
ソースコード公開: 改変版がネットワークアクセス可能な場合、他者がソースコードを入手できる方法（ダウンロードリンクなど）を提供する必要があります。派生モデルにも適用されます。
配布条件: 配布は本ライセンスまたは同等の規則を持つライセンスの下で行う必要があります。
遵守: 非遵守は30日以内の是正が必要で、これを怠るとライセンスが終了します。透明性とオープンソースの価値遵守を強調しています。

このライセンス選択はAnimagine XL 3.1をオープンかつ改変可能に維持し、オープンソースコミュニティ精神に沿うものです。貢献者とユーザーを保護し、協力的かつ倫理的なオープンソースコミュニティの形成を促進します。これにより、本モデルは共同の入力による利益を享受しつつ、オープンソース開発の自由も尊重します。

最後に、Cagliostro Labサーバーは一般公開されています https://discord.gg/cqh9tZgbGc

ぜひDiscordサーバーにご参加ください。
寄付やコーヒーのおねだりをご希望の方はこちらからお願いいたします。

本当にありがとうございます ^_^