モデル/AlbedoBase XL - v2.1

AlbedoBase XL - v2.1

沢岡美纪子

7/7/2025

1:37:32 PM

| Discussion|

推奨ネガティブプロンプト

strabismus

lowres

推奨パラメータ

samplers

DPM++ 2M SDE Heun Karras

steps

24 - 60

cfg

7.5 - 8

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

ヒント

画像生成で何も生成されない場合は、CLIP SKIP 2に切り替えるか、単語の順序を変えたり別の言葉を使ってプロンプトを少し変更してみてください。

特にバージョン1.3ではネガティブプロンプト欄を空欄にすることで良質な画像が得られます。

LoRAの効果により、タグ（単語リスト）プロンプトより文形式プロンプトの使用が画像品質向上につながります。

モデル利用前に提供されたダウンロードリンクからスペックグリッドを確認して、最適な設定を把握してください。

バージョンのハイライト

新しいマージアルゴリズムと数式を用いてv0.1から2.0までを再マージ・調整しました。

クリエイタースポンサー

モデルに価値を感じていただけたら、ご支援をお願いいたします。あなたの貢献はすべてSDXLコミュニティの発展に使われます。

🙋🏼‍♂️ 参加はこちら (discord) ㅤ|ㅤ 🛒 購入 ㅤ|ㅤ 🌱 寄付

モデルに価値を感じていただけたら、ご支援をお願いいたします。あなたの貢献はすべてSDXLコミュニティの発展に使われます。

🙋🏼‍♂️ 参加はこちら (discord) ㅤ|ㅤ 🛒 購入ㅤ |ㅤ 🌱 寄付

AlbedoBase XL (SFW&NSFW)

リファイナーは不要で、VAEも含まれています。

目的

Stable Diffusion XLは35億パラメータ（リファイナー除く）を持ち、SD v1.5の約3.6倍にあたります。これは単なる数値ではなく、性能向上に大きくつながるものだと信じています。

コミュニティの爆発的な貢献によってSD v1.5の総合性能が想像以上に向上したことに気づいてからしばらく経ちました。そこで、このAlbedoBase XLモデルを完成させ、v1.5で起きた性能向上をこのXL版でも最適に再現することに取り組んでいます。

目標は、Civitaiに公開されたすべてのチェックポイントとLoRAを直接テストし、いくつかのフィルターを通した後、最適と判断したリソースのみをマージすることです。これにより、Midjourneyなどの企業の画像生成AI性能を上回ります。

現時点で、AlbedoBase XL v3.1 Largeは約200の選定されたチェックポイントと251のLoRAをマージしています。

ログ

v3.1-Large

• V3で使われた再帰スクリプトを用いて50以上の最新SDXLモデルの選定バージョンをマージしました。

スペックグリッド(370.7 MB): ダウンロード

v3-mini

大変お待たせして申し訳ありません。

個人的な事情に対処しながら新バージョンに取り組み、健康問題にも直面しました。この文章を書いている今もまだその課題と闘っています。

短い報告だけでは十分でないと感じ、詳細なメッセージをお伝えするため、ご理解をお願いいたします。

バージョン2.0リリース以降、独学で深層学習の勉強に取り組んでいます。正式な学位はありませんし、プログラミングの素養は控えめで、芸術の背景があるだけです。したがって、多大な時間を費やしても数学的・科学的基盤が不足しており、大きなブレークスルーを成し遂げるのは難しいです。それでも、この自己学習と研究の経験は人生にとってかけがえのない宝物となっています。

最近、重要なブレークスルーとなり得るアイデアを思いつきました。バージョン2.0以降、数百の数式や手法を改良し、かなり興味深く成功したアルゴリズムを開発しました。モデルのマージプロセスはSDXL1.0とSD1.5、それに厳選された他モデルをベースにしています。これらを「ANIME」、「REALISM」、「ARTISTIC」、「NSFW」、「BASE」という5つの主要カテゴリに分類し、マージアルゴリズムのデータセットとして使用しました。この手法により興味深い成果が得られています。

しかし、アルゴリズム開発の困難さ以上に性能テストフェーズが最も苦難でした。身体的および精神的健康が著しく悪化し、これ以上一人で続けることは難しいと悟りました。これが今回のリリース決断に至った理由です。

そして今、待望のAlbedoBaseXL V3 Miniバージョンを発表できることを嬉しく思います。このモデルは小規模なマージですが、特定領域に限定されず、多様な分野で非常に良好な性能を発揮します。SDXL1.0の新たなベースモデルとして活躍できる可能性があります。（私のマージアルゴリズムは「線形マージ」ではないため、本質的には新しいファインチューニングモデルとみなせます。）

このモデルは既存のAlbedoBaseモデルとともに多用途であり、すべての以前のバージョンをあらゆる面で凌駕します。（NSFWコンテンツは過激ではありませんが、v2.1など以前のバージョンより表現の幅が広がっています。専用のNSFWマージモデルは今後リリース予定です。）

また、最近多くの共有モデルがマージや外部商用利用を禁止するライセンスを採用し始めていることに残念な思いを抱いています。このため、いくつかの優秀なモデルをマージに使用できなくなりました。

多くの時間と努力を費やしながら無料ライセンスを提供し、高品質なモデルをマージに使えるようにしてくださったモデル開発者の皆様に心から感謝いたします。

またすぐに戻ってきます。

ANIME、REALISM、ARTISTIC、2.5D、3D、NSFWなど幅広い分野での性能テストを楽しみにしています。

モデル開発者として私たちは種をまくだけです。最終的に花や果実を育てるのはあなた方、モデルユーザーであり、アーティストです。

いつもありがとうございます。

私の活動を少しでも金銭的に支援してくださる方は下記リンクの利用をご検討ください。現在、就労が困難で、生計が不安定な状況にあります。

🌱 寄付

スペックグリッド(380.5 MB): ダウンロード

v2.1
新しいマージアルゴリズムと数式を使用してv0.1から2.0までを再マージ・調整しました。

スペックグリッド(424.5 MB): ダウンロード

v2.0

AlbedoBase XL Preにお力添えいただいた皆様に感謝します。皆様のおかげでリリース日を大きく早めることができました。誠にありがとうございます！

独自のスクリプトを用いて既存のAlbedoBase XLモデルを一つに収束させました。すべてのU-NET・CLIPブロックの行・列の重みを私のユニークな数式に沿って精緻に対齐しました。
画像生成でバグが発生した場合（何も生成されない場合）はCLIP SKIP 2に切り替えるか、プロンプトを少し変更してください。CLIPが認識しない単語の組み合わせがあるかもしれません。その場合、単語の順序を変えたり、別の単語を使ったり、最も簡単にはCLIP SKIPを変更することをおすすめします。今後v1.3のようにこれらの問題を段階的に解決していきます。

スペックグリッド(403.5 MB): ダウンロード

v1.3

モデルのランダム性に伴う品質を示すため、サンプリング用のショーケース画像はすべてシード値を'9'に統一し、即時生成しました。
特にこのバージョンではネガティブプロンプトの影響が大きいため、ネガティブプロンプト欄を空欄にすることが良質な画像を得る上で有効です。

スペックグリッド(438.7 MB): ダウンロード

ご覧の通りSteps数が増えると、すべてのサンプラーで使用可能になり、かつ品質も向上します。
下記のLoRA効果により、タグ（単語リスト）プロンプトよりも文形式のプロンプトが品質向上に直結します。

45のチェックポイントと7つのLoRAをマージしました。その後、AlbedoBase v0.4およびv0.3を順に0〜5%未満でマージし、希釈され古くなったマージモデルを復活させました。
7つのLoRAのうち1つは私の制作です。GPT4-Vを用いて174枚の高品質写真のキャプションを分析、注釈付けしました。このLoRAをマージすると驚くほど鮮明な画像と優れたプロンプト理解が得られます。

私が制作したLoRAは、クリエイティブレベル以上のKo-fiサポーター限定で購入可能です。

v1.2

最新22のチェックポイントをマージしました。

スペックグリッド(565.6 MB): ダウンロード

v1.1

安定化しました。
より詳細になりました。
上級者であればバージョン1.0をおすすめします。設定が合えば、より鮮やかな作品を出力可能です。

スペックグリッド(349.7 MB): ダウンロード

v1.0

106のLoRAをマージしました。
19のチェックポイントをマージしました。

設定によって結果が異なるため、ご使用前にスペックグリッドを必ず確認してください。
- 特定のネガティブプロンプトを使うことで、非対称な目やピクセル化した画像の問題が改善する場合があります。スペックグリッドはCPUやGPUによって変動するので参考程度に用いてください。いくつかのネガティブプロンプトを試して品質向上を図るとよいでしょう（例：斜視）。マージされたLoRA数が増えるとすべての設定を同時に満たすのは難しいですが、バージョン1.0の利点として様々な面で驚異的な品質を生み出せる点に注目してほしいです。今後さらに安定版を提供予定です。
ショーケースや他者の設定を参考に有用な値を探してください。
いつも通り、ネガティブプロンプトは空欄が最良の結果をもたらします。
v1.0はかなり骨が折れたため、少し休息します。ぜひモデルを楽しんで使ってください。マージした場合はCivitaiに無料で共有していただけると皆で改善できます。

スペックグリッド(479.4 MB): ダウンロード

v0.4

132のLoRAをマージしました。
4のチェックポイントをマージしました。

スペックグリッド: ダウンロード

v0.3

すべてのサンプラーで改善しました。
リアリズムが向上しました。
安定化しました。

スペックグリッド: ダウンロード

v0.2

鮮明さとディテールが大幅に向上しました。
手足の表現が改善されました。
構図、抽象化、流れ、光と色彩など、美的要素も大幅に改善されました。

v0.1

SDXL1.0モデルに適切にファインチューニングし、Civitaiで公開されている40以上の高品質モデルを入念かつ目的を持ってマージしました。
主に最小限のプロンプトトークンで最高品質を目指したテストを行っており、多数のトークンを使った場合の品質向上は未確認です。（各自で検証し結果を共有してください）
一般的に、リアルとアニメの中間地点で最も美しい結果が得られます。
それでも適切なプロンプトを用いれば、ほぼ全て表現可能です。（他モデルを凌駕する価値ある基盤モデルであると主張しますが、現状はv0.1であることにご留意ください）