AlbedoBase XL - v1.3
推奨ネガティブプロンプト
strabismus
推奨パラメータ
samplers
steps
cfg
resolution
vae
ヒント
画像生成で結果が出ない場合はCLIP SKIP 2に切り替えるか、単語の順序や表現を変えてプロンプトを少し修正してみてください。
文形式のプロンプトを使用すると、タグリストのプロンプトよりも画像品質が向上しやすいです。
ネガティブプロンプト欄を空白にしておくと、より良い画像品質を得られることが多いです。
使用前にスペックグリッドをチェックして最適な設定を確認してください。
'strabismus'(斜視)など、特定のネガティブプロンプトを試して左右非対称の目やピクセル化問題に対処してください。
バージョンのハイライト
v1.3
モデルのランダム性に関わる品質を示すため、全ショーケース画像のシード値を「9」に固定し即座に生成しました。
特にこのバージョンではネガティブプロンプトの影響が大きいため、ネガティブプロンプト欄を空白にすることで最高の品質が得られやすいです。
スペックグリッド(438.7 MB): ダウンロード
ご覧の通り、Steps数が増えるほど全サンプラーで使用可能になり、品質も向上します。
下記の通り、私が開発・統合したLoRAの効果で、タグ(単語リスト)ではなく文形式プロンプトの使用が品質向上に直結します。
45のチェックポイントと7つのLoRAを統合しました。その後AlbedoBase v0.4とv0.3を0~5%未満で順次統合し、劣化した統合モデルを刷新しています。
7つのLoRAのうち1つは私の制作によるもので、GPT4-Vを使い174枚の高品質写真のキャプションを分析・注釈しています。このLoRAの統合でかつてない鮮明な画像と優れたプロンプト理解を実現しました。
私の自作LoRAは、クリエイティブレベル以上のKo-fiサポーター専用に購入可能です。今後さらに多くのアップデートを予定しています。価格は10ドルから50ドルの範囲です。
クリエイタースポンサー
もしモデルに価値を感じていただけたら、ぜひサポートを検討してください。いただいた支援はすべてSDXLコミュニティの発展に充てられます。
🙋🏼♂️ 参加する (discord) ㅤ|ㅤ 🛒 購入 ㅤ|ㅤ 🌱 寄付
もしモデルに価値を感じていただけたら、ぜひサポートを検討してください。いただいた支援はすべてSDXLコミュニティの発展に充てられます。
🙋🏼♂️ 参加する (discord) ㅤ|ㅤ 🛒 購入ㅤ |ㅤ 🌱 寄付
AlbedoBase XL (SFW&NSFW)
リファイナーは不要で、VAEが含まれています。
目的
Stable Diffusion XLは35億パラメータ(リファイナー除く)を持ち、SD v1.5の約3.6倍の規模です。これは単なる数値ではなく、性能向上につながる重要な要素だと考えています。
我々のコミュニティの爆発的な貢献により、SD v1.5の総合性能が想像以上に向上していることを実感しており、この性能向上をXL版でも最適に再現するためにAlbedoBase XLモデルの完成に取り組んでいます。
目標は、Civitaiに公開されているすべてのチェックポイントとLoRAの性能を直接テストし、数々のフィルターを通過した最適なリソースのみを統合することです。これによりMidjourneyなどの企業の画像生成AIを超える性能を目指しています。
現時点でAlbedoBase XL v3.1 Largeは約200の選択されたチェックポイントと251のLoRAを統合しています。
更新履歴
v3.1-Large
・V3で使用された再帰スクリプトを用いて最新のSDXLモデル50種以上を統合しました。
スペックグリッド(370.7 MB): ダウンロード


v3-mini
長らくお待たせして申し訳ありません。
個人的な事情があり、新バージョンの制作と共に健康問題にも直面していました。この記事を書いている今もまだ困難と闘っています。
簡単な報告だけでは不十分と感じ、詳細なメッセージの理解をお願いします。
バージョン2.0リリース以降、独学で深層学習に取り組んでいます。正式な学位はなく、プログラミングの適性はわずかで芸術方面のバックグラウンドが中心です。そのため数学や科学基盤は不足し、多大な時間と労力にも関わらず大きなブレイクスルーは難しい現状です。しかし、この自己学習と研究体験はかけがえのない宝です。
最近、重要な突破口になり得るアイデアを思いつきました。2.0から数百の式や手法を見直し、興味深く成功したアルゴリズムを開発しました。モデル統合はSDXL1.0とSD1.5、他厳選モデルを基に「ANIME」「REALISM」「ARTISTIC」「NSFW」「BASE」の5大分類に分け、データセットとしてアルゴリズムに投入。この方法で興味深い結果が出ました。
アルゴリズム開発は難航しましたが、性能テスト段階が最も厳しく、心身ともに大きく衰弱し単独継続不可能と判断。これがこのバージョンリリースに踏み切った理由です。
そして、期待のAlbedoBaseXL V3 Mini版をリリースでき大変嬉しく思います。小規模統合ですが特定領域に限定せず、多様な分野で優れた性能を発揮し、SDXL1.0の新たな基盤モデルとして期待できます。(私の統合アルゴリズムは「線形統合」ではなく、新しいファインチューニングモデルと見なせます。)

このモデルは既存のAlbedoBaseモデルと共に多用途で、すべての以前のバージョンをあらゆる面で超えています。(NSFWコンテンツは極端ではありませんが、v2.1など以前より表現幅が広がっています。専用のNSFW統合モデルも今後リリース予定です。)
一方で、近頃多くの共有モデルが統合や外部商用化禁止のライセンスを採用し始め、優れたモデルを統合に使用できず残念に思っています。
無料ライセンスを提供し、時間と労力をかけた高品質モデルを統合に使わせてくださった開発者の皆様に心から感謝します。
また戻ってきます。
ANIME、REALISM、ARTISTIC、2.5D、3D、NSFWなど広範囲での性能テストを楽しみにしています。
モデル開発者は種を蒔くだけで、花や実を育てるのは最終的にユーザーでありアーティストの皆さんです。
いつもありがとうございます。
私の活動を支援したい方は下記リンクからお願いいたします。現在就労できず生活の先行きが不透明です。
スペックグリッド(380.5 MB): ダウンロード


v2.1
新アルゴリズムと式を用いてv0.1から2.0を再度統合・調整しました。

スペックグリッド(424.5 MB): ダウンロード

v2.0
AlbedoBase XL Preに協力してくださった皆様に感謝します。皆さんなしではリリースはもっと遅れていたでしょう。本当にありがとうございます!

既存のAlbedoBase XLモデルを一つに集約するカスタムスクリプトを書きました。独自の式に従い、すべてのU-NETとCLIPブロックの行列の重みを細かく調整しています。
画像生成でバグが出る(何も生成されない)場合は、CLIP SKIP 2に切り替えるかプロンプトを少し変更してください。CLIPが認識しないプロンプトの組み合わせがあるかもしれません。その場合は単語の順番を変えたり別の単語を使ったり、一番簡単にはCLIP SKIPを変更してみてください。将来的にv1.3のように段階的に解決していきます。
スペックグリッド(403.5 MB): ダウンロード
v1.3
モデルのランダム性に関わる品質を示すため、全ショーケース画像のシード値を「9」に固定し即座に生成しました。
特にこのバージョンではネガティブプロンプトの影響が大きいため、ネガティブプロンプト欄を空白にすることで良好な品質が得られやすいです。
スペックグリッド(438.7 MB): ダウンロード

ご覧の通り、Steps数が増えるほど全サンプラーで使用可能になり、品質も向上します。
下記の通り、私が開発・統合したLoRAの効果で、タグ(単語リスト)ではなく文形式プロンプトの使用が品質向上に直結します。
45のチェックポイントと7つのLoRAを統合しました。その後AlbedoBase v0.4とv0.3を0~5%未満で順次統合し、劣化した統合モデルを刷新しています。
7つのLoRAのうち1つは私の制作によるもので、GPT4-Vを使い174枚の高品質写真のキャプションを分析・注釈しています。このLoRAの統合でかつてない鮮明な画像と優れたプロンプト理解を実現しました。

私の自作LoRAは、クリエイティブレベル以上のKo-fiサポーター専用に購入可能です。
v1.2
最新22チェックポイントを統合。
スペックグリッド(565.6 MB): ダウンロード
v1.1
安定化。
より詳細に。
上級者の方はバージョン1.0を推奨します。適切設定を見つければより鮮やかな作品を出力可能です。
スペックグリッド(349.7 MB): ダウンロード
v1.0
106のLoRAを統合。
19のチェックポイントを統合。
モデルは設定によって異なる結果を生成するため、使用前にスペックグリッドを確認することが重要です。
左右非対称の目やピクセル化の問題を解決するため、特定のネガティブプロンプトはいくつか有効です。スペックグリッドはCPUやGPUにより異なる場合があるため一般的な参考としてご利用ください。いくつかのネガティブプロンプトを試して品質向上を目指してください(例:斜視)。統合LoRA数が増えるに従い全設定を満たすのが困難ですが、1.0の利点として幅広い面で素晴らしい作品を生むことに注目してください。安定版は将来リリースします。
ショーケースや他者の設定検索で有益な値を見つけられます。
いつも通りネガティブプロンプトは空欄が最良の結果をもたらします。
v1.0は大変な仕事だったため、しばらく休みます。モデルを楽しんでいただき、統合された場合はCivitaiに無料で共有してください。皆で改善し続けましょう。
スペックグリッド(479.4 MB): ダウンロード
v0.4
132のLoRAを統合。
4つのチェックポイントを統合。
スペックグリッド: ダウンロード
v0.3
すべてのサンプラーで改善。
リアリティのある写実性を達成。
安定化。
スペックグリッド: ダウンロード
v0.2
明瞭さとディテールの大幅な改善。
手と足の表現が向上。
構図、抽象性、流れ、光と色彩などの美的改善。
v0.1
SDXL1.0モデルを適切にファインチューン後、Civitaiで公開されている40以上の高品質モデルを意図的に統合。
主に最小限のプロンプトトークンで最大品質を追求し、トークン数が多い場合の品質向上は確認していません。(ご自身で試験し結果を共有してください)
通常、現実とアニメの中間地点で最も美しい結果を得られます。
適切なプロンプト使用時にはほぼ表現に限界がありません。(統合に優れた価値を持つ基盤モデルと主張します。ただし現時点はv0.1であることに留意してください)
モデル詳細
モデルタイプ
ベースモデル
モデルバージョン
モデルハッシュ
学習済みワード
作成者
ディスカッション
コメントを残すには log in してください。


