NoobAI-XL (NAI-XL) - V-Pred-1.0バージョン
推奨プロンプト
masterpiece, best quality, newest, absurdres, highres, safe
year 2024, long hair, best quality, masterpiece, absurdres, newest, highres
推奨ネガティブプロンプト
nsfw, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro
推奨パラメータ
samplers
steps
cfg
resolution
other models
推奨ハイレゾパラメータ
upscaler
upscale
steps
denoising strength
ヒント
このモデルはEPSモデルと動作が異なり、Eulerサンプラーのみの使用が必要です。
最適な結果のため推奨CFGは4から5の範囲です。
推奨ステップ数は28から35の間です。
最高の画像品質のために1024x1024前後の解像度プリセットを使用してください。
使用制限に従ってください:有害、悪意ある、商業的利用は禁止です。
プロンプトは「masterpiece, best quality, newest, absurdres, highres, safe」を正の接頭辞として含めてください。
ネガティブプロンプトはnsfw、低品質要素、悪い手、変異した手、望ましくない内容を除外してください。
詳細な使用法とLoRAトレーニングのためにガイドブックとチュートリアルを参照してください。
コミュニティサポートはQQグループおよびDiscordで利用可能です。
バージョンのハイライト
メリークリスマス!NOOBAI XL-VPred 1.0がリリースされました!V予測シリーズは成功のうちに完結し、なんとも興味深い旅路でした。将来また同じことができるかもしれません。これにてLaxhar Labの週次アップデート計画は華やかにフィナーレを迎えます!
ところで、このバージョンの利点は以下の通りです:
1. 高品質データセットでのファインチューニング:解剖学的正確さと構図の合理性を高品質データセットでの細心の調整により最適化しました。
2. 柔軟なスタイル組み合わせの重み付け:複数の画風を組み合わせる際もより柔軟かつ堅牢になりました。
3. 品質ワードの活用強化:品質ワードの効果がより顕著になりました。
4. スタンダード版とS版の機能の融合:色彩は鮮やかでありながら過剰露出しにくく、両方の良い面を兼ね備えています。
使用推奨および今後の作業:
1. 動的CFGプラグイン使用推奨:V予測モデルでの画像の過飽和やグレー化を防ぐため、動的CFG&CFGリスケールプラグインの使用を推奨します。最適設定は0.2を参照してください。
2. サンプリング方式の選択:NOOBAI XL-VPred 1.0はほとんどのサンプリング方式をサポートしますが、V予測はKarrasシリーズのサンプリングに非対応です。より安定した結果のためにEulerおよびDDIMサンプリングの使用を推奨します。
3. 継続的なアップデートとサポート:VPred 1.0は今後もControlNetモデルやその他プラグインの更新が続きます。主要モデルも大幅改善時に不定期更新します(NAI4のDIT効果を検証し学習予定)のでご期待ください!
最後に、私の個人的なおすすめを共有します:最近プレイしたゲーム「MiSide」は本当に素晴らしい作品です。ソロゲームでこれほど感動したのは久しぶりで、ぜひおすすめします。皆さんにメリークリスマスを。1年の努力の後は休息の時です。またこの可能性の世界でお会いしましょうミ(・・)ミ
クリエイタースポンサー
スポンサー:Lanyun Cloud、Civitai & Seaart
モデル紹介
この画像生成モデルはLaxhar/noobai-XL_v1.0をベースに、Danbooru及びe621の全データセットをネイティブタグと自然言語キャプションで活用しています。
eps-predictionとは異なるv-predictionモデルとして実装されており、特定のパラメーター設定が必要です。詳細は以下の章で説明します。
コーディング作業においてはチームメイトのeugeに特別感謝し、有益なコミュニティメンバーからの技術支援にも感謝しています。
⚠️ 重要なお知らせ ⚠️
本モデルはEPSモデルとは動作が異なります!
必ずガイドをよくお読みください!
モデル詳細
開発元: Laxhar Lab
モデルタイプ: 拡散ベースのテキスト画像生成モデル
ファインチューニング元: Laxhar/noobai-XL_v1.0
スポンサー:
共同テスト:
モデルの使い方
NoobAI XLのガイドブック:
英語版:
https://civitai.com/articles/8962
中国語版:
https://fcnk27d6mpa5.feishu.cn/wiki/S8Z4wy7fSiePNRksiBXcyrUenOh
NoobAI XLおすすめLoRaリスト:
https://fcnk27d6mpa5.feishu.cn/wiki/IBVGwvVGViazLYkMgVEcvbklnge
方法I: reForge
(reForgeをインストールしていない場合)リポジトリの説明に従ってreForgeをインストールします。
WebUIを起動し、普段通りにモデルを使います!
方法II: ComfyUI
ノードでのサンプル
方法III: WebUI
devブランチは安定していないため、バグが含まれる可能性があります。
1.(WebUIをインストールしていない場合)リポジトリの指示に従いWebUIをインストールしてください。シンプルに
2. dev ブランチに切り替え:
git switch dev
3. 最新の更新をプル:
git pull
4. WebUIを起動し、普段通りにモデルを使用します!
方法IV: Diffusers
import torch
from diffusers import StableDiffusionXLPipeline
from diffusers import EulerDiscreteScheduler
ckpt_path = "/path/to/model.safetensors"
pipe = StableDiffusionXLPipeline.from_single_file(
ckpt_path,
use_safetensors=True,
torch_dtype=torch.float16,
)
scheduler_args = {"prediction_type": "v_prediction", "rescale_betas_zero_snr": True}
pipe.scheduler = EulerDiscreteScheduler.from_config(pipe.scheduler.config, **scheduler_args)
pipe.enable_xformers_memory_efficient_attention()
pipe = pipe.to("cuda")
prompt = """masterpiece, best quality,artist:john_kafka,artist:nixeu,artist:quasarcake, chromatic aberration, film grain, horror \(theme\), limited palette, x-shaped pupils, high contrast, color contrast, cold colors, arlecchino \(genshin impact\), black theme, gritty, graphite \(medium\)"""
negative_prompt = "nsfw, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro"
image = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
width=832,
height=1216,
num_inference_steps=28,
guidance_scale=5,
generator=torch.Generator().manual_seed(42),
).images[0]
image.save("output.png")
注意: Gitがインストールされており、環境が正しく設定されていることを必ず確認してください。
推奨設定
パラメーター
CFG:4〜5
ステップ数:28〜35
サンプリング方式:Euler(⚠️ 他のサンプラーは正常に動作しません)
解像度:合計エリアは約1024x1024。おすすめは768x1344、832x1216、896x1152、1024x1024、1152x896、1216x832、1344x768のいずれか
プロンプト
プロンプトの接頭辞:
masterpiece, best quality, newest, absurdres, highres, safe,
ネガティブプロンプト:
nsfw, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro
使用ガイドライン
キャプション
<1girl/1boy/1other/...>, <キャラクター>, <シリーズ>, <アーティスト>, <特殊タグ>, <一般タグ>, <その他のタグ>
品質タグ
品質タグの評価は以下のプロセスで画像人気を評価しています:
各種データソースと評価に基づく正規化
日付の新しさに応じた時間減衰係数の適用
この処理により全データセット内で画像のランキング付け
目的は近年のユーザー好みを効率的に反映させる品質タグの確立です。
パーセンタイル範囲と品質タグ 95%以上:masterpiece、85%以上95%以下:best quality、60%以上85%以下:good quality、30%以上60%以下:normal quality、30%以下:worst quality
美的タグ
タグ説明非常にawa:waifu-scorerによる美的スコア上位5%の画像、最悪の美的評価:waifu-scorerおよびaesthetic-shadow-v2の下位5%の画像……
日付タグ
日付タグは年タグと期間タグの2種類があります。年タグはyear xxxx形式を使用し、例:year 2021。期間タグについては以下の表を参照してください:
年範囲期間タグ
2005-2010:old
2011-2014:early
2014-2017:mid
2018-2020:recent
2021-2024:newest
データセット
訓練日時点までの最新のDanbooru画像(約2024-10-23以前)
Hugging Face上のE621画像 e621-2024-webp-4Mpixel データセット
コミュニケーション
QQグループ:
657327419
875042008
914818692
635772191
870086562
Discord: Laxhar Dream Lab SDXL NOOB
v-pred SDXLモデル上でのLoRAトレーニング方法
sd-scriptsベースのLoRAトレーナー向けのチュートリアルです。
記事リンク: https://civitai.com/articles/8723
ユーティリティツール
Laxhar LabはNoobXL用の専用ControlNetモデルをトレーニングしており、段階的にモデルをリリース中です。これまでに通常、depth、cannyがリリースされています。
モデルリンク: https://civitai.com/models/929685
モデルライセンス
本モデルのライセンスはhttps://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0 fair-ai-public-license-1.0-sdを継承し、以下の条項を追加しています。本モデルおよびその派生バリアントの使用は全てこのライセンスに従うものとします。
I. 使用制限
嫌がらせ、脅迫、誤情報拡散などの有害、悪意、違法行為での使用禁止。
非倫理的または攻撃的な内容の生成禁止。
利用者の法域における法令違反の禁止。
II. 商業利用禁止
モデル、派生モデル、モデル生成物の一切の商業化(収益化や商用利用を含む)を禁止します。
III. オープンソースコミュニティ
活発なオープンソースコミュニティを育成するため、ユーザーは以下の条件を遵守する必要があります:
派生モデル、マージモデル、LoRA、及びそれらに基づく製品のオープンソース化。
合成式、プロンプト、ワークフロー等の作業詳細の共有。
fair-ai-public-licenseに従い派生作品をオープンソースで維持すること。
IV. 免責事項
生成モデルは予期せぬ有害な出力を生じることがあります。使用者は利用に伴う全てのリスクと結果を負うものとします。
参加者および貢献者
参加者
L_A_X: Civitai | Liblib.art | Huggingface
li_li: Civitai | Huggingface
nebulae: Civitai | Huggingface
Chenkin: Civitai | Huggingface
Euge: Civitai | Huggingface | Github
貢献者
Narugo1992: narugo1992氏及びdeepghsチームの各種トレーニングセットや画像処理ツール、モデルのオープンソース化に感謝します。
Onommai: OnommAI氏の強力なベースモデルのオープンソース化に感謝します。
V-Prediction: 以下の方々の詳細な指示と実験に感謝します。
adsfssdf
madmanfourohfour
コミュニティ: aria1th261、neggles、sdtana、chewing、irldoggo、reoe、kblueleaf、Yidhar、ageless、白玲可、Creeper、KaerMorh、吟遊詩人、SeASnAkE、zwh20081、Wenaka~喵、稀里哗啦、幸运二副、昨日の約、445、EBIX、Sopp、Y_X、Minthybasis、Rakosz、孤辰NULL、汤人烂、沅月弯刀、David、年糕特工队、