風が吹く空の下、雪の斜面に立ち、タンポポの種を散らすモノクロ調の巨大なタンポポを見つめる白黒のキリン。

推奨ネガティブプロンプト

big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

推奨パラメータ

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, DPM++ 2M beta, sgm_uniform, DDEIS, normal, simple, beta, dpmpp_3m_sde, dpmpp_3m_sde_gpu

steps

12 - 25

cfg

1.5 - 11

ヒント

DPM++ 2/3M SDEをKarrasまたはExponentialサンプラーと共に使い、25ステップ以上、CFGは5-7前後に設定するとSDXLモデルで最良の結果が得られます。

ステップ数を減らし(例:12)CFGを高め(8-11)にしたDPM++ SDE Karrasを試して、異なるスタイリングを探求しましょう。

Euler Ancestral / Normalサンプラーは詳細が少なめの結果を生成し、ノイズを減らしたいFv6モデルで有効です。

デフォルトのCLIP Skipは2ですが、1にするとプロンプトの遵守度が上がり、3-4はコンセプトへの焦点を改善します。

Fluxモデルには、DPM++ 2M betaやsgm_uniformといったサンプラーが好まれます。

CFG設定は画像品質に大きく影響し、写真では低め(1.5-2.5)がプラスチックのような肌を避け、イラストスタイルではより高めのCFG(3-6以上)が必要です。

不適切なCFGやステップ設定はボケや形崩れを引き起こしやすく、スタイルに応じて調整が必要です。

バージョンのハイライト

Fv4をベースに、私の過去のいくつかのモデルとBigLove_XL2を統合しリアリズムをさらに押し進めました。

その結果、Fv5はこれまでで最もフォトリアリスティックなバージョンで、F4と比べてより正確で繊細な画像を提供しますが、リアリズムを強化するほどスタイライズされた画像、特にイラストの生成能力は次第に低下します。この用途向けに新しいGシリーズバージョンをまもなくリリース予定です :)

設定については、DPM++ 2/3M SDE / KarrasまたはExponentialが常に良い選択で、25ステップ以上、CFGは5-7程度です。ただし、DPM++ SDE / Karrasのステップを減らし(例:12)、CFGを高め(8-11)にするのも試す価値があります。デフォルトのCLIP SKIP 2も良いですが、1または3-4に設定するのも有効です。

クリエイタースポンサー

私のコミュニティへの貢献を楽しんだら、ぜひコーヒーを買ってください:カフェインを多く摂るほど、より多くのモデルを作成できます😅

私のコミュニティへの貢献を楽しんだら、ぜひコーヒーを買ってください:カフェインを多く摂るほど、より多くのモデルを作成できます😅

比較ギャラリーはこちら:Fv6-Fv5およびGv1-Cv6-Fv2のNSFWイラスト比較。

私の実験での最新SOTAモデル:

  • SDXL Baseモデル: Gv4は、リアルかつスタイル付きのNSFWとSFW画像の両方を可能にする最もバランスの取れたモデルです。Fv6より美的ですが、フォトリアリズムはやや劣ります。

  • SDXLフォトリアリスト(SFWおよびNSFW)モデル: Fv6 は、リアルなNSFW画像を含む超リアルな表現に適していますが、多くの場合Gv4のスタイリング能力には及びません。

  • SDXLイラストレーション : Gv4(SFWおよびNSFW)。ただしCv6はNSFW画像を使用しない場合、試す価値があります。

  • Fluxモデル: Flux1-A1

SDXLモデルの画像生成設定

DPM++ 2/3M SDE / Karras または Exponentialが常に良い選択で、25ステップ以上、CFGは5-7前後です。しかし、DPM++ SDE / Karrasでステップ数を減らし(例:12)、CFGを高く(8-11)するのも試す価値があります。さらに、Euler Ancestral / NormalはFv6のようなモデルでノイズを減らすために興味深い低詳細結果を得られます。

デフォルトの CLIP Skipは2で良いですが、1にするとプロンプトの遵守が強まり、3-4にするとより「概念」に焦点を当てた結果が得られることがあります。

Fluxモデルの画像生成設定

私の好みは、サンプラー/スケジューラーにDPM++ 2M / betaまたはsgm_uniform、またはDDEIS / normalで、betaはより鮮明で力強い画像を生みます。もっと抑制された画像にはEuler / simpleまたはbetaが良いでしょう。

CFGは最終画像に大きく影響し、小さな変化にも敏感です。

  • 写真では、プラスチック肌を避けるためにCFGは低め(1.5-2.5)に維持します。

  • 美術やイラストでは媒体により複雑ですが、「ラフ」なスタイル(絵画、水彩など)はCFGを低めの1.5-2.5で保ちます。アニメや漫画スタイルは望むスタイルを出すためにCFGをより高く(3-6以上)設定する必要があります。

画像が乱れたり不鮮明な場合、多くはCFGやステップ設定が合っていないことが原因ですが、CFG/ステップを増やすべきか減らすべきかは判断が難しいことがあります(少なくとも私には😊)。

Fluxは挙動がSDXLとかなり異なり、学ぶことが多く、適応が必要です。

ワークフロー

私の全画像はComfyUI workflowを埋め込んでアップロードしていますが、残念ながらこれはCivitAIの処理とは互換性がなく、多くの場合プロンプトを取得できません。ただし、画像ビューアの「DOWNLOAD」アイコンをクリックすると、ワークフローを含む元のPNG画像をダウンロード可能です。

ほとんどの画像を自分のモデルから直接公開し、ロラ(自分のものやディテールエンハンサー)を少し使う形ですが、最近はより詳細な構図を簡単に作るためControlnetを使うこともあります。この場合、元画像はワークフローに含まれませんが、公開している画像を元に変種を作る用途には使えると思います :)

過去


Eシリーズからはモデルは進化し、時に他のモデルと融合(他の貢献者に感謝!)しますが、主に自分のデータセットを使ったトレーニングで進化しています:控えめなデータセット(現時点で約2000枚)ですが、品質と独自性で補うよう努めています。

Fv1からは、多くの合成画像をこれまでのバージョンを使って作成・遊び、必要に応じてPhotoshopで修正し、多数のオリジナル画像を含むデータセットを目指しています。


このモデルの核心アイデアは、私の個人的な好み(簡単に言えば写真とファンタジーアート)に合致するいくつかの最良モデルを融合することで、多用途なツールを作ることでした。主な目標は:

  1. フォトリアリズム: 人物および物体・自然の驚くほどリアルな画像を生成する能力。

  2. 柔軟性: 高度にスタイライズされた画像を作成し、多様なスタイルやアーティストの組み合わせによる表現が可能にすること。私は旧世代でヨーロッパ出身なので、「スタイル」とは「日本のかわいい系アニメの巨乳」や「DCコミックスのスーパーヒーローや豊満なブロンド美女の漫画風」ではなく、Frank Frazetta、Milo Manara、Boris Vallejo、H.R.Giger、Wojtek Siudmakなどのファンタジーアートの巨匠たちの世界に由来するものです:確かに胸はありますが、スタイルはやや異なります :P

  3. 人体探求に制限を受けたくないため、かなり能力の高いNSFWモデルを作る意図もあります。ただし、利用可能なデータセットの性質上、NSFWはポルノ写真や日本のポルノアニメに強く偏ることが多く、柔軟性に影響します(例えばプロンプトに「sexy」という言葉を使うとスタイルの調整が必要になります)。この点はベースモデルの優先事項ではなく、NSFWモデルで強調しています。

前の画像
ICBINP XL - v4
次の画像
MonsterCoffeeBang! Mix - v1.1 No VAE

モデル詳細

モデルタイプ

Checkpoint

ベースモデル

SDXL 1.0

モデルバージョン

Fv5

モデルハッシュ

17b3e65f07

ディスカッション

コメントを残すには log in してください。

「The Araminta Experiment (SDXL+Flux) - Fv5」による画像

基本モデル画像

nsfw画像

フォトリアリスティック画像

写実的画像

女性画像