The Araminta Experiment (SDXL+Flux) - Fv3
推奨プロンプト
(photography by Jimmy Nelson and Sally Mann:1.0), (anus gaping), eye contact, (petite-bodied African) girl with her ass spread apart, hairy asshole, rear view, beautiful out of focus background
推奨ネガティブプロンプト
child, big boobs, ((watermark)), ((make-up)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb
推奨パラメータ
samplers
steps
cfg
ヒント
SDXLモデルでは、25ステップ以上かつCFGを5-7程度にし、DPM++ 2/3M SDE KarrasまたはExponentialのサンプラーを使用してください。
DPM++ SDE Karrasをステップ数少なめ(例:12)かつCFG高め(8-11)で試してみてください。
Euler Ancestral / Normalサンプラーは詳細が減る結果となる場合があり、Fv6のようにノイズを減らしたい場合に有用です。
CLIP Skipのデフォルトは2です;1はプロンプトへの忠実度を高め、3-4は時にコンセプトのフォーカスを改善します。
FluxモデルのCFGは敏感です;写真ではCFGを低く(1.5-2.5)保ち、プラスチック肌を避けてください。
FluxのラフスタイルではCFGを低く(1.5-2.5)保ち、アニメやコミックスタイルでは高め(3-6以上)を推奨します。
バージョンのハイライト
よりリアルなNSFW表現を改善したFバージョン:コンセプト理解の向上と肌質感の改善(比較画像参照)
Fv2をベースにbatchXLPHOTOREAL_v1のマージおよびいくつかの個人トレーニングLoraを加えています。
クリエイタースポンサー
私のコミュニティへの貢献を気に入っていただけましたら、ぜひコーヒーをご馳走してください:カフェインを多く摂るほど、より多くのモデルが作成できます😅
私のコミュニティへの貢献を気に入っていただけましたら、ぜひコーヒーをご馳走してください:カフェインを多く摂るほど、より多くのモデルが作成できます😅
比較ギャラリーはこちら:Fv6-Fv5 とNSFWイラスト比較はGv1-Cv6-Fv2。

私の実験での現在の最先端モデル:
SDXL ベースモデル: Gv4 は、リアルとスタイルのあるNSFWおよびSFW画像の両方に対応できる最もバランスの取れたモデルです。Fv6より美的感覚に優れていますがフォトリアリズムはやや劣ります。
SDXL フォトリアリスト(SFWおよびNSFW)モデル: Fv6 は、リアルなNSFW画像を含むハイパーリアリズム追求型ですが、主にGv4ほどのスタイリング能力はありません。
SDXL イラストレーション: Gv4(SFWおよびNSFW)。ただし、NSFWに興味がない場合はCv6も試す価値があります。
Fluxモデル: Flux1-A1
SDXLモデルの画像生成設定
DPM++ 2/3M SDE / Karras または Exponential は、25ステップ以上かつCFGを5-7にするといつでも良い結果が期待できます。しかし、DPM++ SDE / Karras のステップ数を少なめ(例:12)でCFGを高め(8-11)にするのも試す価値があります。さらに、Euler Ancestral / Normal は、より詳細の少ない結果が得られ、Fv6のようなモデルでノイズ感を抑えたいときに興味深いです。
デフォルトの CLIP Skip は2でこれも良い設定ですが、1や3-4も試す価値があります。1はプロンプトへの忠実度を高め、3-4は時にデフォルトよりもコンセプト重視の良い結果をもたらします。
Fluxモデルの画像生成設定
私の好みの設定は、サンプラー/スケジューラーにDPM++ 2M / beta または sgm_uniform、もしくは DDEIS / normal を用います。betaはより力強く大胆な画像を生成します。より繊細な画像では、Euler / simple または beta が良い選択となります。
CFGは最終画像に大きな影響を与え、小さな変化にも非常に敏感です。
写真の場合は、プラスチックのような肌質感を避けるためにCFGは低め(1.5-2.5)に保つべきです。
美術やイラストレーションではメディアによって異なります。「ラフ」なスタイル(絵画、水彩など)ではCFGは低めの1.5-2.5範囲が推奨されますが、アニメやコミックスタイルでは希望のスタイルを得るためにCFGを高め(3-6以上)に設定することが多いです。
画像が乱れたりぼやけたりする場合、CFGやステップ数が画像に適していないことが多いですが、CFGやステップ数を増減すべきか判断するのは(少なくとも私には)簡単ではありません😊。
Fluxの挙動はSDXLとはかなり異なり学ぶべきことが多く、適応が必要です。
ワークフロー
私のすべての画像はComfyUIワークフローを埋め込み付きでアップロードしていますが、残念ながらCivitAIの処理とは互換性がなく、多くの場合プロンプトは取得できません。ただし、画像ビューアの「DOWNLOAD」アイコンをクリックするとワークフローを含む元のPNG画像をダウンロード可能です。
主に私のモデル直からの画像を公開していますが、時にはLora(自作または詳細強化用)を少し使うこともあります。また、より詳細な構図を容易に得るためにControlnetを使うこともあります。この場合、ワークフローにはソース画像は含まれませんが、私が公開した画像を元にバリエーション作成に使うことは可能です :)
過去
Eシリーズから、モデルは時に他のモデルとの統合(他の貢献者の方に感謝!)によって進化しますが、主に私自身のデータセットでのトレーニングにより発展しています。控えめなデータセット(現在約2000枚)ですが、質と独自性で補おうとしています。
Fv1以降、多くの合成画像を以前のバージョンを使って作成し、プロンプトで調整、必要に応じてPhotoshopでレタッチして独自性の高いデータセットを整えています。
このモデルの根本的なアイデアは、私の個人的趣向(写真とファンタジーアートを簡単に言えば)に合う最高の既存モデルのいくつかを統合し、汎用的なツールを作ることでした。主な目標は:
フォトリアリズム: 人物と物体や自然の驚くほどリアルな画像を生成する能力。
柔軟性: 多様なスタイルやアーティストの組み合わせを通じた芸術的表現が可能な高度にスタイライズされた画像を作成する能力。私は年長世代でヨーロッパ出身なので、「スタイル」は「日本のかわいいアニメの爆乳」や「DCコミックスのスーパーヒーローと豊満な金髪美女のカートゥーン」という意味ではなく、むしろFrank Frazetta、Milo Manara、Boris Vallejo、H.R.Giger、Wojtek Siudmakなどのファンタジーアートの大家の世界観に近いものです:もちろん胸はありますが、スタイルは多少異なります :P
人体の探求に制限を受けたくないので、割と能力の高いNSFWモデルも目指しています。しかし、利用可能なデータセットの性質上、NSFWはポルノ写真や日本のポルノアニメに強く偏ることが多く、柔軟性に影響します(典型的にはプロンプトに「セクシー」という言葉を使うとスタイルの重み付けが必要になる)。この点は基本モデルでは優先されませんが、NSFWモデルで強化されています。
モデル詳細
ディスカッション
コメントを残すには log in してください。