長い赤い髪を持ち、黒いコルセットと大きな魔女帽をかぶり、夜空の下で木製の杖を持つ全身ファンタジー魔術師
夜に青く光る蝶と光の粒に囲まれ、緑のドレスを着た尖った耳と透明な緑の翼を持つ金髪の妖精。
短い茶色の髪と茶色の目を持ち、グレーのタンクトップを着て、額に手を置いて白い背景の前でポーズをとる稲葉美雪の肖像。
黒い背景を背に、黒いコルセットとレースの襟を着け、青い羽根で飾られた落ち着いた白髪の茶色い目の女性の肖像画。
編み込みヘアスタイルの白髪の少女のフォトリアリスティックな肖像。黒いコルセットを着て胸元が見え、輝く青い羽根と光の粒子に囲まれて黒い背景に映えている。

推奨プロンプト

score_9, score_8_up, score_7_up, <lora:vanillawareStyle:1>, 1girl, solo, looking at viewer, full body, light particles

推奨ネガティブプロンプト

thumbnail,3d

3d, bad anatomy, watermark

推奨パラメータ

samplers

Euler a

steps

20

cfg

7

clip skip

2

resolution

768x1344

vae

sdxl_vae.safetensors

other models

vanillawareStyle (272b477439ee), ponyDiffusionFor_v10 (7ad8ce957e)

推奨ハイレゾパラメータ

upscaler

4xUltrasharp_4xUltrasharpV10

upscale

1.2 - 2

denoising strength

0.2

ヒント

プロンプトは[キャラクター特性]+[スタイル]+[表現]+[服装]+[カメラとアクション]+[背景]の順で作成し、必要に応じて修正してください。

画像がぼやけている場合は、ネガティブプロンプトに「thumbnail」を追加し、その重みを上げて鮮明さを改善してください。

ネガティブプロンプトに「3d」を追加すると結果が向上する場合があります。

「realistic」や「realism」などのタグを追加するとキャラクターの特徴が強調されます。

推奨重みは1.0から0.6の間で調整し、望むキャラクターの外見に合わせてください。

データセットの品質を向上させ、慎重なタグ付けを行うことでトレーニング効果を高めます。

低品質な画像タグはネガティブプロンプトに入れて、生成時の影響を減らしてください。

このモデルのトレーニングおよび生成される画像は、学習目的のみです。

私は何もしていません。ただのポーターです。

このモデルはどちらかというとキャラクターパックのようなもので、その副産物としてスタイルをもたらします。

30時間以上の繰り返し試行を経てほぼ諦めかけましたが、最終的にはよりバランスの取れた効果を達成できました。最も重要なのは、私のトレーニング仮説が検証できたことです。将来的にはこれらの経験を記事にまとめるかもしれません。

しかし、手の不具合は依然として存在します。

トリガーワード: vanillastyle

上記の画像からプロンプトの例を確認できます。

前バージョンのモデルのプロンプトもほとんど機能しました。

私のプロンプトは基本的に[キャラクター特性]+[スタイル]+[表現]+[服装]+[カメラとアクション]+[背景]の順で構成され、必要に応じて削除や修正が可能です。

特にぼやけた状況がある場合は、ネガティブプロンプトに"thumbnail"を追加し、その重量を増やして画像が鮮明になるまで調整してください。

ネガティブプロンプトに'3d'を追加するとより良い結果が得られる場合があり、一方で'realistic'や'realism'のタグを追加するとキャラクターの特徴が強調されます。

推奨重み: 1.0~0.6キャラクターの見た目が満足いくまで調整してください。

アップスケール推奨値は1.2~2.0程度、ノイズ除去強度は0.2です。

データセットは主に神谷誠の作品に焦点を当てています。

20240907v0.2

このバージョンではタグ付けを増やし、その他の画像からはタグを削除してトリガーワードのみ残し、慎重なタグ付けとの衝突を防ぎました。(この方法が正しいとは限りません。)

トレーニング過程で、データセット内の画像がプロンプトで正確に表現されていないケースが多く見られました。様々なタグを試して再トレーニングしましたが結果は変わりませんでした。これらの画像の繰り返しもあまり多くなく、連続性に欠けています。

最終的に、ある記事で特定のキャラクターのトレーニング回数を増やすことでモデルがこれらの画像を十分に学習しないことを防ぐという方法を読みました。

そこで、データセット内に単独存在する画像はすべてサブフォルダに移し、トレーニング回数を2に設定し、すでに十分学習された画像はそのままにしました。

しかし、これら断続的な画像には品質問題が多く、今のところ修正していないため、トレーニング回数を増やすことが全体のスタイルに一定の影響を与えています。

次バージョンの改善では、最も根本的な方法はデータセットの品質向上とキャプショニング技術の活用、品質がやや低い画像に同じタグを付けてからモデル実行時にネガティブプロンプトに入れることです。

20240715v0.1

このモデルはv0.1とみなされ、通常の使用はあまり簡単ではありません。より良い結果のためにデータセット内の画像の詳細なタグ付けが最善だと考えています。将来的にはゆっくりとこのモデルのトレーニングを完了するかもしれません。

このバージョンの性能はあまり良くなく、生成される画像はしばしば混沌としたものになることがあります。

100枚以上の画像をデータセットとして収集しましたが、手動でのタグ付けはまだ多すぎます。最初はwd1.4で全画像のタグ付けをしましたが、タグ付けの品質は良くありません(使い方が不十分だったかもしれません。皆様からの提案を歓迎します)。

迅速な結果確認のため、このデータセットでは個人的に好むいくつかの画像のみ手動でタグ付けを行い、そのためモデルの出力効果はこれらの画像に対して良くなります。

前の画像
Breakdancing PONY XL(コンセプト)- v1.0
次の画像
Goose Ambush - Illustrious - v1.0

モデル詳細

モデルタイプ

LORA

ベースモデル

Pony

モデルバージョン

v0.1

モデルハッシュ

33ee0b8061

作成者

ディスカッション

コメントを残すには log in してください。

モデルコレクション - Vanillaware Style PonyXL

「Vanillaware Style PonyXL - v0.1」による画像

スタイル画像

Vanillaware画像