Vanillaware Style PonyXL - v0.1
推奨プロンプト
score_9, score_8_up, score_7_up, <lora:vanillawareStyle:1>, 1girl, solo, looking at viewer, full body, light particles
推奨ネガティブプロンプト
thumbnail,3d
3d, bad anatomy, watermark
推奨パラメータ
samplers
steps
cfg
clip skip
resolution
vae
other models
推奨ハイレゾパラメータ
upscaler
upscale
denoising strength
ヒント
プロンプトは[キャラクター特性]+[スタイル]+[表現]+[服装]+[カメラとアクション]+[背景]の順で作成し、必要に応じて修正してください。
画像がぼやけている場合は、ネガティブプロンプトに「thumbnail」を追加し、その重みを上げて鮮明さを改善してください。
ネガティブプロンプトに「3d」を追加すると結果が向上する場合があります。
「realistic」や「realism」などのタグを追加するとキャラクターの特徴が強調されます。
推奨重みは1.0から0.6の間で調整し、望むキャラクターの外見に合わせてください。
データセットの品質を向上させ、慎重なタグ付けを行うことでトレーニング効果を高めます。
低品質な画像タグはネガティブプロンプトに入れて、生成時の影響を減らしてください。
このモデルのトレーニングおよび生成される画像は、学習目的のみです。
私は何もしていません。ただのポーターです。
このモデルはどちらかというとキャラクターパックのようなもので、その副産物としてスタイルをもたらします。
30時間以上の繰り返し試行を経てほぼ諦めかけましたが、最終的にはよりバランスの取れた効果を達成できました。最も重要なのは、私のトレーニング仮説が検証できたことです。将来的にはこれらの経験を記事にまとめるかもしれません。
しかし、手の不具合は依然として存在します。
トリガーワード: vanillastyle
上記の画像からプロンプトの例を確認できます。
前バージョンのモデルのプロンプトもほとんど機能しました。
私のプロンプトは基本的に[キャラクター特性]+[スタイル]+[表現]+[服装]+[カメラとアクション]+[背景]の順で構成され、必要に応じて削除や修正が可能です。
特にぼやけた状況がある場合は、ネガティブプロンプトに"thumbnail"を追加し、その重量を増やして画像が鮮明になるまで調整してください。
ネガティブプロンプトに'3d'を追加するとより良い結果が得られる場合があり、一方で'realistic'や'realism'のタグを追加するとキャラクターの特徴が強調されます。
推奨重み: 1.0~0.6、キャラクターの見た目が満足いくまで調整してください。
アップスケール推奨値は1.2~2.0程度、ノイズ除去強度は0.2です。
データセットは主に神谷誠の作品に焦点を当てています。
20240907v0.2
このバージョンではタグ付けを増やし、その他の画像からはタグを削除してトリガーワードのみ残し、慎重なタグ付けとの衝突を防ぎました。(この方法が正しいとは限りません。)
トレーニング過程で、データセット内の画像がプロンプトで正確に表現されていないケースが多く見られました。様々なタグを試して再トレーニングしましたが結果は変わりませんでした。これらの画像の繰り返しもあまり多くなく、連続性に欠けています。
最終的に、ある記事で特定のキャラクターのトレーニング回数を増やすことでモデルがこれらの画像を十分に学習しないことを防ぐという方法を読みました。
そこで、データセット内に単独存在する画像はすべてサブフォルダに移し、トレーニング回数を2に設定し、すでに十分学習された画像はそのままにしました。
しかし、これら断続的な画像には品質問題が多く、今のところ修正していないため、トレーニング回数を増やすことが全体のスタイルに一定の影響を与えています。
次バージョンの改善では、最も根本的な方法はデータセットの品質向上とキャプショニング技術の活用、品質がやや低い画像に同じタグを付けてからモデル実行時にネガティブプロンプトに入れることです。
20240715v0.1
このモデルはv0.1とみなされ、通常の使用はあまり簡単ではありません。より良い結果のためにデータセット内の画像の詳細なタグ付けが最善だと考えています。将来的にはゆっくりとこのモデルのトレーニングを完了するかもしれません。
このバージョンの性能はあまり良くなく、生成される画像はしばしば混沌としたものになることがあります。
100枚以上の画像をデータセットとして収集しましたが、手動でのタグ付けはまだ多すぎます。最初はwd1.4で全画像のタグ付けをしましたが、タグ付けの品質は良くありません(使い方が不十分だったかもしれません。皆様からの提案を歓迎します)。
迅速な結果確認のため、このデータセットでは個人的に好むいくつかの画像のみ手動でタグ付けを行い、そのためモデルの出力効果はこれらの画像に対して良くなります。





