Pony: People's Works v1-v6 - v6_noobVv1.0
推奨プロンプト
masterpiece,best quality,very aesthetic
推奨ネガティブプロンプト
worst quality,low quality,displeasing
hair ornament, bowtie, worst quality, low quality, displeasing, hair intakes, old, text
推奨パラメータ
samplers
steps
cfg
ヒント
V2以前のバージョンでは特定のトリガーワードがないため、対応モデルに付属している品質タグを使用してください。
プロンプトに「hair intakes」を追加すると、髪根に三角形のリフトが生じる髪型の問題をある程度軽減できる可能性があります。
最近のNoobAIバージョンにはアーティファクトがあります。この問題に対処するため約30枚の画像がネガティブ例として使用されました。
このモデルは特定のアーティストのスタイルを再現するものではなく、コミュニティの審美的好みを反映している可能性があります。
テスト版4では、Animagine v3.1の品質タグが生成アートスタイルを変えるため、品質タグの使用には注意してください。
導入. 简介:
style LoConは、Civitaiサイトで「いいね数」と「コレクション数」が最も多いポニーベースのモデル画像を収集してトレーニングされています。
これは、Civitaiで最も多くのいいねとコレクションを獲得したポニー系モデル画像を用いてトレーニングした画風LoConです。
このLoRAは特定の画家のスタイルや技法を模倣する意図はありません。コミュニティの好みや画像の視覚的魅力をある程度反映している可能性があります。プロンプトによってスタイルが微妙に変化することがあります。
このloraは特定のアーティストの画風や技術を再現することを意図していません。ある程度コミュニティの審美眼や画像の視覚的な魅力を反映している可能性があります。異なるプロンプトによってスタイルは微妙に変動します。
使用方法:
V2以前のバージョンには特定のトリガーワードはありません。対応するモデル付属の品質タグを使用してください。
V3以降のバージョンでは、以下のタグがトレーニングされています:
V2以前のバージョンには特定のトリガーワードはありません。対応モデルの品質タグを使用してください。
V3及びそれ以降のバージョンでは、以下のタグをトレーニングしています:
ポジティブ:
masterpiece, best quality, very aestheticネガティブ:
worst quality, low quality, displeasingこれらのタグを基にプロンプトを編集できます。
データ生成・データバージョン:
v6:
500枚以上の新画像を追加し、その一部はFluxから選出しました。品質が低いと判断した古い画像は削除しました。
データセットの総画像数は3,000を超え、6バージョンにわたって20以上の概念の手動強化・編集を行いました。
モデルのランクも向上しています。
新たに500枚以上の画像を追加し、その一部はFluxで生成されたものです。品質が低いと判断した古い画像はいくつか削除しました。
現在、画像数は3,000枚を超えており、6つのバージョンで20以上のコンセプトを手動で強化・修正しました。
モデルのランクも向上しました。
v5.9:
モデルの性能は期待通りではありませんが、トレーニングデータセットの画像自体には問題ないと考えています。タグを手動で調整し、結果の変化を確認する予定です。
モデルの性能は期待ほどではありませんが、訓練データセットの画像は問題ないと思います。タグを手動で修正して結果を確認する計画です。
2025/1/3更新:
一部のタグを手動で更新しましたが、明暗や色彩とは関係がないようです。ノイズオフセットに関連している可能性があります。
一部のタグを手動で更新しましたが、それらは明暗や色彩とは関係が薄いようです。ノイズオフセットに関係があると仮定しています。
v5:
データセットは2,154枚に拡張され、そのうち約1,000枚のポニー画像が主な学習対象です。
V-predモデルはEps-predベースモデルでトレーニングしたLoRAを使用できますが、生成品質は大幅に低下します。このバージョンは2種類のモデルで別々にトレーニングされます。
NoobAIの最近のバージョンには目立つアーティファクトがありますが、Danbooruの「jpeg artifact」タグは効果がありませんでした。この問題に対処するため、約30枚の目立つネガティブ例を選定しました。
ある現象として、Pony v6とNoobAIは側頭部の髪根に三角形のリフトを生成しやすいです。Danbooruでは「hair intakes」や「curtained hair」とタグ付けされることもありますが、Ponyはすべてのキャラクターにこの構造を適用します。これはPonyでのキャラクタートレーニング時に髪型が期待通りにならない主な理由の一つです。NoobAIでも類似の現象が確認されています。これはDanbooru以外のデータセットに多く存在し、正しくタグ付けされていなかった特徴だと推測しています。
データセットの画像はフィルタリングされ、約3分の2は正しく注釈されています。現在はプロンプトに「hair intakes」を加えることである程度この問題を軽減できますが、根本的な解決策はまだ見つかっていません。
データセットは2154枚に拡大され、そのうち約1000枚がポニー画像で主要な学習対象です。
V-predモデルはEps-predをベースにトレーニングしたLoRAも利用可能ですが、生成品質は大幅に低下します。このバージョンは二種類の異なるタイプのモデルで別々にトレーニングします。
最近のNoobAIバージョンには明らかなアーティファクトがありますが、Danbooru上の「jpeg artifact」タグは効果がありません。そのため、この問題に対して約30枚の典型的で目に見える画像をネガティブケースとして選びました。
現象として、Pony v6及びNoobAIは側髪のある髪型で、髪根に三角形の立ち上がりが現れます。Danbooruではこれを「hair intakes」や「curtained hair」とタグ付けすることがありますが、Ponyは全てのキャラクターにこの構造を付加します。これがキャラクターの髪型が意図したものと異なる重要な原因の一つです。NoobAIでも似た現象が見られます。これはDanbooru外のデータセットに多く存在し、正しくタグ付けされていなかった特徴と推定されます。
データセット内の画像はフィルターされ、約3分の2は正しく注釈されています。現在、プロンプトに「hair intakes」を加えることである程度この現象を緩和できますが、完全な解決方法はまだありません。
v4:
データセットのタグ付け手法を部分的に最適化しました。NoobAI Epsilon-pred v1 をベースにトレーニング。
ポニーベースのモデルはイヤリングや耳のピアス、その他の耳飾りを生成しやすく、キャラクターの耳の構造を乱すことがあります。関連タグを整理し、軽度の構造問題がある画像の一部をトリミングや手動修正し、修正が困難な画像は除外しました。
データセットのタグ付け方法を一部最適化しました。NoobAI Epsilon-pred v1をベースにトレーニングしています。
Pony系モデルはイヤリングや耳ピアスなど耳のアクセサリーを強く生成しがちで、時にキャラクターの耳の構造を破壊します。関連タグを見直し、データセット内の軽度な構造誤りのある画像をトリミング・手作業で修正し、修正困難な画像は削除しました。
v3:
データセットを1429枚に拡張し、ポジティブ・ネガティブ両方のタグ付き例を含みます。
774枚が最も「望ましい」スタイルです。
Illustrious v0.1 をベースにトレーニング。
データセットは1429枚に拡大し、正と負のタグ例も含まれています。
そのうち774枚は最も「望まれる」スタイルです。
Illustrious v0.1を基にトレーニングしました。
v2:
データセットを374枚に拡張。モデル付属の品質タグや美学タグを使って生成品質をコントロールします。
訓練データセットを374枚に拡大。モデル付属の品質タグを使用して生成品質の安定を試みています。
v1:
Civitaiから224枚の画像を用い、393枚は正則化用画像。
Animagine v3.1 と Pony v6 の2バージョンをトレーニング。
Civitaiから224枚の画像、正則化用393枚の画像でトレーニング。
Animagine v3.1とPony v6の2バージョン。
テスト版4:
少しアンダーフィット気味ですが動作します。Animagine v3.1に付属する品質タグや美学タグ(best quality, masterpiece, very aestheticなど)がこのチェックポイントの生成するアートスタイルを変化させることを発見しました。次のテスト版で修正予定です。
やや不足気味ですが機能します。Animagine v3.1の品質制御ワードと美学タグが生成スタイルを変更するため、この実験版では品質タグを使わない方が良いです。次版で修正します。
モデル詳細
ディスカッション
コメントを残すには log in してください。






