モデル/Pony: People's Works v1-v6 - v3_illu0.1

Pony: People's Works v1-v6 - v3_illu0.1

沢岡美纪子

7/18/2025

2:02:02 PM

| Discussion|

推奨プロンプト

masterpiece,best quality,very aesthetic

1girl, solo, masterpiece, best quality, very aesthetic

推奨ネガティブプロンプト

worst quality,low quality,displeasing

lowres, bad, text, worst quality, low quality, displeasing

推奨パラメータ

samplers

Euler a, DPM++ 2M Karras

steps

25 - 35

cfg

5 - 6

ヒント

V3以降のバージョンでは、「masterpiece」、「best quality」、「very aesthetic」といったポジティブタグを使用してください。

ネガティブプロンプトには「worst quality」、「low quality」、「displeasing」を含めてください。

プロンプトに「hair intakes」を追加することで髪型のアーティファクト問題がある程度緩和される可能性があります。

V2以前のバージョンには特定のトリガーワードがないため、対応モデルに付属する品質タグを使用してください。

Animagine v3.1の品質および美学タグはLoRAで生成されるアートスタイルを変える可能性があることに注意してください。

イントロ. 简介：

style LoCon は、Civitaiサイトから「最多コレクション」と「最多リアクション」のポニー系モデル画像を収集してトレーニングしたものです。

これは、Civitaiで最もいいねとコレクションが多いポニー系モデル画像を使った画風LoConです。

このloraは特定のアーティストの画風や技術を模倣することを目的としていません。コミュニティの感性や画像の視覚的魅力をある程度反映している可能性があります。スタイルは異なるプロンプトによって微妙に変化します。

このloraは特定の画家の画風や技術を再現することを意図していません。ある程度コミュニティの美意識や画像の視覚的な魅力を反映しているかもしれません。異なるプロンプトにより微妙に画風が変わることがあります。

使用方法：

V2以前のバージョンには特定のトリガーワードはありません。対応するモデルに付属する品質タグを使用してください。

V3以降のバージョンでは、以下のタグがトレーニングされています：

V2以前のバージョンに特定のトリガーワードはありません。対応モデルに付属する品質タグをお使いください。

V3以降のバージョンでは、以下のタグでトレーニングを行いました：

ポジティブ：

masterpiece, best quality, very aesthetic

ネガティブ：

worst quality, low quality, displeasing

これらをベースにしてプロンプトを編集してください。

データ生成バージョン情報：

v6:

500枚以上の新規画像を追加し、その一部はFluxから選出しました。品質が低いと判断した古い画像は一部削除しました。

データセットの画像総数は3,000枚を超え、6つのバージョンで20以上のコンセプトが手動で強化・編集されています。

モデルのランクも向上しています。

500枚以上の新画像を追加し、その一部はFluxから選出しました。品質が低いと思われる古い画像は削除しました。

現在、画像総数は3,000枚以上となり、6バージョンのデータセット全体で20以上のコンセプトが手動で強化・編集されています。

モデルのランクも上がりました。

v5.9:

モデルの性能は期待通りではありませんが、トレーニングデータセットの画像そのものは問題ないと考えています。タグを手動で調整し、結果の変化を確認する予定です。

モデルの性能は期待外れですが、訓練データの画像自体は問題ないと思います。タグを手動で修正して効果を試す予定です。

2025/1/3更新：

一部のタグを手動で更新しましたが、それらは明るさや色とは関連がないようです。暫定的にノイズオフセットに関係しているのではないかと推測しています。

一部タグを手動更新しましたが、明暗や色彩とは無関係のようです。暫定的にノイズオフセットが関係していると推測しています。

v5:

データセットは2,154枚に拡大され、約1,000枚のPony画像が主要な訓練対象です。

V-predモデルはEps-predベースのモデルでトレーニングされたLoRAを使用可能ですが、出力品質は著しく低下します。本バージョンは二種類の異なるモデルで別々にトレーニングします。

NoobAIの最近のバージョンでは目立つアーティファクトがありますが、Danbooruの「jpeg artifact」タグは効果的ではありませんでした。この問題に対処するため、約30枚の典型的で目に見える画像をネガティブ例として選別しました。

以下の現象を観察しました：Pony v6 と NoobAI はサイドロック付き髪型生成時に髪根で三角形の持ち上がりを作る傾向があります。Danbooruではこの持ち上がりは「hair intakes」や「curtained hair」とタグ付けされることがありますが、Ponyは全キャラクターに一律この構造を適用します。これがPonyでのキャラ髪型学習における重要な問題の一つです。NoobAIでも同様の問題が見られ、Danbooru外のデータセットにこの特徴が多く存在し正しくタグ付けされていないと推測しています。

データセット中の画像はフィルタリングされ、約3分の2が正しく注釈されています。現在、「hair intakes」をプロンプトに加えることである程度この問題を軽減できますが、根本的な解決策はまだ見つかっていません。

データセットを2154枚に拡充し、主にトレーニング対象とするPony画像は約1000枚です。

V-predモデルはEps-pred基礎のモデルからのLoRAでも使用可能ですが、生成品質は大きく低下します。このバージョンは2種類の異なるモデルで別々にトレーニングされます。

NoobAIの最近のバージョンには明らかなアーティファクトがありますが、Danbooruの“jpeg artifact”タグは効果がありませんでした。このため、約30枚の典型的で視覚的に顕著な画像をネガティブ例として特別に選択しました。

観察された現象として、pony v6とNoobAIは側髪のある髪型を生成する際、髪根で三角形の立ち上がりを生成しがちです。Danbooruではこの立ち上がりを“hair intakes”や“curtained hair”とタグ付けすることがありますが、ponyはすべてのキャラクターにこの構造を適用しています。これがponyでのキャラ髪型トレーニングが意図通りに合わない主な原因です。NoobAIでも類似の事象があり、Danbooru以外のデータセットにこの特徴が多く存在し、正しくタグ付けされていないと推測しています。

データセット内の画像はフィルタリングされ、およそ3分の2が正確に注釈付けされています。現在、“hair intakes”をプロンプトに加えることである程度この現象を軽減できますが、完全な解決策はまだ見つかっていません。

v4:

データセットのタグを部分的に最適化。NoobAI Epsilon-pred v1 に基づきトレーニング。

Pony系モデルはイヤリングやピアスなどの耳飾りの生成傾向が強く、時にキャラの耳の構造を損なうことがあります。関連タグを整理し、軽度の構造問題がある画像はトリミング・手動修正し、修正困難な画像は削除しました。

データセットのタグ付け方法を一部最適化。NoobAI Epsilon-pred v1をベースにトレーニング。

Pony系モデルはイヤリングや耳飾り生成の傾向が強く、時に耳の構造を破壊します。タグ付けを整理し、データセット内の軽微な構造エラー画像をトリミング・手動修正し、修正困難な画像は削除しました。

v3:

データセットを1,429枚に拡大し、ポジティブおよびネガティブタグ付きサンプルを含みます。

そのうち774枚が最も「望ましい」スタイルの画像です。

Illustrious v0.1に基づきトレーニング。

データセットは1429枚に拡大し、正・負の例を含みます。

774枚がターゲットとするスタイルです。

Illustrious v0.1を基にトレーニングしています。

v2:

データセットを374枚に拡大。モデル付属の品質タグと美学タグを使用して生成品質を制御。

訓練データセットは374枚に拡大。モデル付属の品質タグを使って生成品質の安定化を試みています。

v1:

Civitaiから224枚の画像をトレーニングし、393枚を正則化用に使用。

Animagine v3.1 と Pony v6 の2バージョンをトレーニング。

Civitai上の224枚の画像と393枚の正則化データセットをトレーニング。

Animagine v3.1 と Pony v6 の2つのバージョンがあります。

テストバージョン4:

ややアンダーフィットしていますが、動作はしています。Animagine v3.1が持つ品質タグと美学タグ（best quality, masterpiece, very aestheticなど）がこのチェックポイントで生成されるアートスタイルを変えることを発見しました。次のテストバージョンで修正予定です。

ややアンダーフィットしていますが有効です。Animagine v3.1の品質制御や美学のヒント語が生成画風を変えるため、この実験版では品質タグを指定しません。次版で修正予定です。