モデル/Pony: People's Works v1-v6 - v5_noobVv0.65S

Pony: People's Works v1-v6 - v5_noobVv0.65S

|
8/8/2025
|
1:19:03 PM
| Discussion|
0
かわいい赤ちゃんパンダが仰向けに寝そべり、頭に赤い鳥が乗ったままスイカの一切れを食べている。周囲には竹の柵、花、池がある。
カラフルな風船に支えられて空に喜んで浮かぶオレンジのタビー猫、背景には輝く夕日と雲が広がっています。
複雑な虹色の角を持ち、光沢のあるホログラフィックな衣装を着た輝く女性像が、暗い背景に対して体積照明で照らされている。
発光するバーチャルヘルメットとネオンの角を備えた未来的な鎧を着たサイバーニンジャが、体積光のあるサイバーパンク神社内でしゃがんでいる

推奨プロンプト

masterpiece,best quality,very aesthetic

1girl, dark hair, solo, long hair, looking at viewer, masterpiece, tohno akiha, holding rose, best quality, tsukihime, blue eyes, very aesthetic, white hairband, white collared shirt, white shirt, brown vest, red bow, lips, pout, blush, upper body, hand on own hip, looking away, indoors, backlighting, night, (dark), city

推奨ネガティブプロンプト

worst quality,low quality,displeasing

worst quality, low quality, displeasing, old, early

推奨パラメータ

samplers

Euler a, Euler

steps

25

cfg

4

ヒント

V2以前のバージョンは特定のトリガーワードがないため、対応モデルの品質タグを使用してください。

V3以降は付属のポジティブおよびネガティブプロンプトタグで生成品質を制御してください。

プロンプトに「hair intakes」を追加すると望ましくない髪型のアーティファクトが軽減されるかもしれませんが、完全な解決策はまだ見つかっていません。

NoobAIモデルはJPEGアーティファクトが出ることがあり、この問題対策として約30枚の典型的な負面例が選ばれています。

Animagine v3.1由来の品質および美学タグは、このLoRAで生成されるアートスタイルを変える場合があるため、特定のテストバージョンでの使用は避けてください。

イントロダクション:

style LoConは、Civitaiサイトから収集された 「最も多くのコレクション」 と 「最も多くのリアクション」 を持つponyベースのモデル画像で訓練されています。

これはCivitai上で最も多くのいいねとコレクションを持つpony系モデル画像を用いて訓練された画風LoConです。

このLoRAは特定のアーティストの画風や技法を模倣することを目的としていません。ある程度、コミュニティの嗜好画像の視覚的魅力を反映している可能性があります。異なるプロンプトによりスタイルは微妙に変化することがあります。

このLoRAは特定のアーティスト画風や描画技術の再現を目指していません。ある程度、コミュニティの審美眼画像の視覚的魅力を反映している可能性があります。異なるプロンプトにより微妙に画風が変わることがあります。

使用方法:

V2以前のバージョンには特定のトリガーワードがありません。対応するモデルに付属の品質タグを使用してください。

V3以降のバージョンでは、以下のタグが訓練されています:

V2以前のバージョンには特定のトリガーワードはありません。対応モデル付属の品質タグを使用してください。

V3及びそれ以降のバージョンでは、以下のタグが訓練されています:

positive:

masterpiece, best quality, very aesthetic

negative:

worst quality, low quality, displeasing

この基礎の上でプロンプトを編集可能です。

データ生成・バージョン情報:

v6:

500枚以上の新しい画像を追加し、そのうちの一部はFluxから選択しました。品質が低いと判断した古い画像は削除しました。

データセットの合計画像数は現在3,000枚を超え、6つのバージョンにわたり20以上の概念が手動で強化・編集されています。

モデルのランクも上昇しています。

500枚以上の新しい画像を追加し、その一部はfluxによる生成画像から選びました。品質が低いと考えた古い画像は削除しています。

総画像数は3,000枚を超え、6バージョンにわたって20以上の概念が手動で強化・修正されています。

モデルのランクも上昇しました。

v5.9:

モデルのパフォーマンスは期待通りではありませんが、トレーニングデータの画像は問題ないと考えています。タグを手動で調整し、結果がどう変わるか見てみる予定です。

モデルの効果は期待より低いですが、訓練セットの画像自体は問題ないと思います。タグを手動で修正して効果を確認する予定です。

2025/1/3更新:

いくつかのタグを手動で更新しましたが、明暗や色彩には関連がなさそうです。ノイズオフセットに関係しているのではと暫定的に推測しています。

一部タグを手動で更新しましたが、明るさや色彩とは無関係のようです。暫定的にノイズオフセットが関連していると推測しています。

v5:

データセットは2,154枚に拡張され、そのうち約1,000枚がPony画像で主要な訓練対象となっています。

V-predモデルはEps-predベースのモデルで訓練されたLoRAを使用可能ですが、生成品質は大幅に低下します。このバージョンは異なる2種類のモデルで別々に訓練されます。

最近のNoobAIのバージョンでは目立ったアーティファクトが見られますが、Danbooru上の「jpeg artifact」タグは効果的ではありません。そのため、約30枚の典型的で目に見える負面例を選択しました。

観察された現象として、Pony v6とNoobAIは側面の髪がある髪型で髪根に三角形の持ち上がりを生成する傾向があります。Danbooruではこれが「hair intakes」や「curtained hair」とタグ付けされることがありますが、Ponyはこの構造をすべてのキャラクターに適用します。これがPonyの髪型訓練において意図したデザインとズレが生じる重要な理由です。NoobAIでも類似の問題が観察されています。推測ではDanbooru以外のデータセットにこの特徴が多く存在し、正しくタグ付けされていなかった可能性があります。

データセット内の画像はフィルタリングされ、約3分の2が正しく注釈付けされています。現在はプロンプトに「hair intakes」を追加するとある程度この問題を緩和できますが、完全な解決策は見つかっていません。

データセットを2154枚に拡充し、そのうち約1000枚はPony画像で主要な訓練対象です。

V-predモデルはEps-predベースのモデルで訓練したLoRAを使えますが、品質は大幅に低下します。このバージョンは2種類の異なるモデルで別々に訓練されます。

NoobAI最近のバージョンには明白なノイズが見られますが、Danbooruの“jpeg artifact”タグは効果を示しません。そこで約30枚の典型的で目に見えるネガティブ画像を選びました。

観察された現象として、pony v6とnoobAIは側髪がある髪型で根元に三角形の持ち上がりを生成しがちです。Danbooruではこれが“hair intakes”や“curtained hair”とタグされることがありますが、ponyはそれを全キャラクターに適用しています。これがponyの髪型訓練が意図した通りにいかない大きな理由です。noobでも似た現象があります。推測ですが、danbooru外の訓練セットにこの特徴が多く含まれており、正しくタグ付けされていなかったと思われます。

データセットの画像はフィルタリングされ、約3分の2は正しく注釈付けられています。現在、プロンプトに「hair intakes」を入れることである程度この問題が緩和されますが、根本的解決策はまだ見つかっていません。

v4:

データセットのタグ付けを一部最適化しました。NoobAI Epsilon-pred v1を基に訓練。

Ponyベースモデルはイヤリングや耳のピアスなどのアクセサリーを強く生成する傾向があり、時にキャラクターの耳の構造を破壊します。関連タグを整理し、構造に軽微な問題のある画像をトリミングおよび手動修正し、修正が難しい画像は削除しました。

データセットの注釈方法を部分的に最適化しました。NoobAI Epsilon-pred v1をベースに訓練。

Pony系モデルはイヤリング、耳飾りなどを強く生成し、時に耳の構造を壊す傾向があります。関連タグを整理し、構造に軽微な誤りがある画像をトリミング・手動修正し、修正困難な画像は除去しました。

v3:

データセットは1,429枚に拡大され、ポジティブタグ・ネガティブタグの例を含みます。

そのうち774枚は最も「望ましい」スタイルです。

Illustrious v0.1を基に訓練。

データセットは1429枚に拡張され、ポジティブ・ネガティブ両例を含む。

774枚はトレーニング対象のスタイル。

Illustrious v0.1を基に訓練。

v2:

データセットは374枚に拡大。モデル付属の品質タグと審美タグで生成品質を制御します。

訓練データセットは374枚に拡大。モデル付属の品質提示詞を使い生成品質を安定化。

v1:

Civitaiから224枚の画像で訓練、正則化に393枚の画像を使用。

Animagine v3.1Pony v6の2バージョンで訓練。

Civitaiから224枚の画像を学習、正則化用に393枚。

Animagine v3.1とPony v6の2つのバージョンで訓練。

test ver.4:

ややアンダーフィット気味ですが実用的です。Animagine v3.1により訓練された品質タグや美学タグ(best quality, masterpiece, very aestheticなど)はこのチェックポイントで生成されるアートスタイルを変えてしまうことが分かりました。次のテストバージョンで修正予定です。

少しアンダーフィットしていますが機能します。Animagine v3.1由来の品質コントロールワードや美学提示詞は生成画風を変えてしまうため、このテスト版では品質ワードは使わないでください。次バージョンで修正予定です。

前の画像
撮影スタジオSDXL / photo studio SDXL - v1.0
次の画像
Hunternifスタイル | オイル&伝統的 - V1

モデル詳細

モデルタイプ

LORA

ベースモデル

NoobAI

モデルバージョン

v5_noobVv0.65S

モデルハッシュ

a618b8278f

作成者

ディスカッション

コメントを残すには log in してください。