モデル/UltraRealistic Lora Project - Flux - v2

UltraRealistic Lora Project - Flux - v2

沢岡美纪子

10/8/2025

12:47:31 AM

| Discussion|

推奨パラメータ

samplers

dpmpp_2m, DPM++ 2M

steps

cfg

ヒント

Fluxモデルを使うComfyUI向け：CFG=1、Guidance=2.5、Scheduler=Beta、Sampler=dpmpp_2m、Steps=40、Strengthは0.8〜1.0（通常は1.0。手の品質が低下した場合は0.87に減らす）。

SD3.5モデルを使うComfyUI向け：CFG=1、Guidance=3.5、Scheduler=sgm_uniform、Sampler=dpmpp_2m、Steps=40、Strengthは0.5〜1.0（通常は0.7）。

将来のアップデートで解剖学的精度を向上させるために、より多様なポーズを含むデータセットの拡張を検討してください。

クリエイタースポンサー

Fluxモデルの作業と今後のアップデートをご支援いただける場合は、ぜひhttps://ko-fi.com/danrisiで寄付をお願いします。

主な目的は、より生き生きとした感情とよりダイナミックなポーズを持つ、やや素人風の品質の「より『生きている』画像」を作ることでした（もちろん高品質の画像も生成可能です）。

追伸：フィードバックをくださった皆様に感謝します！解剖学の問題についてのコメント（ここだけでなく）に気づき、皆さんからの報告や例を集めています。これに対応するためにいくつかの選択肢を検討中です：

一貫した改善のためにフルチェックポイントをトレーニングすることが、より合理的なアプローチかもしれません。
解剖学的精度を向上させるために、さまざまなポーズを含む写真データセットを拡張すること。

ご意見を感謝します — これが将来のアップデートの形成に非常に役立っています。

追伸2：一貫した高品質な結果を得るためにトレーニングをRunPodに移しました。私の作業と今後のアップデートをサポートしたい場合は、Ko-fiで支援をお願いいたします。LoRaではなくモデルのファインチューニングを計画しています。https://ko-fi.com/danrisi

Flux用のComfyUIでの設定：
CFG=1、Guidance=2.5、Scheduler=Beta、Sampler=dpmpp_2m、Steps=40、Strengthは0.8〜1.0でうまく動作しますが、通常は1を使用します。手の品質が悪化した場合は0.87に設定します。

SD3.5用のComfyUIでの設定：
CFG=1、Guidance=3.5、Scheduler=sgm_uniform、Sampler=dpmpp_2m、Steps=40、Strengthは0.5〜1.0でうまく動作しますが、通常は0.7を使用します。

V2 - Flux

安定性、解剖学、全体的な品質が大幅に改善され、リアリズムと多様性をさらに高めます。このアップデートによりLoRAはより適応性が高くなり、プロンプトに応じて高解像度のリアリズムから意図的な低品質の美学までさまざまな品質レベルを実現できます。

1048枚の画像でトレーニング済み。

新機能：

安定性の向上：新バージョンはより安定し、テキストベースのプロンプトでうまく動作し、よりスムーズで予測可能な出力を提供します。

手と解剖学の強化：手と身体の解剖学がより洗練され、生き生きとした品質を向上させます。

品質の柔軟性：適切なプロンプトで高品質および低品質の美学の両方を調整できます（例あり）。

SD3.5用V1.2 - Large

ほぼ同じ設定でsd3.5用のバージョンを作ることにしました。個人的には良いと思いますが、解剖学に問題がある箇所があり（fluxより悪い時もあります）、しかし美学（色、コントラストなど）はfluxより良い感じです。sd3.5には可能性を感じており、将来的に新バージョンもsd3.5向けになるかもしれません。

V1.2

データセットの半分を変更し、プロンプトスタイルを変更し、手を改善し、夜のシーンの「懐中電灯効果」を減らし、全体的なLoRaの品質を向上させました（そう願っています）。
このバージョンではV1のように多くの「トリガーワード」を使う必要はありません。一部だけ追加してください。

別の素人LoRaをトレーニングしました（これまでにも多く作られています）。

それでも2000年代の自分のデータセットからいくつかの写真を取り、さらに700枚追加しました。今のところかなり良い結果が出ていますが、品質の最適化について議論の余地がありました。品質のコントロールに役立つことを望んでいましたが、モデルが混乱したように見えます。データセットには以下のようなさまざまな品質のグラデーションが存在します：

1) 携帯電話で撮影された高解像度写真、アーティファクトなし、鮮明でクリア

2) デジタルカメラで撮影された低解像度の素人写真、JPEGアーティファクトなし、ややノイズあり

3) 携帯電話で撮影された中解像度写真、低照度条件による若干の粒状感あり、重大なデジタルアーティファクトなし

その他の組み合わせや変種もあります。次回バージョンではこれらを削除する予定です。しかし、このバージョンは私にとって最も良く動作しています：

デジタルカメラで撮影された低解像度の素人写真、JPEGアーティファクトなし、ややノイズあり