柔らかな窓辺の光の下で自然な輝く肌を持ち、シルバーのイヤリングを着けた高い襟のノースリーブトップを着たブルガリア人女性の笑顔のクローズアップセルフィー。ミニマリストなロフトにて。
磨かれた白い金属製のロボット像、可視のサーボジョイントと幾何学的なプレートが特徴で、頭上には断片化された結晶の後光、目の空洞には渦巻く黒煙、顔には複雑な歯車をのぞかせる円形の鍵穴があり、インディゴから紫外線へのグラデーション背景につながる。
黄色の防護服を着た女性が岩だらけの荒涼とした風景に立ち、厚い雲空の下で融合した卵状の構造や血管がある巨大な黄色い有機球体を見つめている。

推奨パラメータ

samplers

dpmpp_2m, DPM++ 2M

steps

40

cfg

1

ヒント

Fluxモデルを使うComfyUI向け:CFG=1、Guidance=2.5、Scheduler=Beta、Sampler=dpmpp_2m、Steps=40、Strengthは0.8〜1.0(通常は1.0。手の品質が低下した場合は0.87に減らす)。

SD3.5モデルを使うComfyUI向け:CFG=1、Guidance=3.5、Scheduler=sgm_uniform、Sampler=dpmpp_2m、Steps=40、Strengthは0.5〜1.0(通常は0.7)。

将来のアップデートで解剖学的精度を向上させるために、より多様なポーズを含むデータセットの拡張を検討してください。

クリエイタースポンサー

Fluxモデルの作業と今後のアップデートをご支援いただける場合は、ぜひhttps://ko-fi.com/danrisiで寄付をお願いします。

主な目的は、より生き生きとした感情とよりダイナミックなポーズを持つ、やや素人風の品質の「より『生きている』画像」を作ることでした(もちろん高品質の画像も生成可能です)。

追伸:フィードバックをくださった皆様に感謝します!解剖学の問題についてのコメント(ここだけでなく)に気づき、皆さんからの報告や例を集めています。これに対応するためにいくつかの選択肢を検討中です:

  1. 一貫した改善のためにフルチェックポイントをトレーニングすることが、より合理的なアプローチかもしれません。

  2. 解剖学的精度を向上させるために、さまざまなポーズを含む写真データセットを拡張すること。

ご意見を感謝します — これが将来のアップデートの形成に非常に役立っています。

追伸2:一貫した高品質な結果を得るためにトレーニングをRunPodに移しました。私の作業と今後のアップデートをサポートしたい場合は、Ko-fiで支援をお願いいたします。LoRaではなくモデルのファインチューニングを計画しています。https://ko-fi.com/danrisi

Flux用のComfyUIでの設定:
CFG=1、Guidance=2.5、Scheduler=Beta、Sampler=dpmpp_2m、Steps=40、Strengthは0.8〜1.0でうまく動作しますが、通常は1を使用します。手の品質が悪化した場合は0.87に設定します。

SD3.5用のComfyUIでの設定:
CFG=1、Guidance=3.5、Scheduler=sgm_uniform、Sampler=dpmpp_2m、Steps=40、Strengthは0.5〜1.0でうまく動作しますが、通常は0.7を使用します。

V2 - Flux

安定性、解剖学、全体的な品質が大幅に改善され、リアリズムと多様性をさらに高めます。このアップデートによりLoRAはより適応性が高くなり、プロンプトに応じて高解像度のリアリズムから意図的な低品質の美学までさまざまな品質レベルを実現できます。

1048枚の画像でトレーニング済み。

新機能:

安定性の向上:新バージョンはより安定し、テキストベースのプロンプトでうまく動作し、よりスムーズで予測可能な出力を提供します。

手と解剖学の強化:手と身体の解剖学がより洗練され、生き生きとした品質を向上させます。

品質の柔軟性:適切なプロンプトで高品質および低品質の美学の両方を調整できます(例あり)。



SD3.5用V1.2 - Large

ほぼ同じ設定でsd3.5用のバージョンを作ることにしました。個人的には良いと思いますが、解剖学に問題がある箇所があり(fluxより悪い時もあります)、しかし美学(色、コントラストなど)はfluxより良い感じです。sd3.5には可能性を感じており、将来的に新バージョンもsd3.5向けになるかもしれません。

V1.2

データセットの半分を変更し、プロンプトスタイルを変更し、手を改善し、夜のシーンの「懐中電灯効果」を減らし、全体的なLoRaの品質を向上させました(そう願っています)。
このバージョンではV1のように多くの「トリガーワード」を使う必要はありません。一部だけ追加してください。

V1

別の素人LoRaをトレーニングしました(これまでにも多く作られています)。

それでも2000年代の自分のデータセットからいくつかの写真を取り、さらに700枚追加しました。今のところかなり良い結果が出ていますが、品質の最適化について議論の余地がありました。品質のコントロールに役立つことを望んでいましたが、モデルが混乱したように見えます。データセットには以下のようなさまざまな品質のグラデーションが存在します:

1) 携帯電話で撮影された高解像度写真、アーティファクトなし、鮮明でクリア

2) デジタルカメラで撮影された低解像度の素人写真、JPEGアーティファクトなし、ややノイズあり

3) 携帯電話で撮影された中解像度写真、低照度条件による若干の粒状感あり、重大なデジタルアーティファクトなし

その他の組み合わせや変種もあります。次回バージョンではこれらを削除する予定です。しかし、このバージョンは私にとって最も良く動作しています:

デジタルカメラで撮影された低解像度の素人写真、JPEGアーティファクトなし、ややノイズあり

前の画像
Frieren フリーレン - 葬送のフリーレン - v2.0-alpha [FLUX]
次の画像
Crimson Acryllic FLUX - V1

モデル詳細

モデルタイプ

LORA

ベースモデル

Flux.1 D

モデルバージョン

Flux - v2

モデルハッシュ

b1c4ddf956

学習済みワード

amateurish photo
low lighting
in motion
overexposed
underexposed
GoPro lens
eerie atmosphere
smeared background
smeared foreground

作成者

ディスカッション

コメントを残すには log in してください。

モデルコレクション - UltraRealistic Lora Project

「UltraRealistic Lora Project - Flux - v2」による画像

美学的画像

フォトリアリスティック画像

セクシー画像

スタイル画像

女性画像