アマチュア写真撮影 [Flux Dev] - v1.0
推奨プロンプト
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
推奨パラメータ
samplers
steps
cfg
resolution
other models
推奨ハイレゾパラメータ
upscaler
upscale
steps
ヒント
プロンプトに応じてLora重みを試行する必要があります。推奨重みはバージョンにより0.3~0.5から0.6~1まで異なります。
詳細な写真関連プロンプトでモデルの誘導が向上します。photo、photograph、カメラ種類や日付を含めてください。
手、テキスト、背景の人物、肌質に問題が発生したらLora重みを減らしてみてください。
環境が許せば1344x1728などの高解像度で直接生成も可能です。
データセットのキャプションはGPT4oで作成されており、詳細なキャプションがベストな結果をもたらします。
みなさんこんにちは、Loraを使う前にこちらをお読みください
推奨設定 (v6):
Distilled CFGスケール: 3.5
サンプリング手法とスケジュールタイプ: DEIS with DDIM
ステップ数: 20
解像度: 896x1152
Hires fixモデル: 4x_NMKD-Superscale-SP_178000_G
ステップ数: 10
デノイズ: 0.3
アップスケール倍率: 1.5
Lora重み: 0.8。プロンプトに基づいて試行が必要です
推奨設定 (v5-final):
Distilled CFGスケール: 2.5~4
サンプリング手法とスケジュールタイプ: Heun with BETA または DEIS with DDIM、もしくは [Forge] Flux Realistic (Slow) with Beta / DDIM
ステップ数: 20以上(20、30、35、40を使うこともあります。画像が収束するステップ数を調べて自分で試してください)
解像度: 896x1152(高解像度生成が嫌いな方もいるのでこの解像度で動作を確認しました)- ただしhires fixを使う必要があります。以下は私が例画像で使った設定です
Hires fix: 4x ultrasharp、デノイズ0.4、10ステップ(私はアップスケールが上手くありません。他にアップスケール方法があればそちらを使っても構いません)
できれば1344x1728での直接生成も可能です
チェックポイント: flux1-dev-Q8_0.gguf (Q8を使っています。FP8やQ4、他の量子化はテストしていません)
Lora重み: 0.3~0.5。プロンプトに応じて試行が必要です
ポジティブプロンプト: トリガーワードは不要ですが、Fluxを誘導するため写真用語(photo、photographなど)を使用してください。以下から始めるのがおすすめです。これは私がトレーニングデータセットに付けたタグです
全身写真
ミディアムショット写真
セルフィー写真
クローズアップ写真
その他何でも(ステップ数や重みはプロンプトに応じて調整してください)。詳細なプロンプトが最も効果的です
問題点: 発生した場合は重みを減らしてください
手
テキスト
背景の人々
肌の質感 - 完璧ではありません。私も気に入っておらず改善方法を模索中です
このバージョンの作成に寄付してくださった皆様に感謝します。特別感謝
plectrudecatastrophe
Paper_Cranes
congo2008
推奨設定 (v4-soap-testingおよびv5-beta):
Distilled CFGスケール: 2.5~4
サンプリング手法とスケジュールタイプ: Heun with BETA または DEIS with DDIM、もしくは [Forge] Flux Realistic (Slow) with Beta / DDIM
ステップ数: 20以上(20、30、35、40を使うこともあります。画像が収束するステップ数を調べて自分で試してください)
解像度: 1344x1728、1248x1824、1440x1800。896x1152も動作しますがhires fixの使用が必要です
チェックポイント: flux1-dev-Q8_0.gguf (Q8を使っています。FP8やQ4、他の量子化はテストしていません)
Lora重み: 0.3~0.5が適正範囲です
ポジティブプロンプト: これら2つのバージョンにはトリガーワードは必要ありません。photo ofやphotograph of、Shot on iPhone photo of、This Image featuresなど何でも使えます(他の方が投稿した例を参考にしてください。異なるプロンプトでも良い結果が出ています)。多くのテストの結果、当ページ右側にあるトリガーワードは非常に良い結果を出しました。使いたい場合はどうぞ。そうでなければ好きなものを使用してください。データセットはGPT4Oを用いてキャプション付けされているため、詳細なプロンプトが最良の結果を出します
このバージョンの作成に寄付してくださった皆様に感謝します。特別感謝
kudzueye
推奨設定 (v3およびv2):
Distilled CFGスケール: 2.5~4
サンプリング手法とスケジュールタイプ: Heun with BETA または DEIS with DDIM、もしくは [Forge] Flux Realistic (Slow) with Beta / DDIM
ステップ数: 20以上(20、30、35、40を使うこともあります。画像が収束するステップ数を調べて自分で試してください)
解像度: 896x1152、1152x896、1024x1024(これ以上の高解像度で生成しても構いません。FluxとこのLoraは対応可能です)
チェックポイント: flux1-dev-Q8_0.gguf (Q8を使っています。FP8やQ4、他の量子化はテストしていません)
Lora重み: 0.6~1
ポジティブプロンプト: 他のプロンプトがこのLoraでうまくいくならそちらを使ってください。ここでは私のテスト方法を紹介します。Redditなど多くの画像で異なるプロンプトが使われています
常に "Amateur photography of" から始め、 "on flickr in 2007, 2005 blog, 2007 blog" で終わらせる
最良の結果を得るには、 <被写体の説明>、<シーンの説明>、<画像品質のタグ>を含む形式にしてください。例: Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog
データセットはどのようにキャプション付けされたか?:
私はGPT4oを用いてトレーニングデータセットにキャプションを付けました。このLoraでは詳細なキャプションが最も効果的です
このLoraが気に入ったらBuzzに寄付いただけると非常にありがたいです
もし気に入らず建設的なフィードバックがあれば、どこが問題かコメントしてください。次バージョンで修正を試みます
建設的なフィードバックがなく単に文句を言いたいだけなら、コメントは他でお願いします
モデル詳細
モデルタイプ
ベースモデル
モデルバージョン
モデルハッシュ
学習済みワード
ディスカッション
コメントを残すには log in してください。





