アマチュア写真 [Flux Dev] - v5-beta
推奨プロンプト
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
推奨パラメータ
samplers
steps
cfg
resolution
other models
推奨ハイレゾパラメータ
upscaler
upscale
steps
ヒント
プロンプトに応じてLoraの重みを試行する必要があります。推奨される重みはバージョンにより0.3-0.5から0.6-1まで変動します。
写真関連の詳細なプロンプトはモデルをより効果的に誘導します。photoやphotograph、カメラの種類や日付などの用語を使用してください。
手の描写、テキスト、背景の人物、肌の質感に問題がある場合はLoraの重みを下げてみてください。
環境が許せば1344x1728などの高解像度で直接生成することも可能です。
データセットのキャプションはGPT4oで作成されており、詳細なキャプションが最良の結果をもたらします。
バージョンのハイライト
v4からの小規模アップグレード
皆さん、Loraを使用する前にこれをお読みください
推奨設定 (v6):
蒸留されたCFGスケール: 3.5
サンプリング手法とスケジュールタイプ: DEIS with DDIM
ステップ数: 20
解像度: 896x1152
Hires fixモデル: 4x_NMKD-Superscale-SP_178000_G
ステップ数: 10
デノイズ: 0.3
アップスケール倍率: 1.5
Loraの重み: 0.8。プロンプトに応じて試行が必要です
推奨設定 (v5-final):
蒸留されたCFGスケール: 2.5~4
サンプリング手法とスケジュールタイプ: Heun with BETA、DEIS with DDIM、または[Forge] Flux Realistic (Slow) with Beta / DDIM
ステップ数: 20以上(時に20、30、35、40を使用します。画像が収束するステップ数を確認してください。ご自身で試してみてください)
解像度: 896x1152(高解像度で生成するのを好まない方がいたためこの解像度で動作を確認しましたが、hires fixを使用する必要があります。以下は例の設定です)
Hires fix: 4x ultrasharp、デノイズ0.4、ステップ10(アップスケールは私の専門ではありません。他の方法があればそちらを使用してください)
可能であれば1344x1728で直接生成することもできます
チェックポイント: flux1-dev-Q8_0.gguf(私はQ8を使用し、FP8やQ4など他の量子化でのテストはしていません)
Loraの重み: 0.3~0.5。プロンプトに応じて試行が必要です
ポジティブプロンプト: トリガーワードは不要ですが、Fluxを誘導するためにphoto、photographなどの写真関連用語を使用してください。以下のように開始できます。これはトレーニングデータセットのタグ付け方法です
全身写真の
中距離ショットの写真の
自撮り写真の
クローズアップ写真の
またはお好みで(ステップ数や重みはプロンプトに合わせて調整してください)。詳細なプロンプトが最良です
問題: 発生した場合は重みを減らしてください
手の描画
テキスト
背景の人物
肌の質感 - 完璧ではありません。私も好ましく思っておらず、改善方法を模索中です
Buzzにチップを送ってくれた皆様に感謝いたします。このバージョンが実現できました。心からの感謝を込めて:
plectrudecatastrophe
Paper_Cranes
congo2008
推奨設定 (v4-soap-testing と v5-beta):
蒸留されたCFGスケール: 2.5~4
サンプリング手法とスケジュールタイプ: Heun with BETA、DEIS with DDIM、または[Forge] Flux Realistic (Slow) with Beta / DDIM
ステップ数: 20以上(時に20、30、35、40を使用します。画像が収束するステップ数を確認してください。ご自身で試してみてください)
解像度: 1344x1728、1248x1824、または1440x1800。896x1152も動作しますがhires fixが必要です
チェックポイント: flux1-dev-Q8_0.gguf(私はQ8を使用し、FP8やQ4、その他の量子化でのテストはしていません)
Loraの重み: 0.3~0.5がベストです
ポジティブプロンプト: これら2つのバージョンはトリガーワード不要です。「photo of」や「photograph of」、「Shot on iPhone photo of」、「This Image features」などお好きなものを使えます(他の方の例では異なるプロンプトでも良い結果を得ています)。多くのテストの後、このページ右側に追加したトリガーワードで良い結果が得られました。使っても使わなくても自由ですが、データセットはGPT4Oでキャプションされており、詳細なプロンプトが最良の結果を生みます
Buzzにチップを送ってくれた皆様に感謝いたします。このバージョンが実現できました。心からの感謝を込めて:
kudzueye
推奨設定 (v3 と v2):
蒸留されたCFGスケール: 2.5~4
サンプリング手法とスケジュールタイプ: Heun with BETA、DEIS with DDIM、または[Forge] Flux Realistic (Slow) with Beta / DDIM
ステップ数: 20以上(時に20、30、35、40を使用します。画像が収束するステップ数を確認してください。ご自身で試してみてください)
解像度: 896x1152、1152x896、または1024x1024(これより高解像度でも生成可能です。FluxとこのLoraは対応可能です)
チェックポイント: flux1-dev-Q8_0.gguf(私はQ8を使用し、FP8やQ4など他の量子化でのテストはしていません)
Loraの重み: 0.6~1
ポジティブプロンプト: 他のプロンプトでも効果があればそれを使ってください。私はこのLoraをテストするためにこれらの例を挙げています。Redditなどで異なるプロンプトが使われているのも見かけます
常に「Amateur photography of」で開始し、「on flickr in 2007, 2005 blog, 2007 blog」で終わらせること
最良の結果を得るには以下の形式が推奨されます: Amateur photography of <被写体の説明>, <シーンの説明>, <画像品質タグ>, on flickr in 2007, 2005 blog, 2007 blog
データセットのキャプション方法:
トレーニングデータセットのキャプションはGPT4oで作成しました。詳細なキャプションがこのLoraで最良の効果を発揮します
このLoraがお気に入りであればBuzzへの寄付をぜひご検討ください。非常に感謝されます
もし気に入らない場合や建設的なフィードバックがあれば、その点をコメントで教えてください。次バージョンで対応します
建設的なフィードバックなしにただ不満を言うだけなら、コメントは他所でお願いします
モデル詳細
モデルタイプ
ベースモデル
モデルバージョン
モデルハッシュ
学習済みワード
ディスカッション
コメントを残すには log in してください。





