Amateur Photography [Flux Dev] - v4-soap-testing
推奨プロンプト
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,photo,photograph,Shot on iPhone photo of,This Image features
推奨ネガティブプロンプト
Hands,Text,People in the background,Skin texture
推奨パラメータ
samplers
steps
cfg
resolution
other models
推奨ハイレゾパラメータ
upscaler
upscale
steps
ヒント
Loraの重みはプロンプトに応じて試行してください。典型的な範囲はバージョンにより0.3-0.5または0.6-1です。
問題が発生した場合(手、テキスト、背景の人、肌の質感など)はLoraの重みを下げてください。
詳細なプロンプトが最も効果的で、特にGPT4oでキャプションされたものが良いです。
トリガーワードは必ずしも必要ありませんが、写真関連用語を使うことでモデルを誘導できます。
画像が収束するステップ数を確認し、最良結果のためにご自身で試行してください。
バージョンのハイライト
(モデル説明をお読みください) 良いかどうかわからないため「testing」とマークしています。試してみるかv3やv2を使い続けてください。使用するなら1344x1728(最良結果)か1728x1344での生成を強く推奨します。速度が遅い場合は896x1152(良好結果)か1152x896で生成しhires fixを使ってください
皆さんこんにちは、Loraを使う前にこれをお読みください
推奨設定 (v6):
Distilled CFG Scale: 3.5
サンプリング方法とスケジュールタイプ: DEISとDDIMの組み合わせ
ステップ数: 20
解像度: 896x1152
Hires fixモデル: 4x_NMKD-Superscale-SP_178000_G
ステップ数: 10
ノイズ除去: 0.3
アップスケール倍率: 1.5
Loraの重み: 0.8。プロンプトに基づいて試行錯誤してください
推奨設定 (v5-final):
Distilled CFG Scale: 2.5から4
サンプリング方法とスケジュールタイプ: Beta付きHeunかDEISとDDIM、または[Forge] Flux Realistic (遅い)のBeta / DDIM
ステップ数: 20以上(時々20、30、35、40を使います。画像が収束するステップ数を確認し、ご自身で試してください)
解像度: 896x1152(高解像度生成に抵抗があった方もいるため、この解像度で動作を確認済み)- hires fixの使用が必要です。以下は例画像での設定です
Hires. fix: 4x ultrasharp、ノイズ除去0.4、ステップ10(アップスケールは得意ではありません。他の方法があればそちらを使ってもよい)
直接1344x1728で生成することも可能です
チェックポイント: flux1-dev-Q8_0.gguf(Q8版を使用。FP8やQ4など他の量子化は試していません)
Loraの重み: 0.3-0.5。プロンプトに基づき調整してください
ポジティブプロンプト: トリガー単語は不要ですが、Fluxを誘導するため写真関連の用語(photo、photographなど)を使う必要があります。以下から開始可能です。これはトレーニングデータセットのタグ付け方法です
全身写真
中間ショット写真
セルフィー写真
クローズアップ写真
その他お好みで(ステップ数や重みをプロンプトに合わせて調整してください)。詳細なプロンプトが最も効果的です
問題点: 発生した場合は重みを下げてください
手
テキスト
背景の人
肌の質感 - 完璧ではありません。私も不満があります。改善方法を探しています
このバージョンを可能にしたBuzzへのチップをしてくれた皆さんに感謝します。特に以下の方々に敬意を表します:
plectrudecatastrophe
Paper_Cranes
congo2008
推奨設定 (v4-soap-testingとv5-beta):
Distilled CFG Scale: 2.5から4
サンプリング方法とスケジュールタイプ: Beta付きHeunかDEISとDDIM、または[Forge] Flux Realistic (遅い)のBeta / DDIM
ステップ数: 20以上(時々20、30、35、40を利用。画像が収束するステップ数を確認してご自分で試してください)
解像度: 1344x1728、1248x1824、1440x1800。896x1152も使用可能ですがhires fixの利用が必要
チェックポイント: flux1-dev-Q8_0.gguf(Q8版を使用。FP8やQ4は試していません)
Loraの重み: 0.3-0.5が最適
ポジティブプロンプト: これらの2つのバージョンはトリガーワード不要です。“photo of”、“photograph of”、“Shot on iPhone photo of”、“This Image features”など任意の語句を使用可能(他のユーザーの例を参照してください。異なるプロンプトでも良い結果が得られています)。多数のテストの結果、ページの右側に追加したトリガーワードで良い結果が得られました。使用するかしないかは自由ですが、データセットはGPT4Oでキャプションされており詳細なプロンプトが最良の結果を出します
このバージョンを可能にしたBuzzへチップをくれた皆さんに感謝します。特に以下の方へ敬意を表します:
kudzueye
推奨設定 (v3およびv2):
Distilled CFG Scale: 2.5から4
サンプリング方法およびスケジュールタイプ: Beta付きHeunかDEISとDDIM、または[Forge] Flux Realistic (遅い)のBeta / DDIM
ステップ数: 20以上(時折20、30、35、40を使用。画像収束ステップを確認し自己実験必須)
解像度: 896x1152、1152x896、または1024x1024(さらに高解像度も生成可能。FluxとこのLoraは対応可能)
チェックポイント: flux1-dev-Q8_0.gguf(Q8版を使用。他の量子化は試験していません)
Loraの重み: 0.6から1
ポジティブプロンプト: 他に合うプロンプトがあればそちらを使用してください。私はLoraのテスト方法を紹介しています。redditなどで様々なプロンプトが使われているのを見ています
必ず「Amateur photography of」で始め、「on flickr in 2007, 2005 blog, 2007 blog」で終えてください
最良の結果を得るフォーマット例: Amateur photography of <被写体の説明>、<シーンの説明>、<画像品質タグ>、on flickr in 2007, 2005 blog, 2007 blog
データセットのキャプション方法:
トレーニングデータセットはGPT4oを使ってキャプションしました。このLoraには詳細なキャプションが最適です
このLoraが気に入ったらBuzzに寄付していただけると非常にありがたいです
気に入らない場合で建設的なフィードバックがあれば、問題点をコメントで説明してください。次バージョンで改善を試みます
建設的なフィードバックがなく不満のみを述べたい場合は、他の場所でお願いします
モデル詳細
モデルタイプ
ベースモデル
モデルバージョン
モデルハッシュ
学習済みワード
ディスカッション
コメントを残すには log in してください。





