アマチュア写真撮影 [Flux Dev] - v2.0
推奨プロンプト
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
2005 blog
推奨パラメータ
samplers
steps
cfg
resolution
other models
推奨ハイレゾパラメータ
upscaler
upscale
steps
ヒント
プロンプトに応じてLora重みを試行する必要があります。推奨重みはバージョンにより0.3-0.5から0.6-1まで変動します。
写真関連の詳細なプロンプトはモデルをより良く誘導します。photo、photograph、カメラの種類や撮影日などの用語を使いましょう。
手、テキスト、背景の人物、肌質に問題が発生した場合はLora重みを減らしてください。
システム環境が許せば1344x1728などの高解像度で直接生成することも可能です。
データセットのキャプションはGPT4oで作成されており、詳細なキャプションが最良の結果をもたらします。
バージョンのハイライト
GPT4oプロンプト:
私はStable Diffusionのテキストから画像へのモデル用にLoRAをトレーニングする予定です。このモデルはT5XXLトランスフォーマーをアーキテクチャに使用しています。プロンプトは自然言語で、特定のフォーマットに従う必要があります。画像をアップロードするので、その画像に基づいて詳細なプロンプトの作成を手伝ってください。プロンプトは「Amateur photography of」で始まり、「on flickr in 2007, 2005 blog, 2007 blog」で終わる必要があります。常に単一段落で提示してください。フォーマットは以下の通りです:被写体説明: 画像内の全人物を詳細に記述します。人種や民族、身体的特徴(身長、体格、肌の色、髪の色)、顔の特徴、服装、表情やポーズなどをできる限り具体的に含めます。必ず被写体の体格(例:ぽっちゃり、スリム、小柄)も含めてください。シーン説明: 人物が具体的に何をしているのか正確に伝えます。背景や設定、彼らが触れているもの、全体の環境(都市、田舎、屋内、屋外など)を詳述します。画像品質タグ: 画像の質を強調する記述タグを含めます。わずかな動きのぼかし、雑多な背景、暖色系、明るい自然光、高コントラスト、鮮やかな色彩などの用語を使います。これらのタグは画像の雰囲気や感触も反映します。最終出力はこれらすべての要素を統合し、画像を正確に反映した包括的で詳細なプロンプトになります。皆さんこんにちは、このLoraを使用する前に必ずお読みください
推奨設定 (v6):
蒸留CFGスケール: 3.5
サンプリング方法とスケジュールタイプ: DEIS with DDIM
ステップ数: 20
解像度: 896x1152
Hires fixモデル: 4x_NMKD-Superscale-SP_178000_G
ステップ数: 10
ノイズ除去: 0.3
アップスケール倍率: 1.5
Lora重み: 0.8。プロンプトに合わせて調整が必要です
推奨設定 (v5-final):
蒸留CFGスケール: 2.5から4
サンプリング方法とスケジュールタイプ: Heun with BETA または DEIS with DDIM または [Forge] Flux Realistic (遅め) で Beta / DDIM
ステップ数: 20以上(20、30、35、40を使うことがあります。画像が何ステップで収束するか確認してください。実験が必要です)
解像度: 896x1152(高解像度生成が好ましくない方のためにこの解像度での動作を確認しました)- ただしhiresfixを使用してください。以下は例画像での設定です
Hires. fix: 4x超シャープ、ノイズ除去0.4、10ステップ(アップスケール手法はこれ以外でも構いません)
可能であれば直接1344x1728で生成することもできます
チェックポイント: flux1-dev-Q8_0.gguf(Q8を使用。他のFP8やQ4はテストしていません)
Lora重み: 0.3-0.5。プロンプトにより調整してください
ポジティブプロンプト: トリガーワードは不要ですが、Fluxを誘導するためにphotoやphotographなどの写真用語の使用が推奨されます。以下のプロンプトから始めるのもよいでしょう。これはトレーニングデータセットのタグ付け方法です
全身写真の
中景写真の
セルフィー写真の
クローズアップ写真の
その他お好みで(ステップ数や重みはプロンプトに合わせて調整)。詳細なプロンプトが最も効果的です
問題点: 発生した場合はLora重みを減らしてください
手
テキスト
背景の人物
肌質 - 完璧ではありません。他の改善方法を模索中です
このバージョンの作成に寄付を頂いた皆様に感謝します。特に記載させて頂く方々:
plectrudecatastrophe
Paper_Cranes
congo2008
推奨設定 (v4-soap-testing と v5-beta):
蒸留CFGスケール: 2.5から4
サンプリング方法とスケジュールタイプ: Heun with BETA または DEIS with DDIM または [Forge] Flux Realistic (遅め) で Beta / DDIM
ステップ数: 20以上(20、30、35、40を使うことがあります。画像が何ステップで収束するか確認してください。実験が必要です)
解像度: 1344x1728、1248x1824、1440x1800。896x1152も使用可能ですがhires fixを使用してください
チェックポイント: flux1-dev-Q8_0.gguf(Q8を使用。他のFP8やQ4はテストしていません)
Lora重み: 0.3-0.5が適正範囲です
ポジティブプロンプト: この2バージョンはトリガーワード不要です。photo of、photograph of、Shot on iPhone photo of、This Image featuresなど何でも使用可能(他ユーザーの例も参照してください)。多くのテストの後、このページ右側のトリガーワードを使うと非常に良い結果が得られました。使うかどうかは自由ですが、データセットはGPT4Oでキャプション付けされているため、詳細なプロンプトが最良です
このバージョン作成に寄付を頂いた皆様に感謝します。特に記載させて頂く方々:
kudzueye
推奨設定 (v3 と v2):
蒸留CFGスケール: 2.5から4
サンプリング方法とスケジュールタイプ: Heun with BETA または DEIS with DDIM または [Forge] Flux Realistic (遅め) で Beta / DDIM
ステップ数: 20以上(20、30、35、40を使うことがあります。画像が何ステップで収束するか確認してください。実験が必要です)
解像度: 896x1152 または 1152x896 または 1024x1024(これ以上の高解像度生成も可能です。FluxとこのLoraは対応しています)
チェックポイント: flux1-dev-Q8_0.gguf(Q8を使用。他のFP8やQ4はテストしていません)
Lora重み: 0.6-1
ポジティブプロンプト: 他のプロンプトがうまくいくならそちらを使用してください。ここでは私のテスト方法を示しています。Redditや他の場所でも異なるプロンプトで良い結果が出ています
常に「Amateur photography of」で始め、「on flickr in 2007, 2005 blog, 2007 blog」で終わるようにします
最良の結果を得るには、次の形式のプロンプトが推奨されます: Amateur photography of <被写体説明>, <シーン説明>, <画像品質タグ>, on flickr in 2007, 2005 blog, 2007 blog
データセットのキャプション方法:
トレーニングデータセットはGPT4oでキャプション付けしました。このLoraには詳細なキャプションが最適です
このLoraを気に入っていただけたら、Buzzへの寄付をお願いいたします
もし気に入らなければ、改善点のある部分をコメントで教えてください。次バージョンで改善を試みます
建設的なフィードバックがなく、ただ文句を言いたい方は別の場所でお願いします
モデル詳細
モデルタイプ
ベースモデル
モデルバージョン
モデルハッシュ
学習済みワード
ディスカッション
コメントを残すには log in してください。





