白いビキニとサングラスを着用した女性が、晴れた空の下でマイアミのスカイラインを背景にヨットでくつろいでいる
ネオンライトの下、夜のマイアミで赤いランボルギーニのそばに立つ、黒いサングラスとパフヘアのスパークリング赤いドレスの女性。
明るい青空の下、マイアミのヤシの木とオフィスの高層ビルを背景に、白いスーツとサングラスを着用した女性が低い角度から見られる。
1980年代スタイルの警察官がサングラスと黒い口ひげを着け、マイアミの白いパトカーに寄りかかり、背景にヤシの木とオフィスビルがある中、ピンクのフロストドーナツを持っている。

推奨プロンプト

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

2005 blog

推奨パラメータ

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, Heun

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 896x1152

other models

amateurphotov2-000049 (771781fd6719), flux1-dev-Q8_0 (52cfce60d7)

推奨ハイレゾパラメータ

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

10

ヒント

プロンプトに応じてLora重みを試行する必要があります。推奨重みはバージョンにより0.3-0.5から0.6-1まで変動します。

写真関連の詳細なプロンプトはモデルをより良く誘導します。photo、photograph、カメラの種類や撮影日などの用語を使いましょう。

手、テキスト、背景の人物、肌質に問題が発生した場合はLora重みを減らしてください。

システム環境が許せば1344x1728などの高解像度で直接生成することも可能です。

データセットのキャプションはGPT4oで作成されており、詳細なキャプションが最良の結果をもたらします。

バージョンのハイライト

GPT4oプロンプト:

私はStable Diffusionのテキストから画像へのモデル用にLoRAをトレーニングする予定です。このモデルはT5XXLトランスフォーマーをアーキテクチャに使用しています。プロンプトは自然言語で、特定のフォーマットに従う必要があります。画像をアップロードするので、その画像に基づいて詳細なプロンプトの作成を手伝ってください。プロンプトは「Amateur photography of」で始まり、「on flickr in 2007, 2005 blog, 2007 blog」で終わる必要があります。常に単一段落で提示してください。
フォーマットは以下の通りです:
被写体説明: 画像内の全人物を詳細に記述します。人種や民族、身体的特徴(身長、体格、肌の色、髪の色)、顔の特徴、服装、表情やポーズなどをできる限り具体的に含めます。必ず被写体の体格(例:ぽっちゃり、スリム、小柄)も含めてください。
シーン説明: 人物が具体的に何をしているのか正確に伝えます。背景や設定、彼らが触れているもの、全体の環境(都市、田舎、屋内、屋外など)を詳述します。
画像品質タグ: 画像の質を強調する記述タグを含めます。わずかな動きのぼかし、雑多な背景、暖色系、明るい自然光、高コントラスト、鮮やかな色彩などの用語を使います。これらのタグは画像の雰囲気や感触も反映します。
最終出力はこれらすべての要素を統合し、画像を正確に反映した包括的で詳細なプロンプトになります。

皆さんこんにちは、このLoraを使用する前に必ずお読みください

  • 蒸留CFGスケール: 3.5

  • サンプリング方法とスケジュールタイプ: DEIS with DDIM

  • ステップ数: 20

  • 解像度: 896x1152

    • Hires fixモデル: 4x_NMKD-Superscale-SP_178000_G

    • ステップ数: 10

    • ノイズ除去: 0.3

    • アップスケール倍率: 1.5

  • Lora重み: 0.8。プロンプトに合わせて調整が必要です

  • 蒸留CFGスケール: 2.5から4

  • サンプリング方法とスケジュールタイプ: Heun with BETA または DEIS with DDIM または [Forge] Flux Realistic (遅め) で Beta / DDIM

  • ステップ数: 20以上(20、30、35、40を使うことがあります。画像が何ステップで収束するか確認してください。実験が必要です)

  • 解像度: 896x1152(高解像度生成が好ましくない方のためにこの解像度での動作を確認しました)- ただしhiresfixを使用してください。以下は例画像での設定です

    • Hires. fix: 4x超シャープ、ノイズ除去0.4、10ステップ(アップスケール手法はこれ以外でも構いません)

    • 可能であれば直接1344x1728で生成することもできます

  • チェックポイント: flux1-dev-Q8_0.gguf(Q8を使用。他のFP8やQ4はテストしていません)

  • Lora重み: 0.3-0.5。プロンプトにより調整してください

  • ポジティブプロンプト: トリガーワードは不要ですが、Fluxを誘導するためにphotoやphotographなどの写真用語の使用が推奨されます。以下のプロンプトから始めるのもよいでしょう。これはトレーニングデータセットのタグ付け方法です

    • 全身写真の

    • 中景写真の

    • セルフィー写真の

    • クローズアップ写真の

    • その他お好みで(ステップ数や重みはプロンプトに合わせて調整)。詳細なプロンプトが最も効果的です

  • 問題点: 発生した場合はLora重みを減らしてください

    • テキスト

    • 背景の人物

    • 肌質 - 完璧ではありません。他の改善方法を模索中です

このバージョンの作成に寄付を頂いた皆様に感謝します。特に記載させて頂く方々:

  • plectrudecatastrophe

  • Paper_Cranes

  • congo2008

  • 蒸留CFGスケール: 2.5から4

  • サンプリング方法とスケジュールタイプ: Heun with BETA または DEIS with DDIM または [Forge] Flux Realistic (遅め) で Beta / DDIM

  • ステップ数: 20以上(20、30、35、40を使うことがあります。画像が何ステップで収束するか確認してください。実験が必要です)

  • 解像度: 1344x1728、1248x1824、1440x1800。896x1152も使用可能ですがhires fixを使用してください

  • チェックポイント: flux1-dev-Q8_0.gguf(Q8を使用。他のFP8やQ4はテストしていません)

  • Lora重み: 0.3-0.5が適正範囲です

  • ポジティブプロンプト: この2バージョンはトリガーワード不要です。photo of、photograph of、Shot on iPhone photo of、This Image featuresなど何でも使用可能(他ユーザーの例も参照してください)。多くのテストの後、このページ右側のトリガーワードを使うと非常に良い結果が得られました。使うかどうかは自由ですが、データセットはGPT4Oでキャプション付けされているため、詳細なプロンプトが最良です

このバージョン作成に寄付を頂いた皆様に感謝します。特に記載させて頂く方々:

  • kudzueye

  • 蒸留CFGスケール: 2.5から4

  • サンプリング方法とスケジュールタイプ: Heun with BETA または DEIS with DDIM または [Forge] Flux Realistic (遅め) で Beta / DDIM

  • ステップ数: 20以上(20、30、35、40を使うことがあります。画像が何ステップで収束するか確認してください。実験が必要です)

  • 解像度: 896x1152 または 1152x896 または 1024x1024(これ以上の高解像度生成も可能です。FluxとこのLoraは対応しています)

  • チェックポイント: flux1-dev-Q8_0.gguf(Q8を使用。他のFP8やQ4はテストしていません)

  • Lora重み: 0.6-1

  • ポジティブプロンプト: 他のプロンプトがうまくいくならそちらを使用してください。ここでは私のテスト方法を示しています。Redditや他の場所でも異なるプロンプトで良い結果が出ています

    • 常に「Amateur photography of」で始め、「on flickr in 2007, 2005 blog, 2007 blog」で終わるようにします

      • 最良の結果を得るには、次の形式のプロンプトが推奨されます: Amateur photography of <被写体説明>, <シーン説明>, <画像品質タグ>, on flickr in 2007, 2005 blog, 2007 blog

データセットのキャプション方法:

  • トレーニングデータセットはGPT4oでキャプション付けしました。このLoraには詳細なキャプションが最適です

このLoraを気に入っていただけたら、Buzzへの寄付をお願いいたします

もし気に入らなければ、改善点のある部分をコメントで教えてください。次バージョンで改善を試みます

建設的なフィードバックがなく、ただ文句を言いたい方は別の場所でお願いします

前の画像
chromeBot ロボット/サイボーグポートレート - v0.1
次の画像
Wanderer's Detailed Portraits | FLUX - v1.0

モデル詳細

モデルタイプ

LORA

ベースモデル

Flux.1 D

モデルバージョン

v2.0

モデルハッシュ

61cff4eebd

学習済みワード

Amateur photography
on flickr in 2007
2005 blog
2007 blog

ディスカッション

コメントを残すには log in してください。