曇り空の下、穏やかな北極の水域にある雪に覆われた氷山の縁に立つホッキョクグマ。
中央フロリダでミッキーマウスのTシャツとショートパンツを着た女性観光客が、郊外の住宅街の晴れた日にヤシの木にもたれている鮮明な写真。
フロリダの郊外にある黄色い二階建ての家が冠水しており、ヤシの木が水面に反射しています。
長い白いひげ、花柄の尖った帽子、緑のローブを着て木製の杖を持ち、ソファ、風船、床に置かれたビール瓶がある混雑したリビングパーティーで魔法使いの衣装を着た男性。

推奨プロンプト

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

推奨パラメータ

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, DEIS, [Forge] Flux Realistic (Slow)

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 1824x1248, 1344x1728, 1248x1824

other models

amateurphoto-version5-gm (d9ccc813e4d8), flux1-dev-Q8_0 (52cfce60d7)

推奨ハイレゾパラメータ

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

10

ヒント

プロンプトに応じてLoraの重みを試行する必要があります。推奨される重みはバージョンにより0.3-0.5から0.6-1まで変動します。

写真関連の詳細なプロンプトはモデルをより効果的に誘導します。photoやphotograph、カメラの種類や日付などの用語を使用してください。

手の描写、テキスト、背景の人物、肌の質感に問題がある場合はLoraの重みを下げてみてください。

環境が許せば1344x1728などの高解像度で直接生成することも可能です。

データセットのキャプションはGPT4oで作成されており、詳細なキャプションが最良の結果をもたらします。

バージョンのハイライト

v4からの小規模アップグレード

皆さん、Loraを使用する前にこれをお読みください

  • 蒸留されたCFGスケール: 3.5

  • サンプリング手法とスケジュールタイプ: DEIS with DDIM

  • ステップ数: 20

  • 解像度: 896x1152

    • Hires fixモデル: 4x_NMKD-Superscale-SP_178000_G

    • ステップ数: 10

    • デノイズ: 0.3

    • アップスケール倍率: 1.5

  • Loraの重み: 0.8。プロンプトに応じて試行が必要です

  • 蒸留されたCFGスケール: 2.5~4

  • サンプリング手法とスケジュールタイプ: Heun with BETA、DEIS with DDIM、または[Forge] Flux Realistic (Slow) with Beta / DDIM

  • ステップ数: 20以上(時に20、30、35、40を使用します。画像が収束するステップ数を確認してください。ご自身で試してみてください)

  • 解像度: 896x1152(高解像度で生成するのを好まない方がいたためこの解像度で動作を確認しましたが、hires fixを使用する必要があります。以下は例の設定です)

    • Hires fix: 4x ultrasharp、デノイズ0.4、ステップ10(アップスケールは私の専門ではありません。他の方法があればそちらを使用してください)

    • 可能であれば1344x1728で直接生成することもできます

  • チェックポイント: flux1-dev-Q8_0.gguf(私はQ8を使用し、FP8やQ4など他の量子化でのテストはしていません)

  • Loraの重み: 0.3~0.5。プロンプトに応じて試行が必要です

  • ポジティブプロンプト: トリガーワードは不要ですが、Fluxを誘導するためにphoto、photographなどの写真関連用語を使用してください。以下のように開始できます。これはトレーニングデータセットのタグ付け方法です

    • 全身写真の

    • 中距離ショットの写真の

    • 自撮り写真の

    • クローズアップ写真の

    • またはお好みで(ステップ数や重みはプロンプトに合わせて調整してください)。詳細なプロンプトが最良です

  • 問題: 発生した場合は重みを減らしてください

    • 手の描画

    • テキスト

    • 背景の人物

    • 肌の質感 - 完璧ではありません。私も好ましく思っておらず、改善方法を模索中です

Buzzにチップを送ってくれた皆様に感謝いたします。このバージョンが実現できました。心からの感謝を込めて:

  • plectrudecatastrophe

  • Paper_Cranes

  • congo2008

  • 蒸留されたCFGスケール: 2.5~4

  • サンプリング手法とスケジュールタイプ: Heun with BETA、DEIS with DDIM、または[Forge] Flux Realistic (Slow) with Beta / DDIM

  • ステップ数: 20以上(時に20、30、35、40を使用します。画像が収束するステップ数を確認してください。ご自身で試してみてください)

  • 解像度: 1344x1728、1248x1824、または1440x1800。896x1152も動作しますがhires fixが必要です

  • チェックポイント: flux1-dev-Q8_0.gguf(私はQ8を使用し、FP8やQ4、その他の量子化でのテストはしていません)

  • Loraの重み: 0.3~0.5がベストです

  • ポジティブプロンプト: これら2つのバージョンはトリガーワード不要です。「photo of」や「photograph of」、「Shot on iPhone photo of」、「This Image features」などお好きなものを使えます(他の方の例では異なるプロンプトでも良い結果を得ています)。多くのテストの後、このページ右側に追加したトリガーワードで良い結果が得られました。使っても使わなくても自由ですが、データセットはGPT4Oでキャプションされており、詳細なプロンプトが最良の結果を生みます

Buzzにチップを送ってくれた皆様に感謝いたします。このバージョンが実現できました。心からの感謝を込めて:

  • kudzueye

  • 蒸留されたCFGスケール: 2.5~4

  • サンプリング手法とスケジュールタイプ: Heun with BETA、DEIS with DDIM、または[Forge] Flux Realistic (Slow) with Beta / DDIM

  • ステップ数: 20以上(時に20、30、35、40を使用します。画像が収束するステップ数を確認してください。ご自身で試してみてください)

  • 解像度: 896x1152、1152x896、または1024x1024(これより高解像度でも生成可能です。FluxとこのLoraは対応可能です)

  • チェックポイント: flux1-dev-Q8_0.gguf(私はQ8を使用し、FP8やQ4など他の量子化でのテストはしていません)

  • Loraの重み: 0.6~1

  • ポジティブプロンプト: 他のプロンプトでも効果があればそれを使ってください。私はこのLoraをテストするためにこれらの例を挙げています。Redditなどで異なるプロンプトが使われているのも見かけます

    • 常に「Amateur photography of」で開始し、「on flickr in 2007, 2005 blog, 2007 blog」で終わらせること

      • 最良の結果を得るには以下の形式が推奨されます: Amateur photography of <被写体の説明>, <シーンの説明>, <画像品質タグ>, on flickr in 2007, 2005 blog, 2007 blog

データセットのキャプション方法:

  • トレーニングデータセットのキャプションはGPT4oで作成しました。詳細なキャプションがこのLoraで最良の効果を発揮します

このLoraがお気に入りであればBuzzへの寄付をぜひご検討ください。非常に感謝されます

もし気に入らない場合や建設的なフィードバックがあれば、その点をコメントで教えてください。次バージョンで対応します

建設的なフィードバックなしにただ不満を言うだけなら、コメントは他所でお願いします

前の画像
ZavyChromaXL - b1
次の画像
ディズニーアニメーション [Illustrious & Pony] - [illustrious]

モデル詳細

モデルタイプ

LORA

ベースモデル

Flux.1 D

モデルバージョン

v5-beta

モデルハッシュ

8840a76daf

学習済みワード

Hack Forums scrapped posted to WhatsApp r/me_irl r/pics Shot on iPhone Bad Quality Sharp photo of

ディスカッション

コメントを残すには log in してください。