穿著白色比堅尼和太陽眼鏡的女子在遊艇上休憩,背景是邁阿密天際線,晴朗的天空
一位穿著閃亮紅裙、戴著黑色太陽眼鏡、髮型蓬鬆的女子,站在霓虹燈照耀下邁阿密夜晚的紅色 Lamborghini 旁。
一名穿白色西裝戴太陽眼鏡的女子站在邁阿密棕櫚樹及辦公摩天大樓前,明亮藍天下,視角為低角度。
1980年代風格的警察戴著太陽眼鏡和厚實的黑色小鬍子,靠著一輛白色警車,背景有棕櫚樹和辦公大樓,手持有粉紅糖霜的甜甜圈。

推薦提示詞

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

2005 blog

推薦參數

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, Heun

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 896x1152

other models

amateurphotov2-000049 (771781fd6719), flux1-dev-Q8_0 (52cfce60d7)

推薦高解析度參數

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

10

提示

你需根據提示詞嘗試調整 Lora 權重;推薦權重依版本不同介乎 0.3-0.5 至 0.6-1。

使用詳細的攝影相關提示詞能更好引導模型;建議用 photo、photograph 或包含相機類型、日期等用詞。

若出現手部、文字、背景人物或皮膚質地問題,嘗試降低 Lora 權重。

若硬體允許,可直接生成更高解析度如 1344x1728 圖像。

數據集標註由 GPT4o 製作,詳細標註效果最佳。

版本亮點

GPT4o 提示語:

我計劃為 Stable Diffusion 文本到圖像模型訓練一個 LoRA,該模型架構中使用 T5XXL 變壓器。提示詞應使用自然語言並遵循特定格式。我會上傳圖片,需你協助根據圖片創建詳細提示詞。提示詞需以 "Amateur photography of" 開頭,以 "on flickr in 2007, 2005 blog, 2007 blog." 結尾,且請用一段落給出提示語。
格式應為:
主題描述:詳細描述圖片中所有人物。務必包含種族、族群、身體特徵(如身高、體型、膚色、髮色)、面部特徵、服裝及表情或姿勢。盡可能具體。一定要包含體型描述(如大尺碼、纖瘦、嬌小),不可遺漏。
場景描述:準確描述人物在圖中的動作。敘述環境、背景元素、互動物件及整體場景(都市、鄉村、室內、戶外等)。
畫質標籤:加入描述圖像品質的標籤。用詞例如輕微動態模糊、雜亂背景、暖色調、明亮自然光、高對比、鮮豔色彩等。這些標籤應反映圖像的氛圍及感覺。
最終輸出應將上述元素組合成一個連貫、詳細且準確反映圖片的提示詞。

大家好,請在使用 Lora 之前閱讀此文

  • 精煉的 CFG 比例:3.5

  • 取樣方法及時間表類型:DEIS 搭配 DDIM

  • 步數:20

  • 解析度:896x1152

    • Hires fix 模型:4x_NMKD-Superscale-SP_178000_G

    • 步數:10

    • 去噪:0.3

    • 放大倍數:1.5

  • Lora 權重:0.8。需根據提示詞自行嘗試調整

  • 精煉的 CFG 比例:2.5 至 4

  • 取樣方法及時間表類型:Heun 搭配 BETA 或 DEIS 搭配 DDIM 或 [Forge] Flux Realistic (慢速) 配合 Beta / DDIM

  • 步數:≥20(有時我用 20、30、35 或 40 步,請自行測試圖像何時收斂)

  • 解析度:896x1152(我確認此解析度可用,因部分用戶不喜歡我說要用高解析度生成)– 但必須使用 hires fix。以下為我示範圖所用設置

    • Hires fix:4x 超銳利,0.4 去噪,10 步(我不是最佳放大專家,有其它放大法可替代)

    • 若可行,也可直接生成 1344x1728

  • 檢查點:flux1-dev-Q8_0.gguf(我用 Q8 版本,未測試 FP8、Q4 或其它量化)

  • Lora 權重:0.3-0.5,需依提示詞自行嘗試

  • 正面提示詞:無需觸發詞,但必須用攝影相關詞彙引導 Flux(如 photo、photograph 等)。可從以下用詞起步,這是我標記訓練數據集的方式

    • 全身照

    • 中景照

    • 自拍照

    • 特寫照

    • 或任何你想要的(根據提示詞調整步數、權重),詳細提示最有效

  • 問題:如果遇到,請減小權重

    • 手部

    • 文字

    • 背景人物

    • 皮膚質感 - 尚不完美,我也不喜歡,正嘗試改善

感謝所有給予 Buzz 小費,讓此版本得以誕生的朋友。特別鳴謝:

  • plectrudecatastrophe

  • Paper_Cranes

  • congo2008

  • 精煉的 CFG 比例:2.5 至 4

  • 取樣方法及時間表類型:Heun 搭配 BETA 或 DEIS 搭配 DDIM 或 [Forge] Flux Realistic (慢速) 配合 Beta / DDIM

  • 步數:≥20(有時我用 20、30、35 或 40 步,請自行測試圖像何時收斂)

  • 解析度:1344x1728 或 1248x1824 或 1440x1800。896x1152 也可用,但必須用 hires fix

  • 檢查點:flux1-dev-Q8_0.gguf(我用 Q8 版本,未測試 FP8、Q4 或其它量化)

  • Lora 權重:0.3-0.5 是最佳範圍

  • 正面提示詞:這兩版本不需觸發詞,你可以用 photo of、photograph of、Shot on iPhone photo of、This Image features 或任何你想用的(參見其他用戶示例,有些用不同提示法仍有好結果)。經多次測試,我在本頁右側添加的觸發詞效果非常好。如要使用,可用;不想用,也行。請記得數據集是用 GPT4O 標註,詳細提示最佳

感謝所有給予 Buzz 小費,讓此版本得以誕生的朋友。特別鳴謝:

  • kudzueye

  • 精煉的 CFG 比例:2.5 至 4

  • 取樣方法及時間表類型:Heun 搭配 BETA 或 DEIS 搭配 DDIM 或 [Forge] Flux Realistic (慢速) 配合 Beta / DDIM

  • 步數:≥20(有時我用 20、30、35 或 40 步,請自行測試圖像何時收斂)

  • 解析度:896x1152、1152x896 或 1024x1024(也可生成更高解析度,Flux 和此 Lora 都可處理)

  • 檢查點:flux1-dev-Q8_0.gguf(我用 Q8 版本,未測試 FP8、Q4 或其它量化)

  • Lora 權重:0.6-1

  • 正面提示詞:如果你已有其他適用提示詞,直接用即可。我僅分享我測試 Lora 的方法。看到這裡及 Reddit 上有多種提示詞用法

    • 常以 "Amateur photography of" 開頭,以 "on flickr in 2007, 2005 blog, 2007 blog" 收尾

      • 提示詞形式應為:Amateur photography of <主題描述>, <場景描述>, <畫質標籤>, on flickr in 2007, 2005 blog, 2007 blog

數據集如何標註?:

  • 我使用 GPT4o 為訓練數據集做標註。詳細標註對此 Lora 最有效

如果你喜歡這個 Lora 並願意贊助 Buzz,將非常感激

如果不喜歡且有建設性反饋,請留言說明問題,我會嘗試在下個版本修正

如果沒有建設性反饋,只是想抱怨,請移步他處發表評論

上一個
chromeBot robots/cyborg portrait - v0.1
下一個
Wanderer's Detailed Portraits | FLUX - v1.0

模型詳情

模型類型

LORA

基礎模型

Flux.1 D

模型版本

v2.0

模型雜湊值

61cff4eebd

訓練詞彙

Amateur photography
on flickr in 2007
2005 blog
2007 blog

討論

log in以發表評論。