業餘攝影 [Flux Dev] - v2.0
推薦提示詞
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
2005 blog
推薦參數
samplers
steps
cfg
resolution
other models
推薦高解析度參數
upscaler
upscale
steps
提示
你需根據提示詞嘗試調整 Lora 權重;推薦權重依版本不同介乎 0.3-0.5 至 0.6-1。
使用詳細的攝影相關提示詞能更好引導模型;建議用 photo、photograph 或包含相機類型、日期等用詞。
若出現手部、文字、背景人物或皮膚質地問題,嘗試降低 Lora 權重。
若硬體允許,可直接生成更高解析度如 1344x1728 圖像。
數據集標註由 GPT4o 製作,詳細標註效果最佳。
版本亮點
GPT4o 提示語:
我計劃為 Stable Diffusion 文本到圖像模型訓練一個 LoRA,該模型架構中使用 T5XXL 變壓器。提示詞應使用自然語言並遵循特定格式。我會上傳圖片,需你協助根據圖片創建詳細提示詞。提示詞需以 "Amateur photography of" 開頭,以 "on flickr in 2007, 2005 blog, 2007 blog." 結尾,且請用一段落給出提示語。格式應為:主題描述:詳細描述圖片中所有人物。務必包含種族、族群、身體特徵(如身高、體型、膚色、髮色)、面部特徵、服裝及表情或姿勢。盡可能具體。一定要包含體型描述(如大尺碼、纖瘦、嬌小),不可遺漏。場景描述:準確描述人物在圖中的動作。敘述環境、背景元素、互動物件及整體場景(都市、鄉村、室內、戶外等)。畫質標籤:加入描述圖像品質的標籤。用詞例如輕微動態模糊、雜亂背景、暖色調、明亮自然光、高對比、鮮豔色彩等。這些標籤應反映圖像的氛圍及感覺。最終輸出應將上述元素組合成一個連貫、詳細且準確反映圖片的提示詞。大家好,請在使用 Lora 之前閱讀此文
推薦設置 (v6):
精煉的 CFG 比例:3.5
取樣方法及時間表類型:DEIS 搭配 DDIM
步數:20
解析度:896x1152
Hires fix 模型:4x_NMKD-Superscale-SP_178000_G
步數:10
去噪:0.3
放大倍數:1.5
Lora 權重:0.8。需根據提示詞自行嘗試調整
推薦設置 (v5-final):
精煉的 CFG 比例:2.5 至 4
取樣方法及時間表類型:Heun 搭配 BETA 或 DEIS 搭配 DDIM 或 [Forge] Flux Realistic (慢速) 配合 Beta / DDIM
步數:≥20(有時我用 20、30、35 或 40 步,請自行測試圖像何時收斂)
解析度:896x1152(我確認此解析度可用,因部分用戶不喜歡我說要用高解析度生成)– 但必須使用 hires fix。以下為我示範圖所用設置
Hires fix:4x 超銳利,0.4 去噪,10 步(我不是最佳放大專家,有其它放大法可替代)
若可行,也可直接生成 1344x1728
檢查點:flux1-dev-Q8_0.gguf(我用 Q8 版本,未測試 FP8、Q4 或其它量化)
Lora 權重:0.3-0.5,需依提示詞自行嘗試
正面提示詞:無需觸發詞,但必須用攝影相關詞彙引導 Flux(如 photo、photograph 等)。可從以下用詞起步,這是我標記訓練數據集的方式
全身照
中景照
自拍照
特寫照
或任何你想要的(根據提示詞調整步數、權重),詳細提示最有效
問題:如果遇到,請減小權重
手部
文字
背景人物
皮膚質感 - 尚不完美,我也不喜歡,正嘗試改善
感謝所有給予 Buzz 小費,讓此版本得以誕生的朋友。特別鳴謝:
plectrudecatastrophe
Paper_Cranes
congo2008
推薦設置 (v4-soap-testing 與 v5-beta):
精煉的 CFG 比例:2.5 至 4
取樣方法及時間表類型:Heun 搭配 BETA 或 DEIS 搭配 DDIM 或 [Forge] Flux Realistic (慢速) 配合 Beta / DDIM
步數:≥20(有時我用 20、30、35 或 40 步,請自行測試圖像何時收斂)
解析度:1344x1728 或 1248x1824 或 1440x1800。896x1152 也可用,但必須用 hires fix
檢查點:flux1-dev-Q8_0.gguf(我用 Q8 版本,未測試 FP8、Q4 或其它量化)
Lora 權重:0.3-0.5 是最佳範圍
正面提示詞:這兩版本不需觸發詞,你可以用 photo of、photograph of、Shot on iPhone photo of、This Image features 或任何你想用的(參見其他用戶示例,有些用不同提示法仍有好結果)。經多次測試,我在本頁右側添加的觸發詞效果非常好。如要使用,可用;不想用,也行。請記得數據集是用 GPT4O 標註,詳細提示最佳
感謝所有給予 Buzz 小費,讓此版本得以誕生的朋友。特別鳴謝:
kudzueye
推薦設置 (v3 與 v2):
精煉的 CFG 比例:2.5 至 4
取樣方法及時間表類型:Heun 搭配 BETA 或 DEIS 搭配 DDIM 或 [Forge] Flux Realistic (慢速) 配合 Beta / DDIM
步數:≥20(有時我用 20、30、35 或 40 步,請自行測試圖像何時收斂)
解析度:896x1152、1152x896 或 1024x1024(也可生成更高解析度,Flux 和此 Lora 都可處理)
檢查點:flux1-dev-Q8_0.gguf(我用 Q8 版本,未測試 FP8、Q4 或其它量化)
Lora 權重:0.6-1
正面提示詞:如果你已有其他適用提示詞,直接用即可。我僅分享我測試 Lora 的方法。看到這裡及 Reddit 上有多種提示詞用法
常以 "Amateur photography of" 開頭,以 "on flickr in 2007, 2005 blog, 2007 blog" 收尾
提示詞形式應為:Amateur photography of <主題描述>, <場景描述>, <畫質標籤>, on flickr in 2007, 2005 blog, 2007 blog
數據集如何標註?:
我使用 GPT4o 為訓練數據集做標註。詳細標註對此 Lora 最有效
如果你喜歡這個 Lora 並願意贊助 Buzz,將非常感激
如果不喜歡且有建設性反饋,請留言說明問題,我會嘗試在下個版本修正
如果沒有建設性反饋,只是想抱怨,請移步他處發表評論
模型詳情
模型類型
基礎模型
模型版本
模型雜湊值
訓練詞彙
討論
請log in以發表評論。






