UltraRealistic Lora Project - Flux - v2
推薦參數
samplers
steps
cfg
提示
針對 ComfyUI 使用 Flux 模型:CFG=1、Guidance=2.5、Scheduler=Beta、Sampler=dpmpp_2m、Steps=40、Strength 介於0.8到1.0(通常設為1.0,若手部品質下降則調整至0.87)。
針對 ComfyUI 使用 SD3.5 模型:CFG=1、Guidance=3.5、Scheduler=sgm_uniform、Sampler=dpmpp_2m、Steps=40、Strength 介於0.5到1.0(通常設為0.7)。
考慮擴充數據集,增加更多多樣姿勢,以提升未來更新中解剖學的準確性。
創作者贊助
如果您想支持 Flux 模型的工作與未來更新,請訪問並捐助於 https://ko-fi.com/danrisi。
主要目標是創造更有「生命力」的影像,擁有更生動的情感和更動態的姿勢,並帶有些許業餘質感(同時也能產生高質量影像)。
附註:感謝所有人的反饋!我注意到大家(不僅僅是這裡)提出的解剖學問題,並且一直收集你們的報告和範例。我正在考慮採取幾個方案來解決這些問題:
訓練一個完整的檢查點,這可能是更合理的方式,以達成穩定的改進。
擴充數據集,增加涵蓋更多多樣姿勢的照片,以提升解剖學的準確性。
非常感謝大家的意見,這對我塑造未來更新非常有幫助。
附註二:我已將訓練搬到 RunPod 平台,以確保穩定且高質的成果。如果你願意支持我的工作及未來更新,可以透過 Ko-fi 捐助。因為我計劃微調完整模型,而不僅是 LoRa。https://ko-fi.com/danrisi
我在 ComfyUI 用於 Flux 的設置:
CFG=1、Guidance=2.5、Scheduler=Beta、Sampler=dpmpp_2m、Steps=40、Strength=設定在0.8至1.0之間表現良好,通常用1,但若手部品質變差會調整至0.87。
我在 ComfyUI 用於 SD3.5 的設置:
CFG=1、Guidance=3.5、Scheduler=sgm_uniform、Sampler=dpmpp_2m、Steps=40、Strength=設定在0.5至1.0之間表現良好,通常用0.7。
V2 - Flux
為您的創作帶來更逼真與多功能性,包含重大提升的穩定性、解剖學及整體品質。此更新使 LoRA 更具適應性,讓您能依提示詞調整不同質量層次——從高解析真實感到刻意較低質量美學。
於1048張圖片訓練完成。
更新內容:
穩定性改進:新版更穩定,且對文本提示反應更佳,輸出更流暢且可預測。
強化手部及解剖學:手部與身體解剖更細緻,提高生動感。
品質彈性:經由適當提示詞,可調整高品質或低品質美學(有範例)。
V1.2 for SD3.5 - Large
決定為 sd3.5 推出接近相同設定的版本。個人覺得表現不錯,但發現解剖學方面有些問題(某些時候甚至比 Flux 還差),不過美學(色彩、對比等)看起來比 Flux 更佳。我認為 sd3.5 有潛力,也許未來版本會採用 sd3.5。
V1.2
更換了數據集一半的圖片,修改提示詞風格,改進手部表現,夜景中減少「手電筒效應」,整體 LoRa 品質提升(希望如此)。
在這版本中不需使用大量「觸發詞」像 V1,僅需加入幾個所提及的觸發詞即可。
V1
訓練了另一個業餘 Lora(這在這裡已經做過很多次)。
不過我加入了2000年代的部分圖片,並新增約700張圖片。至今效果還不錯,但在品質優化上有爭議,本來希望能幫助控管品質,但看來反而讓模型感到困惑。數據集中有許多不同層次的品質,例如:
1)高解析度手機拍攝照,無可見瑕疵,清晰銳利
2)低解析度數位相機拍攝的業餘照,無明顯 JPEG 壓縮瑕疵,略帶雜訊
3)中等解析度手機拍攝照,因為低光環境略帶顆粒感,無明顯數位瑕疵
以及其他各種組合和變化。我想下一版會移除這類照片。但這版對我來說表現最佳的是:
低解析度數位相機拍攝的業餘照,無明顯 JPEG 壓縮瑕疵,略帶雜訊。






