模型/UltraRealistic Lora Project - Flux - v2

UltraRealistic Lora Project - Flux - v2

10/8/2025

1:00:57 AM

提示

針對 ComfyUI 使用 Flux 模型：CFG=1、Guidance=2.5、Scheduler=Beta、Sampler=dpmpp_2m、Steps=40、Strength 介於0.8到1.0（通常設為1.0，若手部品質下降則調整至0.87）。

針對 ComfyUI 使用 SD3.5 模型：CFG=1、Guidance=3.5、Scheduler=sgm_uniform、Sampler=dpmpp_2m、Steps=40、Strength 介於0.5到1.0（通常設為0.7）。

考慮擴充數據集，增加更多多樣姿勢，以提升未來更新中解剖學的準確性。

創作者贊助

如果您想支持 Flux 模型的工作與未來更新，請訪問並捐助於 https://ko-fi.com/danrisi。

主要目標是創造更有「生命力」的影像，擁有更生動的情感和更動態的姿勢，並帶有些許業餘質感（同時也能產生高質量影像）。

附註：感謝所有人的反饋！我注意到大家（不僅僅是這裡）提出的解剖學問題，並且一直收集你們的報告和範例。我正在考慮採取幾個方案來解決這些問題：

訓練一個完整的檢查點，這可能是更合理的方式，以達成穩定的改進。
擴充數據集，增加涵蓋更多多樣姿勢的照片，以提升解剖學的準確性。

非常感謝大家的意見，這對我塑造未來更新非常有幫助。

附註二：我已將訓練搬到 RunPod 平台，以確保穩定且高質的成果。如果你願意支持我的工作及未來更新，可以透過 Ko-fi 捐助。因為我計劃微調完整模型，而不僅是 LoRa。https://ko-fi.com/danrisi

我在 ComfyUI 用於 Flux 的設置:
CFG=1、Guidance=2.5、Scheduler=Beta、Sampler=dpmpp_2m、Steps=40、Strength=設定在0.8至1.0之間表現良好，通常用1，但若手部品質變差會調整至0.87。

我在 ComfyUI 用於 SD3.5 的設置:
CFG=1、Guidance=3.5、Scheduler=sgm_uniform、Sampler=dpmpp_2m、Steps=40、Strength=設定在0.5至1.0之間表現良好，通常用0.7。

V2 - Flux

為您的創作帶來更逼真與多功能性，包含重大提升的穩定性、解剖學及整體品質。此更新使 LoRA 更具適應性，讓您能依提示詞調整不同質量層次——從高解析真實感到刻意較低質量美學。

於1048張圖片訓練完成。

更新內容：

穩定性改進：新版更穩定，且對文本提示反應更佳，輸出更流暢且可預測。

強化手部及解剖學：手部與身體解剖更細緻，提高生動感。

品質彈性：經由適當提示詞，可調整高品質或低品質美學（有範例）。

V1.2 for SD3.5 - Large

決定為 sd3.5 推出接近相同設定的版本。個人覺得表現不錯，但發現解剖學方面有些問題（某些時候甚至比 Flux 還差），不過美學（色彩、對比等）看起來比 Flux 更佳。我認為 sd3.5 有潛力，也許未來版本會採用 sd3.5。

V1.2

更換了數據集一半的圖片，修改提示詞風格，改進手部表現，夜景中減少「手電筒效應」，整體 LoRa 品質提升（希望如此）。
在這版本中不需使用大量「觸發詞」像 V1，僅需加入幾個所提及的觸發詞即可。

訓練了另一個業餘 Lora（這在這裡已經做過很多次）。

不過我加入了2000年代的部分圖片，並新增約700張圖片。至今效果還不錯，但在品質優化上有爭議，本來希望能幫助控管品質，但看來反而讓模型感到困惑。數據集中有許多不同層次的品質，例如：

1）高解析度手機拍攝照，無可見瑕疵，清晰銳利

2）低解析度數位相機拍攝的業餘照，無明顯 JPEG 壓縮瑕疵，略帶雜訊

3）中等解析度手機拍攝照，因為低光環境略帶顆粒感，無明顯數位瑕疵

以及其他各種組合和變化。我想下一版會移除這類照片。但這版對我來說表現最佳的是：

低解析度數位相機拍攝的業餘照，無明顯 JPEG 壓縮瑕疵，略帶雜訊。