模型/UltraReal 微調 - v4

UltraReal 微調 - v4

陳嘉欣 (Chan Ka-yan)

9/1/2025

1:08:08 AM

| Discussion|

提示

使用 DPM++ 2M 取樣器以獲得平滑穩定輸出。

建議採用 30–50 步捕捉細節且不過度處理。

Beta Scheduler 仍是此檢查點的最佳選擇。

使用清晰、用逗號分隔的複雜提示詞；保持簡潔且描述性。

降低 0.1 或 0.2 的 CFG 有時能改善細節，但可能增加生成時間。

避免與 UltraRealPhoto LoRA 一起使用此檢查點，防止圖像過度渲染；改用 Realism Amplifier。

在提示中使用高解析度可幫助避免低解析度輸出問題。

版本亮點

美學提升，解剖略有下降

V4
好了，這個版本有什麼新內容？我提高了美學調節，增加了更多年齡多樣性，並改進了處理亞洲特徵的能力。但——因為總有但——我發現手部變得有點怪異。唉，不能事事如意。

我強烈建議將此與我的 LoRA 配合使用，如 realism amplifier、2000s analog core 等，因為此檢查點最適合作為風格化 LoRA 的基礎。可能還會做一個版本（說實話，我覺得 v3 和 v4 有點瑕疵），但首先我會開始微調 Flex.Alpha。
此次可用版本：bf16、fp8、q8_0 - 修剪 fp16 版本名和 q4_k_m - 修剪 fp8 版本名
附言：請勿將我的 UltraRealPhoto LoRA 與此檢查點一起使用——它對風格影響巨大，會導致圖像過度渲染。如果正在使用 UltraReal 微調，請改用 Realism Amplifier 獲得最佳效果。UltraRealPhoto LoRA 用於修正差勁的陰影、光線和人臉，但這些問題已在檢查點中解決，只需添加放大器即可提升真實感

V3 更新（實驗性）
此版本是向前邁出的一步，但仍處於開發中。我專注於改善幾個關鍵部分，比如裸體、腳和下半身解剖結構。儘管結果較之前有所提升，但還未達到理想水準。此版本帶來明顯的品質和紋理提升，生成效果較早期版本更細緻精緻。

推薦設置：

CFG 比例：3（前幾版本為 2.5）
步數：50（有助穩定，但手和手指仍有輕微不穩定）
CFG 0.9 比較 1.0：降低到 0.1 或 0.2 有時能改善細節（但不一定，建議自己嘗試），不過生成時間可能更長。

關於裸體：仍未達理想效果，我正積極解決，預計下版本改進。

好消息是我已備妥V3.5所需數據集，打算比V2至V3之間的間隔更快發布。經過本版本經驗與反饋，我信心十足下一次更新將帶來顯著提升。

附言：我越微調 Flux，似乎其他部分品質反而下降。也想試微調 Flex Alpha（這個項目看起來很有前景）

v2.0 有何新意？

加強解剖：手、腳和姿勢有重大改善，更自然準確。告別過度扭曲四肢！
優化紋理與品質：肌膚細節升級，紋理更豐富，整體效果更銳利。偶有模糊圖像，但頻率遠低於前版本或僅用 LoRA 時。
改進文字渲染：提升圖像中文字生成表現，比以前好多了。但仍可能出現異常符號或無法識別字詞，尚在持續改進中。
擴充數據集：更大且更多元數據集（1800 張圖），風格、光源與構圖平衡更佳。

新增檢查點變體

為了兼容不同工作流程，我加入多個檢查點版本：

BF16
FP8
Quant 8 (Q8)
Quant 4 (Q4)
NF4

根據測試，Quant 8 (Q8)在質量上略勝 FP8，細節更細膩且資源需求合理，當然其他版本也表現良好。請根據您的配置選擇最合適版本。

已知限制

NSFW 功能：本版本仍較弱。不過，針對 NSFW 內容的小範圍微調已在開發中。
文字渲染：文字生成雖改進，但仍偶發符號異常或文字不全。但發現使用 t5xxl fp16 替代 fp8 有助於文字表現改善

最佳使用建議

取樣器：使用 DPM++ 2M 取樣器可獲得平滑且一致的輸出。
步數：建議 30–50 步，既能捕捉細節又避免過度處理。
排程器：Beta Scheduler 是此檢查點的最佳選擇。

提示詞小技巧
最佳提示詞風格是詳盡、清晰，用逗號分隔短語。雖然可以創意講故事，但不必要的描述（如“這玩意讓風格更復古”）不會提升效果。保持簡潔且聚焦必需視覺細節以達最佳效果。

未來計劃

我致力繼續開發此微調，下一次更新或將聚焦：

擴充 NSFW 功能
提升邊緣情況，如動態姿勢與光線場景
改進文字渲染，呈現更銳利精確結果

附言：如果你仍未得到理想真實效果，試著添加我的 UltraReal LoRA，對我幫助很大

Ultra-Realistic Flux 微調 v1

這是我首次嘗試微調檢查點，基於 UltraReal LoRA 基礎並用擴充數據集搭建。目標是推動真實感至新層次，找到業餘美感與專業高質視覺之間的平衡點。

儘管只是初版且仍有提升空間，結果已不錯（手和腳有時會出錯，但情況不嚴重，仍優於預設 Flux）。這個微調不只是業餘質量，還能呈現專業級圖像，細節出色，陰影和光照逼真。是一款多功能模型，旨在發掘更廣泛的真實圖像生成可能性。

這仍屬開發中版本，我分享它以收集反饋及觀察更多人創意使用方式。若您測試，期待看到您的想法或成果！
同時我也上傳了兩個版本：fp16（在 ComfyUI 內最好配合 e5m2 使用）以及 fp8 和 Q4_0

🌟 本次微調新內容

數據集擴充：將原本 LoRA 數據集幾乎翻倍，涵蓋更多元的風格、光影與構圖。
提升真實感：更銳利細節，豐富紋理及自然光影，彌合 AI 圖像與真實之間的差距。
多樣性：從休閒業餘風快照到電影級專業渲染，微調能適應多種創作需求。
加強解剖：相比基礎 Flux 模型，手部、肢體與動作更自然。

💡 最佳使用提示

使用DPM++ 2M 取樣器獲得平滑穩定輸出。
建議採用30–50 步達到細節與效率平衡。
選擇Beta Scheduler以獲得最佳渲染效果。

⚡ 為何微調？

此微調旨在克服預設 Flux 模型的一些限制，加強處理複雜場景的能力，同時在各類提示詞下維持穩定品質。目標簡單：讓超真實圖像生成變得易用、可靠且視覺驚艷，無須無盡調整。

附言：我計劃繼續訓練此模型，以打造具最佳解剖與真實感的終極檢查點。本版本 NSFW 表現尚佳（將在下一版本修復）
附言二：目前偶爾會得到低解析度圖片（尚不清楚觸發原因，但會尋找解決方法）。似乎在提示詞中使用高解析度有助避免此問題。