UltraReal 微調 - v4
推薦提示詞
d1g1cam, amateur photo, low-lit, Low-resolution photo, shot on a mobile phone
推薦參數
samplers
steps
cfg
提示
使用 DPM++ 2M 取樣器以獲得平滑穩定輸出。
建議採用 30–50 步捕捉細節且不過度處理。
Beta Scheduler 仍是此檢查點的最佳選擇。
使用清晰、用逗號分隔的複雜提示詞;保持簡潔且描述性。
降低 0.1 或 0.2 的 CFG 有時能改善細節,但可能增加生成時間。
避免與 UltraRealPhoto LoRA 一起使用此檢查點,防止圖像過度渲染;改用 Realism Amplifier。
在提示中使用高解析度可幫助避免低解析度輸出問題。
版本亮點
美學提升,解剖略有下降
V4
好了,這個版本有什麼新內容?我提高了美學調節,增加了更多年齡多樣性,並改進了處理亞洲特徵的能力。但——因為總有但——我發現手部變得有點怪異。唉,不能事事如意。
我強烈建議將此與我的 LoRA 配合使用,如 realism amplifier、2000s analog core 等,因為此檢查點最適合作為風格化 LoRA 的基礎。可能還會做一個版本(說實話,我覺得 v3 和 v4 有點瑕疵),但首先我會開始微調 Flex.Alpha。
此次可用版本:bf16、fp8、q8_0 - 修剪 fp16 版本名和 q4_k_m - 修剪 fp8 版本名
附言:請勿將我的 UltraRealPhoto LoRA 與此檢查點一起使用——它對風格影響巨大,會導致圖像過度渲染。如果正在使用 UltraReal 微調,請改用 Realism Amplifier 獲得最佳效果。UltraRealPhoto LoRA 用於修正差勁的陰影、光線和人臉,但這些問題已在檢查點中解決,只需添加放大器即可提升真實感
V3 更新(實驗性)
此版本是向前邁出的一步,但仍處於開發中。我專注於改善幾個關鍵部分,比如裸體、腳和下半身解剖結構。儘管結果較之前有所提升,但還未達到理想水準。此版本帶來明顯的品質和紋理提升,生成效果較早期版本更細緻精緻。
推薦設置:
CFG 比例:3(前幾版本為 2.5)
步數:50(有助穩定,但手和手指仍有輕微不穩定)
CFG 0.9 比較 1.0:降低到 0.1 或 0.2 有時能改善細節(但不一定,建議自己嘗試),不過生成時間可能更長。
關於裸體:仍未達理想效果,我正積極解決,預計下版本改進。
好消息是我已備妥V3.5所需數據集,打算比V2至V3之間的間隔更快發布。經過本版本經驗與反饋,我信心十足下一次更新將帶來顯著提升。
附言:我越微調 Flux,似乎其他部分品質反而下降。也想試微調 Flex Alpha(這個項目看起來很有前景)
v2.0 有何新意?
加強解剖:手、腳和姿勢有重大改善,更自然準確。告別過度扭曲四肢!
優化紋理與品質:肌膚細節升級,紋理更豐富,整體效果更銳利。偶有模糊圖像,但頻率遠低於前版本或僅用 LoRA 時。
改進文字渲染:提升圖像中文字生成表現,比以前好多了。但仍可能出現異常符號或無法識別字詞,尚在持續改進中。
擴充數據集:更大且更多元數據集(1800 張圖),風格、光源與構圖平衡更佳。
新增檢查點變體
為了兼容不同工作流程,我加入多個檢查點版本:
BF16
FP8
Quant 8 (Q8)
Quant 4 (Q4)
NF4
根據測試,Quant 8 (Q8)在質量上略勝 FP8,細節更細膩且資源需求合理,當然其他版本也表現良好。請根據您的配置選擇最合適版本。
已知限制
NSFW 功能:本版本仍較弱。不過,針對 NSFW 內容的小範圍微調已在開發中。
文字渲染:文字生成雖改進,但仍偶發符號異常或文字不全。但發現使用 t5xxl fp16 替代 fp8 有助於文字表現改善
最佳使用建議
取樣器:使用 DPM++ 2M 取樣器可獲得平滑且一致的輸出。
步數:建議 30–50 步,既能捕捉細節又避免過度處理。
排程器:Beta Scheduler 是此檢查點的最佳選擇。
提示詞小技巧最佳提示詞風格是詳盡、清晰,用逗號分隔短語。雖然可以創意講故事,但不必要的描述(如“這玩意讓風格更復古”)不會提升效果。保持簡潔且聚焦必需視覺細節以達最佳效果。
未來計劃
我致力繼續開發此微調,下一次更新或將聚焦:
擴充 NSFW 功能
提升邊緣情況,如動態姿勢與光線場景
改進文字渲染,呈現更銳利精確結果
附言:如果你仍未得到理想真實效果,試著添加我的 UltraReal LoRA,對我幫助很大
Ultra-Realistic Flux 微調 v1
這是我首次嘗試微調檢查點,基於 UltraReal LoRA 基礎並用擴充數據集搭建。目標是推動真實感至新層次,找到業餘美感與專業高質視覺之間的平衡點。
儘管只是初版且仍有提升空間,結果已不錯(手和腳有時會出錯,但情況不嚴重,仍優於預設 Flux)。這個微調不只是業餘質量,還能呈現專業級圖像,細節出色,陰影和光照逼真。是一款多功能模型,旨在發掘更廣泛的真實圖像生成可能性。
這仍屬開發中版本,我分享它以收集反饋及觀察更多人創意使用方式。若您測試,期待看到您的想法或成果!
同時我也上傳了兩個版本:fp16(在 ComfyUI 內最好配合 e5m2 使用)以及 fp8 和 Q4_0
🌟 本次微調新內容
數據集擴充:將原本 LoRA 數據集幾乎翻倍,涵蓋更多元的風格、光影與構圖。
提升真實感:更銳利細節,豐富紋理及自然光影,彌合 AI 圖像與真實之間的差距。
多樣性:從休閒業餘風快照到電影級專業渲染,微調能適應多種創作需求。
加強解剖:相比基礎 Flux 模型,手部、肢體與動作更自然。
💡 最佳使用提示
使用DPM++ 2M 取樣器獲得平滑穩定輸出。
建議採用30–50 步達到細節與效率平衡。
選擇Beta Scheduler以獲得最佳渲染效果。
⚡ 為何微調?
此微調旨在克服預設 Flux 模型的一些限制,加強處理複雜場景的能力,同時在各類提示詞下維持穩定品質。目標簡單:讓超真實圖像生成變得易用、可靠且視覺驚艷,無須無盡調整。
附言:我計劃繼續訓練此模型,以打造具最佳解剖與真實感的終極檢查點。本版本 NSFW 表現尚佳(將在下一版本修復)
附言二:目前偶爾會得到低解析度圖片(尚不清楚觸發原因,但會尋找解決方法)。似乎在提示詞中使用高解析度有助避免此問題。


