模型/SDXL / Flux.1 D - 啞光（Vanta）黑 - 實驗 - SDXL v2.0

SDXL / Flux.1 D - 啞光（Vanta）黑 - 實驗 - SDXL v2.0

陳嘉欣 (Chan Ka-yan)

8/18/2025

2:11:08 AM

| Discussion|

提示

Flux 模型與其他增添色彩或特定風格的 LoRA 模型混合使用效果最佳。

該模型可以在少量步驟後完美複製圖像，甚至照片。

當存在光源時，Flux 傾向自動添加暗環境以強化對比。

用 4060 TI（16GB）512x 分辨率訓練時，每次迭代大約需 3.95 至 5.15 秒，Rank 4。

Flux 是在極暗帶微弱形狀的圖像上訓練的，數據集準備具挑戰性。

沒有明確推薦的正面或負面提示詞，鼓勵用戶自行實驗。

根據組合和使用情況，預期變化可能微妙或極端——創意探索為關鍵。

版本亮點

更多圖片
尺寸更小

Flux.1 D - V2.0

最後一次嘗試讓它在 Flux 中運作……而我所說的「運作」是指盡可能搞砸一切。它很可能永遠無法達到 SDXL 版本當時的效果。即使經過 6000 步訓練，僅憑觀察也能明顯看出差異。SDXL 就像是“好吧，我會學習，但會加入我自己的風格”，而 Flux 則是對任何不明白如何處理或準確學習的東西進行激烈對抗／補償。另一方面，經過長時間的訓練後，它會徹底產出那些圖像，甚至會將訓練數據一字不差地複製過來，導致幾乎純黑的結果。Flux 可以完美複製一張圖像，像照片一樣，即使只經過幾步。

就像我在上一個 Flux 版本中說的，它大部分時間是我想和其他更有色彩或帶有特定風格的 LoRA 混合使用的東西。

和 SDXL v3.0 使用了相同的圖片，Flux 版本則加入了不少新圖（部分為橫向格式）。不過，我刪除了 3 張極有可能導致我或其他人發布的圖片中至少 80% 的圖片。這原本是我想在 SDXL 版本中做的，但當時決定不這麼做。原因大致是那些圖片過於主導，引起大量奇怪行為並偏向生成特定圖像。在 v1.0 Flux 版本中看到了這問題，現在已經移除。人氣可能會因此有所下降，但我無所謂。

我覺得很多人只是因為該 LoRA 在他們的「流程」中就使用它。有些情況下沒有 LoRA 產出的圖片反而更好，且你可能永遠不會知道。風格 LoRA 就不同了，因為它們會為生成的圖片加入明顯的風格。這玩意兒卻有很大潛力把一切搞砸，所以我沒刻意精選我發布的圖片，只想展示我的意思。如果加入強烈光暈或光源（如蠟燭），Flux（還有一些 SDXL 模型）會自動添加暗環境，因為光源總是需要一定的黑暗才能被察覺（比如晴天車頭燈幾乎沒什麼作用）。

別問它是否能在 NF4 或 QQUFUF 版本 5.64.3255 K4 2 或其他什麼上運作。文件不算大，你可以自己測試。除非這些模型能帶來比普通 FP8/16 Dev 版本更多好處，而非僅僅是降低記憶體用量和／或微不足道的速度提升（甚至是速度下降），否則我會保持距離。

我知道如果剛習慣某個模型卻在短時間內有新版本發布會有多煩人。我不會繼續追這個版本，只會觀察我自己或其他人是否能從中獲得有用的東西。

另外，為圖片在 Photoshop 裡準備的工作量不值得，尤其知道不會改變什麼。寧可做些新鮮的、可能愚蠢的東西，那才有趣或會產生隨機效果……或者就給舊模型 Flux 化，看看會發生什麼。

Flux.1 D - V1.0

經過一些和 Kohya 及其他工具的嘗試，以及用 Flux 成功測試了比較奇怪的 LoRA 概念後，我決定試試這個看它是否有效。其實我的目標並非製作 Flux 版本，因為 Flux 在大部分情況下對對比度處理得不錯。我主要目標是擺脫那種令人討厭的人工／假象外觀，我認為如此「未定義」的數據集應該有用。結果嘛，有時有用，有時反而更糟。

和 SDXL 版本類似，它更適合與其他增加色彩的 LoRA 一起使用。

抱歉在提示詞和圖片上有點懶散。基本使用了 V3.0 的相同素材，暫時足夠做展示用。有時細節會被犧牲，且不會添加特別有趣的元素（例如水母圖片或鸚鵡）。

相應圖片用相同種子。
前兩張圖分別是有和無 LoRA，之後則相反，先無後有 LoRA（有時強度不同）。
部分圖使用了觸發詞，但我懷疑 Flux 可能不需要。
基於 V1.0 數據集，而非新數據集（不想用太多圖片）。

不確定是否會做更多 Flux 的 LoRA，但會做不少測試。目前各種版本混亂不清，也覺得不值得花大量時間做可能 10 小時後就過時的東西。

順便說一句：這是用 4060 TI（16GB）訓練的，最大 VRAM 用量介於 14.4 至 15.2 GB，512x 分辨率，Rank 4，訓練速度約 3.95s/迭代至 5.15s/迭代……所以不需要 4090。當然用 4090 會更快，但如果你能邊跑邊做其他事也沒什麼問題，除非想測試性能。

像往常一樣，我會時不時使用它，看看能否從中得到有意義的東西。更可能是滿足我的好奇心。

V.3.0

在我弄砸 v2.0 後，我確保這次是正牌，沒有合併什麼的。剛開始對添加大量圖片是否會使其偏離第一版有所懷疑，幸好沒有。

很高興看到很多人找到了使用這個 LoRA 的方法，並創作許多圖片。考慮到它本來並不打算做現在這些事，看到它有另一個用途還是挺令人欣慰的（就像所有 LoRA 一樣）。

這很可能是相當長時間內的最後一個版本，因為僅僅加更多圖片不會改變主要效果。大部分還是通過使用不同模型、LoRA 組合和提示詞實現。

我計劃更多專注於創作圖片以發掘組合（也放鬆一下）、製作新的奇怪 LoRA、修復舊 LoRA 等。此外我下載了很多人的作品，但多數沒時間用。

再次感謝迄今上傳的所有圖片，希望能看到更多。儘管每個 LoRA 在這快速變動的 AI 領域都有壽命，花俏元素終究會消退。:)

V2.0

V2.0 的小公告（視乎你所在國家是 02.04 還是 04.02）

嗯，我正式承認自己是個笨蛋。

我開始訓練另一個 LoRA，發現即使 2000 步後樣本圖片都沒出現任何變化，這幾乎不可能。所以我尋找原因，發現我沒改回或正確設定的一個參數——LR 預熱。通常我不使用預熱步數，但之前測試過它到底有什麼作用。那時用的是僅有 4 張圖的數據集。我一般設定 100 個 Epoch，但設置成每 500 步輸出一次模型，而非每個 Epoch。預熱設定為 32%，所以 4 張圖 x 10 重複 x 100 Epoch = 4000 步（32% 預熱即 1280 步幾乎沒什麼運算發生）。

現在這個 LoRA 設定相同，不過是 60 張圖（60 x 10 x 100 = 60000 步 - 32% 預熱 = 19200 步）……所以即使 12000 步後還沒開始運作，意味著我幾乎訓練了白工。這點解釋了不少事情。因為睡著了沒注意，即使初期效果慢，我本以為是圖像本身問題。

是啊……這個版本是個失敗品，它的大部分效果來源於與 V1.0 的合併。

我週末會回來後用正確設定重新訓練它。

真的很抱歉。也許只是個無意的愚人節玩笑 :) .... :(

最近我用它挺多，也沒多久沒上傳新 LoRA，主要因為工作太忙，還選了很多令人頭疼且必須用最繁複方式完成的主題……其他都沒意思。

此外，我投入大量時間拆解 Pony，這方面一些結果讓我挺驚訝。若拋開所有 Furry、動漫和一般色情內容，它其實比 Base XL 更基礎，適合通過 LoRA 訓練添加概念和風格，但又懂得更多複雜東西，比如定位、情緒、奇怪角度等……這又是另外一回事了。

不確定今年還能做多少訓練了。或許中間會做些簡單的事，但誰知道呢。AI 發展快，或許下月甚至下週就有新花樣。