模型/SDXL / Flux.1 D - 啞光（Vanta）黑 - 實驗 - Flux.1 D v1.0

SDXL / Flux.1 D - 啞光（Vanta）黑 - 實驗 - Flux.1 D v1.0

陳嘉欣 (Chan Ka-yan)

8/31/2025

12:59:11 AM

| Discussion|

提示

Flux.1 D 最適合與其他增添色彩或風格的 LoRA 模型結合使用。

該模型強烈傾向復現訓練數據，過度訓練可能導致圖像幾乎全黑。

加入蠟燭等光源時，Flux 自然會增添黑暗環境以突出光線。

在接近黑色圖片上訓練具有挑戰性，準備數據集需要仔細處理圖片。

使用 ControlNet IP-Adapter 來增強生成圖片效果並產生隨機結果。

該模型在 4060 TI（16GB）上訓練高效，VRAM 使用介乎 14.4 至 15.2 GB。

版本亮點

Flux 版本

Flux.1 D - V2.0

最後嘗試在 Flux 令它有效…… 我所謂有效其實是盡可能搞亂一切。它很可能永遠無法再像 SDXL 版本那樣表現。即使經過 6000 步，單觀察就很明顯。SDXL 就像「好，我會學，但會加上自己的風格」，而 Flux 則是瘋狂掙扎／補償，對於不明白或不確定我要它學什麼的東西會很抗拒。另一方面，經過長時間訓練，它會完全生成那些圖像且非常準確，甚至複製訓練數據 1：1，結果幾乎是純黑。Flux 可以完美複製圖片，就像是照片一樣，即使只經過幾步。

如我在上一個 Flux 版本所說，大部分情況是想與其他更有色彩或特定風格的 LoRA 混合使用。

圖片與 SDXL v.3.0 相同，Flux 版本加了不少（部分為風景橫向格式）。但我移除了三張圖片，這三張圖片很可能是我和其他人發表圖像中 80% 的來源。這是我曾想在 SDXL 版本做但當時放棄的事。原因是這些圖片過於主導，導致很多奇怪行為和偏差生成特定圖像。這點我在 v.1.0 Flux 版本看到，現在它們已經移除了。這裡的人氣恐怕會受打擊，但我倒不介意。

我覺得很多人只是用某個 LoRA 因為它在他們的「工作流程」裡。我想。有時候不使用 LoRA 的圖片看起來更好，而且你永遠不會知道。Style LoRA 是另一回事，因為它們會明顯添加風格。但這個東西有很大可能把一切打亂，所以我沒挑選圖片，想展現我的意思。如果加入強光或燭光等光源，Flux（和某些 SDXL 模型）會自動加黑暗環境，因為光源總需要某種黑暗才能顯眼（陽光下的車頭燈效果不明顯）。

別問它在 NF4 或 QQUFUF 版本 5.64.3255 K4 2 或其他什麼環境下是否運作。這檔案不大，你可以自己試試。我會與這些模型保持距離，除非它們比普通 FP8/16 Dev 版本除減少記憶體使用和微不足道的速度提升外，有更多好處（或者不是速度變慢）。

我知道如果有人短時間內發布新版本會很煩人，特別是剛習慣舊版本時。我不會繼續追蹤這個，只看看我或其他人能否從中得到什麼有用東西。

另外，在 Photoshop 製作圖片花費的工作量不值，特別是你知道這不會改變什麼。寧願做些新東西，或者更可能做些愚蠢又有趣、產生隨機效果的事……或者也給舊模型 Fluxify 看看結果。

Flux.1 D - V1.0

經過與 Kohya 及其他工具摸索和一些意外成功的奇怪概念 LoRA 測試，我想試試這個版本是否有效。其實，我並非真的想要得到 Flux 版本，因為 Flux 在對比度方面（大部分情況）表現不錯。我的主要目標是擺脫這種令人厭惡的人工／假像感，我覺得一套「不明確」的數據集或許能達成目的。結果，有時候有效，有時更糟。

像 SDXL 版本一樣，它更適合與其他增加大量色彩的 LoRA 一起使用。

對於提示和圖片有些懶散，基本用與 V.3.0 一樣的內容，但目前展示效果足夠。有時它會損失細節，沒有添加特別精彩的東西（比如水母或鸚鵡圖片）。

對應圖片使用相同隨機種子
前兩張圖是有無 LoRA，之後反過來，先無再有（有時強度不同）
部分圖片開頭有啟動詞，但我覺得 Flux 不太需要
基於 V1.0 數據集，不是新數據集（不想用太多圖片）

不確定是否會做更多 Flux LoRA，但會測試很多。目前版本眾多，感覺花很多時間不值得，可能 10 小時後就過時了。

順帶一提：這是用 4060 TI（16GB）訓練，VRAM 使用介乎 14.4 到 15.2GB，每次迭代 3.95 至 5.15 秒，512x，Rank 4……所以不需要 4090。當然會更快，但如果你可以放著跑，順便做其他事其實沒大問題，除非你想測試些什麼。

像往常一樣，偶爾用用看能否有意義發現。大概率只是滿足我的好奇心。

V.3.0

繼我在 v2.0 犯的小錯後，我確保這次是真正的版本，沒有合併或其他操作。起初對加入大量圖片會不會讓版本偏離太多感到懷疑，但幸運的是沒發生。

很高興很多人找到這 LoRA 的用處，並創作了不少圖像。考慮到它原本並非設計來做現在的事，看到它有另一個用途（或者說能做別的事，像所有 LoRA 一樣）很不錯。

這可能（大概率）是很長時間內最後一個版本，因為再加更多圖片不會改變主要效果。大部分改變來自使用不同模型、LoRA 組合和提示。

接下來會更專注創作圖像以尋找更多組合（和放鬆一下），做些新奇怪的 LoRA，修正舊 LoRA 等。同時從其他人下載了很多資源，但大多沒機會使用。

再次感謝迄今發布的所有圖片，希望看到更多，雖然每個 LoRA 在這快速變動的 AI 領域都有壽命，華麗程度終將結束。:)

V2.0

V2.0 的小公告（根據你所在國家，可能是 02.04 或 04.02）

我正式承認我是個白痴。

當我開始訓練另一個 LoRA，發現樣本圖片即使經過 2000 步也沒有變化，這基本不可能發生。於是我找原因，發現一個沒改回（或正確設定）的設定：LR warmup。平常我不用 warmup 步驟，但之前測試時為了了解它作用而用過一次，對象數據集只有 4 張圖片。我習慣設定 100 Epochs，但模型會每 500 步輸出一個模型，而不是根據 epoch 輸出。Warm Up 設定為 32%，即 4 張 x 10 重複 x 100 Epochs = 4000 步，其中 32% 即 1280 步暖機期間變化不大。

而這個 LoRA 設定相同，但圖量有 60 張（60 x 10 x 100 = 60000 步，32% warmup 約 19200 步）……所以 12000 步後還沒開始，換句話說我訓練的大部分其實是空氣。解釋了很多問題。因為已經睡著了，我沒注意到這點，雖然當初怪怪的一開始效果很慢，我本以為是圖片本身問題。

是的……這個版本沒用，大部分效果來自混合 V1.0。

我週末下班回來會重新用正確設定訓練。

非常抱歉。或許這只是個無心的愚人節玩笑 :) .... :(

新加了幾張圖，因最近經常用這個版本，我也有一段時間沒上傳新 LoRA，主要是工作太忙，且挑戰複雜且讓人抓狂的題材……不然就是無聊。

我也花了不少時間拆解 Pony，這讓我驚訝。撇開所有 Furry、Anime 和一般色情內容，它甚至比 Base XL 模型更基礎，這對透過 LoRA 訓練添加概念和風格有利，但它了解更多複雜內容，如姿勢、情緒、怪異角度等……但那是完全不同的故事。

今年還能訓練多少我不確定。間中可能做些簡單事，但誰知道呢。AI 發展迅速，可能一個月、一週內就有新東西。