模型/SDXL / Flux.1 D - 啞光 (Vanta) 黑 - 實驗 - SDXL v3.0

SDXL / Flux.1 D - 啞光 (Vanta) 黑 - 實驗 - SDXL v3.0

陳嘉欣 (Chan Ka-yan)

7/15/2025

1:37:43 PM

| Discussion|

提示

Flux.1 D 最適合與其他添加色彩或風格的 LoRA 混用，因其傾向生成較暗、類似照片的圖像。

預期結果不可預測且實驗性強——有時會完全複製訓練資料或生成幾乎純黑圖像。

該模型能在中階 GPU 如 4060 TI（16GB VRAM）上良好運行，並不一定需要最新的 4090。

ControlNet IP-Adapter 可增強生成圖像，但可能產生隨機效果。

沒有推薦明確、一致的正面或負面提示詞，建議進行實驗調整。

版本亮點

實際是新版本（希望如此）

Flux.1 D - V2.0

在 Flux 最後一次嘗試讓它運作……而我所謂的讓它運作是盡可能搞砸一切。它很可能永遠無法複製 SDXL 版本所做的事情。即使經過 6000 步，僅從觀察來看也十分明顯。SDXL 很像「好吧，我會學，但會加上自己的風格」，而 Flux 則是不停抗爭／調整，對任何它不知道該怎麼處理或我到底想讓它學什麼的東西都非常激烈反應。另一方面，經過長時間訓練後，它確實會嚴格生成那些圖像，甚至會到完全複製訓練數據 1:1 的程度，結果幾乎是純黑。Flux 可以完美複製圖像，如照片，即使只是幾步訓練。

就像我在上一版 Flux 裡說過，大部分時間它是我想和其他色彩更豐富或帶有特定風格的 LoRA 混合使用的東西。

與 SDXL v3.0 一樣的圖片，為 Flux 版本增加了不少（有些是橫向格式）。但我刪除了 3 張圖，這幾張圖很可能是我和其他人發布大約 80% 圖片的主要來源。這原本是我想在 SDXL 版本做的事，但當時決定不做。原因基本上是那些圖太過主導，導致許多怪異行為及偏向產生特定圖像。我在 Flux v1.0 版本看到了這點，現在已經刪除了。人氣可能會因此受影響，但我無所謂。

我覺得很多人用某些 LoRA 是因為它在他們的「流程」裡吧。在某些情況下，不用 LoRA 生成的圖看起來其實更好，但你可能永遠不會知道。風格類 LoRA 不同，因為它明顯會在生成時加入明顯的風格效果。這個東西則有潛力把一切搞得更糟，所以我沒有精挑細選我發布的圖片，就是為了展示這點。如果你加入帶有強光或光源（如蠟燭）的元素，Flux（還有一些 SDXL 模型）會自行添加黑暗環境，因為光源需要些許黑暗才能被察覺（晴天車燈效果就不明顯）。

別問它能否在 NF4 或 QQUFUF 5.64.3255 K4 2 或其他什麼版本運作。檔案不是很大，你可以自己測試。除非那些版本除了降低記憶體消耗和／或幾乎無感的速度提升（或更差的速度下降）外，帶來更多優勢，否則我會保持距離。

我了解如果有人在短時間內發佈一款模型的新版本，剛習慣時會很煩。這個我不會再開發，看看我或其他人能否從中獲得有用的東西。

另外，用 Photoshop 準備圖像的工作量不值得付出，尤其你知道這不會改變什麼。不如做點新東西，或者更可能是蠢事，有趣或產生隨機效果……或直接給舊模型加點 Flux 看看會怎樣。

Flux.1 D - V1.0

在 Kohya 和其他工具間嘗試調整，意外成功使用一些相當怪異概念的 Flux LoRA 後，我想試試這個是否可行。實際上，我的目標不是做出 Flux 版本，因為 Flux 對比對的處理相當不錯（大多數時候）。我主要目標是擺脫那種討厭的人工／假象感，我以為這種“未定義”資料集能帶來轉變。嗯，有時會有效，或更糟。

像 SDXL 版本，它較適合與其他加色彩的 LoRA 組合使用。

抱歉提示詞和圖像稍顯隨便。基本用了 V3.0 都用的東西，暫時適合展示用。有時細節會被犧牲，沒有加什麼特別有趣的東西（例如水母圖或鸚鵡）。

相應圖片使用相同隨機種子
前兩張圖片分別帶有和不帶 LoRA，之後反轉，先是未帶 LoRA 再帶 LoRA（有時強度不同）
部分帶有觸發詞，但我懷疑 Flux 需要這些詞
基於 V1.0 的資料集，非新版（避免用太多圖片）

不確定我是否會再做更多 Flux 的 LoRA，但會測試不少。目前版本眾多，且感覺花時間在可能 10 小時後過時的東西上不太值得。

順帶說：這是在 4060 TI（16GB）上訓練，最大 VRAM 使用約 14.4–15.2 GB，速度約 3.95 秒／次到 5.15 秒／次，512x，Rank 4……所以不需要 4090。當然快點會好，但你可以啟動後放著做其它事，這不算問題，除非你想測試什麼。

和往常一樣，我會時不時用它看看能不能挖掘到有用的東西。大概只是滿足我的好奇心而已。

V.3.0

在 v2.0 小失誤後，我確保這次是真正成品，沒有合併什麼。起初對新增的圖片數量有些懷疑這版本會不會偏離太多，但幸好沒。

很高興很多人發現這個 LoRA 的用途，並創作了很多圖。考慮到它本來沒打算做現在這些事，看到它能有其他用途或說可以用於別的方面（就像所有 LoRA 一樣）真的很棒。

這可能會是相當長一段時間內的最後版本，因為增加更多圖片不會改變主要效果。大部分效果是透過用不同模型、LoRA 組合和提示詞達成。

我會更專注於實際創圖，尋找更多組合（也放鬆一下）、做新奇怪 LoRA、修正舊 LoRA 等。另外我下載了很多別人分享的資源，卻大多沒時間用。

再次感謝至今所有分享的圖片，也希望能看到更多，儘管每個 LoRA 在快速變動的 AI 領域都有壽命，炫酷程度不可避免地會終結 :)

V2.0

V2.0 小公告（依國家日期格式為 02.04 或 04.02）

嗯，我正式承認自己是個白痴。

當我在訓練另一個 LoRA 時，看到樣本圖像 2000 步後一點變化都沒有，這幾乎不可能。於是我查找原因，發現有個設定我沒調回（或設定正確）——那就是 LR warmup。通常我不使用 warmup 步數，但先前測試時為了驗證作用，有設定為 32%暖起（warm up）步數。當時資料集只有約 4 張圖。我一直設 100 個 Epoch，模型每 500 步輸出一次而非整個 Epoch。暖起設定為 32%，所以 4 張 x 10 重複 x 100 Epochs = 4000 步，其中 32% 暖起為 1280 步，這段期間變化很小。

這次的 LoRA 設定一樣，只是圖變成 60 張（60 x 10 x 100 = 60000 步，32% 暖起為 19200 步）……所以即使 12000 步了實際訓練還沒開始，等於我之前訓練的都是空氣。這解釋了很多事情。因為那時我睡著了沒察覺，儘管一開始訓練過程漫長讓我納悶，原因以為是圖本身。

所以這版本是廢品，大部分功能是從合併 V1.0 來的。

我週末上班後會用正確設定重新訓練它。

很抱歉。也許這是個無心愚人節玩笑 :) .... :(

因近來頻繁使用，更新了幾張圖，之前許久沒上傳新 LoRA，主因是工作繁忙及選擇了複雜難處理的題材，大多數必須用最複雜方式製作……不這樣做太無聊。

此外，我花了不少時間拆解 Pony，某些方面讓我驚訝。如果排除所有 Furry、動漫及一般色情內容，它幾乎比 Base XL 模型更基礎，適合透過 LoRA 訓練添加概念和風格，但它懂得更複雜的東西，比如姿勢、情緒、奇怪角度等……這是完全不同的故事。

不確定今年還能做多少訓練。也許會夾雜做些簡單東西，誰知道。AI 發展太快，說不定一個月、甚至一週內就出新玩意了。