SDXL / Flux.1 D - 啞光(Vanta)黑 - 實驗 - Flux.1 D v1.0
推薦參數
samplers
steps
cfg
resolution
other models
提示
Flux.1 D 最適合與其他增添色彩或風格的 LoRA 模型結合使用。
該模型強烈傾向復現訓練數據,過度訓練可能導致圖像幾乎全黑。
加入蠟燭等光源時,Flux 自然會增添黑暗環境以突出光線。
在接近黑色圖片上訓練具有挑戰性,準備數據集需要仔細處理圖片。
使用 ControlNet IP-Adapter 來增強生成圖片效果並產生隨機結果。
該模型在 4060 TI(16GB)上訓練高效,VRAM 使用介乎 14.4 至 15.2 GB。
版本亮點
Flux 版本
Flux.1 D - V2.0
最後嘗試在 Flux 令它有效…… 我所謂有效其實是盡可能搞亂一切。它很可能永遠無法再像 SDXL 版本那樣表現。即使經過 6000 步,單觀察就很明顯。SDXL 就像「好,我會學,但會加上自己的風格」,而 Flux 則是瘋狂掙扎/補償,對於不明白或不確定我要它學什麼的東西會很抗拒。另一方面,經過長時間訓練,它會完全生成那些圖像且非常準確,甚至複製訓練數據 1:1,結果幾乎是純黑。Flux 可以完美複製圖片,就像是照片一樣,即使只經過幾步。
如我在上一個 Flux 版本所說,大部分情況是想與其他更有色彩或特定風格的 LoRA 混合使用。
圖片與 SDXL v.3.0 相同,Flux 版本加了不少(部分為風景橫向格式)。但我移除了三張圖片,這三張圖片很可能是我和其他人發表圖像中 80% 的來源。這是我曾想在 SDXL 版本做但當時放棄的事。原因是這些圖片過於主導,導致很多奇怪行為和偏差生成特定圖像。這點我在 v.1.0 Flux 版本看到,現在它們已經移除了。這裡的人氣恐怕會受打擊,但我倒不介意。
我覺得很多人只是用某個 LoRA 因為它在他們的「工作流程」裡。我想。有時候不使用 LoRA 的圖片看起來更好,而且你永遠不會知道。Style LoRA 是另一回事,因為它們會明顯添加風格。但這個東西有很大可能把一切打亂,所以我沒挑選圖片,想展現我的意思。如果加入強光或燭光等光源,Flux(和某些 SDXL 模型)會自動加黑暗環境,因為光源總需要某種黑暗才能顯眼(陽光下的車頭燈效果不明顯)。
別問它在 NF4 或 QQUFUF 版本 5.64.3255 K4 2 或其他什麼環境下是否運作。這檔案不大,你可以自己試試。我會與這些模型保持距離,除非它們比普通 FP8/16 Dev 版本除減少記憶體使用和微不足道的速度提升外,有更多好處(或者不是速度變慢)。
我知道如果有人短時間內發布新版本會很煩人,特別是剛習慣舊版本時。我不會繼續追蹤這個,只看看我或其他人能否從中得到什麼有用東西。
另外,在 Photoshop 製作圖片花費的工作量不值,特別是你知道這不會改變什麼。寧願做些新東西,或者更可能做些愚蠢又有趣、產生隨機效果的事……或者也給舊模型 Fluxify 看看結果。
Flux.1 D - V1.0
經過與 Kohya 及其他工具摸索和一些意外成功的奇怪概念 LoRA 測試,我想試試這個版本是否有效。其實,我並非真的想要得到 Flux 版本,因為 Flux 在對比度方面(大部分情況)表現不錯。我的主要目標是擺脫這種令人厭惡的人工/假像感,我覺得一套「不明確」的數據集或許能達成目的。結果,有時候有效,有時更糟。
像 SDXL 版本一樣,它更適合與其他增加大量色彩的 LoRA 一起使用。
對於提示和圖片有些懶散,基本用與 V.3.0 一樣的內容,但目前展示效果足夠。有時它會損失細節,沒有添加特別精彩的東西(比如水母或鸚鵡圖片)。
對應圖片使用相同隨機種子
前兩張圖是有無 LoRA,之後反過來,先無再有(有時強度不同)
部分圖片開頭有啟動詞,但我覺得 Flux 不太需要
基於 V1.0 數據集,不是新數據集(不想用太多圖片)
不確定是否會做更多 Flux LoRA,但會測試很多。目前版本眾多,感覺花很多時間不值得,可能 10 小時後就過時了。
順帶一提:這是用 4060 TI(16GB)訓練,VRAM 使用介乎 14.4 到 15.2GB,每次迭代 3.95 至 5.15 秒,512x,Rank 4……所以不需要 4090。當然會更快,但如果你可以放著跑,順便做其他事其實沒大問題,除非你想測試些什麼。
像往常一樣,偶爾用用看能否有意義發現。大概率只是滿足我的好奇心。
V.3.0
繼我在 v2.0 犯的小錯後,我確保這次是真正的版本,沒有合併或其他操作。起初對加入大量圖片會不會讓版本偏離太多感到懷疑,但幸運的是沒發生。
很高興很多人找到這 LoRA 的用處,並創作了不少圖像。考慮到它原本並非設計來做現在的事,看到它有另一個用途(或者說能做別的事,像所有 LoRA 一樣)很不錯。
這可能(大概率)是很長時間內最後一個版本,因為再加更多圖片不會改變主要效果。大部分改變來自使用不同模型、LoRA 組合和提示。
接下來會更專注創作圖像以尋找更多組合(和放鬆一下),做些新奇怪的 LoRA,修正舊 LoRA 等。同時從其他人下載了很多資源,但大多沒機會使用。
再次感謝迄今發布的所有圖片,希望看到更多,雖然每個 LoRA 在這快速變動的 AI 領域都有壽命,華麗程度終將結束。:)
V2.0
V2.0 的小公告(根據你所在國家,可能是 02.04 或 04.02)
我正式承認我是個白痴。
當我開始訓練另一個 LoRA,發現樣本圖片即使經過 2000 步也沒有變化,這基本不可能發生。於是我找原因,發現一個沒改回(或正確設定)的設定:LR warmup。平常我不用 warmup 步驟,但之前測試時為了了解它作用而用過一次,對象數據集只有 4 張圖片。我習慣設定 100 Epochs,但模型會每 500 步輸出一個模型,而不是根據 epoch 輸出。Warm Up 設定為 32%,即 4 張 x 10 重複 x 100 Epochs = 4000 步,其中 32% 即 1280 步暖機期間變化不大。
而這個 LoRA 設定相同,但圖量有 60 張(60 x 10 x 100 = 60000 步,32% warmup 約 19200 步)……所以 12000 步後還沒開始,換句話說我訓練的大部分其實是空氣。解釋了很多問題。因為已經睡著了,我沒注意到這點,雖然當初怪怪的一開始效果很慢,我本以為是圖片本身問題。
是的……這個版本沒用,大部分效果來自混合 V1.0。
我週末下班回來會重新用正確設定訓練。
非常抱歉。或許這只是個無心的愚人節玩笑 :) .... :(
新加了幾張圖,因最近經常用這個版本,我也有一段時間沒上傳新 LoRA,主要是工作太忙,且挑戰複雜且讓人抓狂的題材……不然就是無聊。
我也花了不少時間拆解 Pony,這讓我驚訝。撇開所有 Furry、Anime 和一般色情內容,它甚至比 Base XL 模型更基礎,這對透過 LoRA 訓練添加概念和風格有利,但它了解更多複雜內容,如姿勢、情緒、怪異角度等……但那是完全不同的故事。
今年還能訓練多少我不確定。間中可能做些簡單事,但誰知道呢。AI 發展迅速,可能一個月、一週內就有新東西。
用同樣的種子和模型測試之前生產的圖片。變化有時細微,有時極端 ( 這下我知道為什麼了:請參閱公告 )
對展示的圖片沒做更多變化感到抱歉。準備圖片有時比訓練 LoRA 還費時,但這應該無傷大雅。更多內容會自然而然發展。
V1.0
試圖推動 AI,看看它能從幾乎全黑且只有模糊輪廓的訓練圖片中學到什麼。
準備 Photoshop 數據集幾乎不可能,因為我差點看不到什麼。當然每人螢幕設定不同,很難說這些圖片是否真這麼暗,但它的確給我的眼睛帶來很大壓力。即使現在看生成的圖片也有點困難,雖然它們不如訓練圖片暗。
實際上很驚訝模型能學到一點東西。暫時先放一邊,等我想清楚該怎麼用。它確實會產生奇怪東西。把生成圖片放入 ControlNet IP-Adapter 可以增強一切並產生隨機結果。
生成提示:
我也不確定……祝你好運。






