模型/SDXL / Flux.1 D - 啞光(Vanta)黑 - 實驗 - SDXL v2.0

SDXL / Flux.1 D - 啞光(Vanta)黑 - 實驗 - SDXL v2.0

|
8/18/2025
|
2:11:08 AM
| Discussion|
0
一個黑暗奇幻想風格的秋季神秘祭壇,特色包括杯中冒煙的咖啡、冒煙的點燃蠟燭、擺在盤子上的小南瓜、一壺茶壺及帶有老化水彩紋理的翻開書本。
一位戴著面具的Samhain慶祝者,穿著深紅長袍,臉部半被明亮的南瓜燈光照亮,坐在一盞發光的燈籠旁,背景為黑暗秋季場景。
一位有雀斑的年輕籬笆巫婆肖像,捲曲的赤褐色頭髮,脖子上有向日葵紋身,耳後有發光藥草,周圍環繞著秋季色調的向日葵。
超細緻的紫色鳶尾花,細膩的花瓣以霓虹風格在深色背景中照亮
一位穿著深色長袍的奇幻女巫,手持頂部有發光橙色球體的法杖,戴著帶有發光裂紋面罩的神秘頭盔。
高度精細的數位藝術作品,展示穿戴賽博連帽裝甲且配色為黑紅的女性刺客,臉戴面罩且帶有機械特徵。

推薦反向提示詞

SDXL_TI_my_eyes_are_bleeding

推薦參數

samplers

DPM++ SDE Karras

steps

10 - 11

cfg

3 - 5

clip skip

2

resolution

824x1200, 824x1208

other models

- SDXL - vant_blk_contrast_V2.0 (659909a6c735), SDXL - T - zavychromaxl_v60 (835d65144c), - SDXL - otclillsn_impossible_geo_V1.0 (b48cf451b5da), SDXL - wildcardxXL_wildcardxXL (1170aa1935), SDXL - zaxiousXL_wildChild (1e064edbcd), XL_boss_battle (bcb24d8c88e5), SDXL - Style - EldritchRomanceIllustration_0.9.1 (3ec99a31005a)

提示

Flux 模型與其他增添色彩或特定風格的 LoRA 模型混合使用效果最佳。

該模型可以在少量步驟後完美複製圖像,甚至照片。

當存在光源時,Flux 傾向自動添加暗環境以強化對比。

用 4060 TI(16GB)512x 分辨率訓練時,每次迭代大約需 3.95 至 5.15 秒,Rank 4。

Flux 是在極暗帶微弱形狀的圖像上訓練的,數據集準備具挑戰性。

沒有明確推薦的正面或負面提示詞,鼓勵用戶自行實驗。

根據組合和使用情況,預期變化可能微妙或極端——創意探索為關鍵。

版本亮點

  • 更多圖片

  • 尺寸更小

Flux.1 D - V2.0

最後一次嘗試讓它在 Flux 中運作……而我所說的「運作」是指盡可能搞砸一切。它很可能永遠無法達到 SDXL 版本當時的效果。即使經過 6000 步訓練,僅憑觀察也能明顯看出差異。SDXL 就像是“好吧,我會學習,但會加入我自己的風格”,而 Flux 則是對任何不明白如何處理或準確學習的東西進行激烈對抗/補償。另一方面,經過長時間的訓練後,它會徹底產出那些圖像,甚至會將訓練數據一字不差地複製過來,導致幾乎純黑的結果。Flux 可以完美複製一張圖像,像照片一樣,即使只經過幾步。

就像我在上一個 Flux 版本中說的,它大部分時間是我想和其他更有色彩或帶有特定風格的 LoRA 混合使用的東西。

和 SDXL v3.0 使用了相同的圖片,Flux 版本則加入了不少新圖(部分為橫向格式)。不過,我刪除了 3 張極有可能導致我或其他人發布的圖片中至少 80% 的圖片。這原本是我想在 SDXL 版本中做的,但當時決定不這麼做。原因大致是那些圖片過於主導,引起大量奇怪行為並偏向生成特定圖像。在 v1.0 Flux 版本中看到了這問題,現在已經移除。人氣可能會因此有所下降,但我無所謂。

我覺得很多人只是因為該 LoRA 在他們的「流程」中就使用它。有些情況下沒有 LoRA 產出的圖片反而更好,且你可能永遠不會知道。風格 LoRA 就不同了,因為它們會為生成的圖片加入明顯的風格。這玩意兒卻有很大潛力把一切搞砸,所以我沒刻意精選我發布的圖片,只想展示我的意思。如果加入強烈光暈或光源(如蠟燭),Flux(還有一些 SDXL 模型)會自動添加暗環境,因為光源總是需要一定的黑暗才能被察覺(比如晴天車頭燈幾乎沒什麼作用)。

別問它是否能在 NF4 或 QQUFUF 版本 5.64.3255 K4 2 或其他什麼上運作。文件不算大,你可以自己測試。除非這些模型能帶來比普通 FP8/16 Dev 版本更多好處,而非僅僅是降低記憶體用量和/或微不足道的速度提升(甚至是速度下降),否則我會保持距離。

我知道如果剛習慣某個模型卻在短時間內有新版本發布會有多煩人。我不會繼續追這個版本,只會觀察我自己或其他人是否能從中獲得有用的東西。

另外,為圖片在 Photoshop 裡準備的工作量不值得,尤其知道不會改變什麼。寧可做些新鮮的、可能愚蠢的東西,那才有趣或會產生隨機效果……或者就給舊模型 Flux 化,看看會發生什麼。


Flux.1 D - V1.0

經過一些和 Kohya 及其他工具的嘗試,以及用 Flux 成功測試了比較奇怪的 LoRA 概念後,我決定試試這個看它是否有效。其實我的目標並非製作 Flux 版本,因為 Flux 在大部分情況下對對比度處理得不錯。我主要目標是擺脫那種令人討厭的人工/假象外觀,我認為如此「未定義」的數據集應該有用。結果嘛,有時有用,有時反而更糟。

和 SDXL 版本類似,它更適合與其他增加色彩的 LoRA 一起使用。

抱歉在提示詞和圖片上有點懶散。基本使用了 V3.0 的相同素材,暫時足夠做展示用。有時細節會被犧牲,且不會添加特別有趣的元素(例如水母圖片或鸚鵡)。

  • 相應圖片用相同種子。

  • 前兩張圖分別是有和無 LoRA,之後則相反,先無後有 LoRA(有時強度不同)。

  • 部分圖使用了觸發詞,但我懷疑 Flux 可能不需要。

  • 基於 V1.0 數據集,而非新數據集(不想用太多圖片)。

不確定是否會做更多 Flux 的 LoRA,但會做不少測試。目前各種版本混亂不清,也覺得不值得花大量時間做可能 10 小時後就過時的東西。

順便說一句:這是用 4060 TI(16GB)訓練的,最大 VRAM 用量介於 14.4 至 15.2 GB,512x 分辨率,Rank 4,訓練速度約 3.95s/迭代至 5.15s/迭代……所以不需要 4090。當然用 4090 會更快,但如果你能邊跑邊做其他事也沒什麼問題,除非想測試性能。

像往常一樣,我會時不時使用它,看看能否從中得到有意義的東西。更可能是滿足我的好奇心。


V.3.0

在我弄砸 v2.0 後,我確保這次是正牌,沒有合併什麼的。剛開始對添加大量圖片是否會使其偏離第一版有所懷疑,幸好沒有。

很高興看到很多人找到了使用這個 LoRA 的方法,並創作許多圖片。考慮到它本來並不打算做現在這些事,看到它有另一個用途還是挺令人欣慰的(就像所有 LoRA 一樣)。

這很可能是相當長時間內的最後一個版本,因為僅僅加更多圖片不會改變主要效果。大部分還是通過使用不同模型、LoRA 組合和提示詞實現。

我計劃更多專注於創作圖片以發掘組合(也放鬆一下)、製作新的奇怪 LoRA、修復舊 LoRA 等。此外我下載了很多人的作品,但多數沒時間用。

再次感謝迄今上傳的所有圖片,希望能看到更多。儘管每個 LoRA 在這快速變動的 AI 領域都有壽命,花俏元素終究會消退。:)


V2.0


V2.0 的小公告(視乎你所在國家是 02.04 還是 04.02)

嗯,我正式承認自己是個笨蛋。

我開始訓練另一個 LoRA,發現即使 2000 步後樣本圖片都沒出現任何變化,這幾乎不可能。所以我尋找原因,發現我沒改回或正確設定的一個參數——LR 預熱。通常我不使用預熱步數,但之前測試過它到底有什麼作用。那時用的是僅有 4 張圖的數據集。我一般設定 100 個 Epoch,但設置成每 500 步輸出一次模型,而非每個 Epoch。預熱設定為 32%,所以 4 張圖 x 10 重複 x 100 Epoch = 4000 步(32% 預熱即 1280 步幾乎沒什麼運算發生)。

現在這個 LoRA 設定相同,不過是 60 張圖(60 x 10 x 100 = 60000 步 - 32% 預熱 = 19200 步)……所以即使 12000 步後還沒開始運作,意味著我幾乎訓練了白工。這點解釋了不少事情。因為睡著了沒注意,即使初期效果慢,我本以為是圖像本身問題。

是啊……這個版本是個失敗品,它的大部分效果來源於與 V1.0 的合併。

我週末會回來後用正確設定重新訓練它。

真的很抱歉。也許只是個無意的愚人節玩笑 :) .... :(


最近我用它挺多,也沒多久沒上傳新 LoRA,主要因為工作太忙,還選了很多令人頭疼且必須用最繁複方式完成的主題……其他都沒意思。

此外,我投入大量時間拆解 Pony,這方面一些結果讓我挺驚訝。若拋開所有 Furry、動漫和一般色情內容,它其實比 Base XL 更基礎,適合通過 LoRA 訓練添加概念和風格,但又懂得更多複雜東西,比如定位、情緒、奇怪角度等……這又是另外一回事了。

不確定今年還能做多少訓練了。或許中間會做些簡單的事,但誰知道呢。AI 發展快,或許下月甚至下週就有新花樣。

  • 用之前生成的圖片測試相同的種子和相同模型。有時差異微妙,有時極端 (現在知道原因了:請看公告)

  • 抱歉示範圖片變化不多。有時準備圖片比訓練 LoRA 還花時間,但這種情況下應該不太重要。更多內容會自然而然出現。


V1.0

嘗試推動 AI 去識別幾乎全黑且只有微弱輪廓的訓練圖像。

因看不到什麼幾乎無法在 Photoshop 裡準備數據集。當然每人螢幕不同設置,所以難說那些圖片是否真那麼暗,但這確實對我眼睛造成不小壓力。就算現在看生成圖也有點困難,雖然不如訓練圖暗。

其實挺驚訝模型還能學到東西。暫時擱置,想清楚怎麼用它。它確實有些怪異。奇怪的是,把生成圖放入 ControlNet IP-Adapter 會變得更明顯,產生隨機結果。

生成提示:

  • 我也不知道……祝你好運。

上一個
GonzaLomo XL/Flux/Pony - v2.0 Unity XL DMD
下一個
FLUX 1D 照片寫實人像 - v1.0

模型詳情

模型類型

LORA

基礎模型

SDXL 1.0

模型版本

SDXL v2.0

模型雜湊值

b3b5218d82

討論

log in以發表評論。