模型/Colossus Project Flux - V12 "Hephaistos" FP8_UNET

Colossus Project Flux - V12 "Hephaistos" FP8_UNET

陳嘉欣 (Chan Ka-yan)

8/7/2025

2:09:38 PM

| Discussion|

提示

使用約 20-30 步，2.2 CFG 可獲得優質結果。

推薦採樣器為 Euler 搭配 Simple 調度器；DPM++ 2M 和 Heun 表現也很好。

加上負向提示 "blurry" 可以減少不需要的偽影。

針對實驗性 v2.1 版本，關閉 Flux guidance scale，改用 CFG scale。

FP4 版本僅適用 Nvidia 50xx 系列；int4 版本適用於 40xx 及以下顯示卡。

下載必要的 Clip_L 檔以確保僅 UNET 版本正常運作。

在推薦範圍內嘗試不同採樣器與 CFG 設定，以獲得多樣效果。

版本亮點

工作流程：https://civitai.com/articles/17163

V12 的 FP8_unet 版本：請配合使用此 clip_l：

https://civitai.com/models/833086?modelVersionId=1985466

同時搭配 t5xxl_fp8_e4m3fn 使用此 unet。

版本 V12 "Hephaistos"

發布這個檢查點讓我既高興又難過…V12 將是這個系列的最後一個檢查點…主要原因是未來實施的 EU AI 法規…另一原因是 Flux .1 DEV 授權。感謝大家支持！

無論如何…我要為這系列畫下完美句點…

V12 基於 V10B "BOB"，但基本上將這系列最好的部分合併於一個檢查點中。（這是新合併方法成果，耗時約1小時30分，使用我所有128GB RAM）。我也比較 V10 強化了臉部及皮膚質感，眼睛更逼真、更有生命力。

請自行測試並給我有關 V12 的反饋。由於網速慢，我會先上傳 FP8_UNET，接著是 FP8 "all in one" 版本，再來是 FP16_unet 和 FP16_BEHEMOTH。我也會嘗試將其轉為 int4 和 fp4（希望順利）。

一如既往，請給我一些關於 V12 的反饋…

創作者贊助

如果你喜歡此模型，請在Ko-fi支持創作者。

查看安裝與工作流程指南以便快速設定：

更多工作流程及示範圖片請見這裡。

在山下的深處，睡著一個巨人，他可以幫助人類，也可能帶來毀滅…

一個巨像誕生了…

繼我的 SDXL 系列後，現在是這個 Project 的 FLUX 系列時間… 這次我從零開始訓練這個模型。訓練時使用了我自己的圖像。我運用了我的 schnell Flux 模型 DemonFlux/Colossus Project schnell 並以我 SDXL Colossus Project 12 作為微調參考。

這個 SD Flux-Checkpoint 幾乎能產生所有類型的圖像… Colossus 擅長創造極度逼真的圖片、動漫和藝術畫作。

如果你喜歡，歡迎給我反饋。如果你想支持我，也可以在這裡幫助我。我花了不少錢建構一台真正能訓練 Flux 模型的電腦。訓練和測試也需耗費大量時間及電力…

https://ko-fi.com/afroman4peace

版本 V12 "Hephaistos"

發布這個檢查點讓我既高興又難過… V12 將會是這個系列的最後一個檢查點… 主要原因是即將生效的 EU AI 法規… 另一個原因是 Flux .1 DEV 的授權。感謝大家的支持！過去一年我為這個項目投入了大量時間，現在是時候轉向不同的項目。

無論如何… 我會為這個系列畫下完美句點…

V12 建立於 V10B "BOB" 基礎上，但基本上結合了這個系列最好的部分，整合成這個檢查點。（這是新合併方法的成果，合併耗時約1小時30分鐘，使用了我所有的128GB RAM）。相比 V10 我也增強了臉部與皮膚質感，眼睛更逼真且更具生命力。

請自行測試並給我 V12 的反饋。因為我的網速慢，我會先上傳 FP8_UNET，接著是 FP8 "all in one" 版本，然後是 FP16_unet 和 FP16_BEHEMOTH。我也會嘗試把它轉成 int4 和 fp4（希望順利）。

一如既往地，請給我一些關於 V12 的反饋…

版本 V12 "Behemoth" (AIO)

這個 "all in one" 模型是我 V12 系列中最棒的，當然也是最大的 :-)

Behemoth 裡面內嵌了自訂的 T5xxl 和 Clip_l。如果你偏好品質勝於數量，這是你的檢查點！

版本 V12 FP4/int4

感謝 Nunchakutech 的 Muyang Li 進行 V12 量化。https://huggingface.co/nunchaku-tech 和他們出色的 nunchaku！

此版本真是震撼人心。前所未有地將質量與速度結合。

注意！

有兩個版本 FP4 與 int4。FP4 僅適用 Nvidia 50xx 顯示卡！而 int4 適用於 40xx 及以下。（至少需要 20xx 系列顯示卡）

你也可以直接在此下載兩個版本：https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus

安裝指南與工作流程

這裡有快速安裝指南和 WIP 工作流程。

https://civitai.com/articles/17313

詳細工作流程指南

https://civitai.com/articles/17358

我仍在製作 Nunchaku 的新工作流程，接下來的工作流程仍處於 WIP（進行中），週末會新增詳細文章。

版本 V12 FP16_B_variant

感謝我凌晨2點犯的小錯誤，我重命名並上傳了「錯誤」的檢查點。這是非常實驗性的檢查點，從未打算公開發佈。雖然測試不多，但我製作展示時表現非常好。可能比標準版更優秀。

它偏向亞洲面孔… 因為我想測試混合我正在進行的一個副項目。告訴我你對這個檢查點的體驗 :-)

版本 V12 AIO FP8

此版本是 V12 的全合一版本。這表示所有 clip 都內建其中。輸出與 FP8_unet 使用我自定義 clip_l 輸出相同。

版本 V12 GGUF Q5_1

此版本為需求製作，品質不錯。

版本 V10B "BOB"

這是 V10 的替代版本。我創建它是為了提升 V10 的 FP8 版本。一般來說，FP8 版本更精確且色彩更佳。最近沒太多時間（現實生活優先）。所以花了很長時間… 若你偏愛此版本告訴我。我也有 "BOB" 的 FP16 版本。視反饋可能發布 int4 版本。

工作流程：

這是 V12 與 V10 的工作流程：https://civitai.com/articles/17163

版本 V10_int4_SVDQ "Nunchaku"

首先感謝 theunlikely https://huggingface.co/theunlikely，他將 FP16_Unet 轉換成 int4_SVDQ。去看看他的頁面並點讚支持。

此版本大體與 FP8 版相當。即使在我工作流程的普通模式下，它大約比常規模型快2至3倍。透過工作流程中的「快速模式」，我能用我的 3090ti 在約19秒內渲染2MP圖像。

什麼是 SVDQ "Nunchaku"?

這個新量化方法能將 Flux 模型（此處為原生 FP16 模型）從24GB縮減到約6.7GB。但不止如此：你能比以往更快產生圖像而不會損失太多質量。當然，你會看到與我32GB_Behemoth版本有些差異，但若使用那個模型則需要更多 VRAM/RAM才能運行。

安裝：請訪問我的工作流程與安裝指南：https://civitai.com/articles/15610

版本 V10 "Behemoth" (FP16_AIO)

此版本仍屬實驗性，重點為取得更逼真結果。我也成功減少了一些「Flux 線條」。此版本基於 Colossus Project V5.0_Behemoth、V9.0 與另一項目「Ouroborus Project」。

FP16 版本非常穩定，我也很快會發佈 FP8 版本，但 FP8 不如 FP16 穩定。

我鼓勵你去試驗它，告訴我你對此版本的看法。

創作愉快 :-)

版本 V9.0:

我得多解釋一下…為什麼會是 V9.0？

我最近搬新家，因為網路供應商出錯，我幾乎無法使用上網。因此搬家過程中我讓電腦持續運行，結果產生了很多（大部分是錯誤）檢查點。但我也有一些很棒的 V8 版本，未來可能會發布。

有什麼改變？

我在模型中進行了新的面部與皮膚質感訓練，基本上融合了 V5.0 最佳結果。此外，新增腳/腿部訓練以改進人體解剖。V5.0 版本有時會裁切頭部與腳部，我認為我已修正部分問題。

此外，我還用更多自己拍攝的風景圖片訓練模型。是的，我是在搬家期間完成的。整體訓練時間約為兩週，電費不算便宜（每小時約25分電費）。

總之，希望你喜歡這個版本。如果你想支持我，請發些漂亮的圖片，或在 Buzz 或 Ko-fi 上給我贊助。

告訴我你的想法 :-)

版本 5.0:

V5.0 其實是基於 V4.2 與 V4.4（也將很快發布）。新增了皮膚細節和人體解剖的訓練，多數修正了手和乳頭等細節，臉部細節更佳。我也嘗試修復部分小的 flux 線條。

整體而言，此版本比 V4.2 更逼真，並擁有更細微的細節。像 V4.2 版本，此版本也是混合去蒸餾模型。你可以用和 V4.2 相同的設定調用。

這裡也有新的工作流程可嘗試：https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50

告訴我你相較於 4.2 或 V2.1 的看法…

版本 4.4 "Research"：

我加入此版本僅為完整性考量。它比 V4.2 稍微逼真，且是 V5.0 的基礎。你可以嘗試，也能搭配 V5.0 和 V4.2 使用工作流程。

版本 4.2:

此版是 Demoncore Flux 與 Colossus Project Flux 的進一步發展。目標是獲得更穩定的輸出及更佳的皮膚質感、手部和更多樣化的臉型。我訓練了部分 Demoncore Flux 混合模型，並稍微增強了乳頭和 NSFW 部分。告訴我你是否偏好 V4.2 勝過 2.1 :-)

示範圖片只用原生 SDXL 解析度或 2MP 解析度（例如1216x1632），此模型甚至能處理更高解析度。我試過最高 2500x2500，但建議約 2000x2000 使用。

設定上建議使用約30步和 2-2.5 CFG，大多我用2.2或2.3。在展示中，我用 DPM++ 2M 與 Simple 調度器。

我會很快加入更多版本，但聖誕節前時間不多。

設定

我會盡快新增專門的 Comfy 工作流程。目前你可下載並打開示範圖片使用。

「All in One」版本與 Forge 也很好用。

基本與版本 2.1 使用相同設定（見下方）。

建議 20-30 步，約 2.2 CFG。

版本 2.1_de-distilled_experimental (MERGE)

此版本完全不同，實際運作也與普通 Flux 模型不同！

它是我 2.0 版本與去蒸餾版本https://huggingface.co/nyanko7/flux-dev-de-distill的實驗性合併。這是意外產生，但結果令人驚艷。細節令人驚訝，且對提示詞響應極佳……接下來我將直接使用去蒸餾模型訓練。我已用它製作了一些試驗性 Lora。這是極具實驗性的模型，如果發現未列的錯誤請告知。若你有不錯或有問題的圖片，也請提供，有助改善。或許可試試 2.0 版本，看看哪種檢查點適合你。

注意！

普通 Flux 工作流程不適用此版本，必須下載我專用工作流程！

你也能自行摸索方法，但別怪我成品不佳。這是高度實驗性模型，請參閱以下缺點。

此檢查點的優缺點：

此檢查點能創造極致細節，但代價是速度慢於普通 Flux 檢查點。優點是常常不需額外放大。此版本不使用 Flux Guidance，而是 CFG scale。這也代表它無法用標準工作流程。
可以使用負向提示，有助剔除不想要的元素。
有時會出現偽影，透過簡單小幅放大可解決（我正在改進中）。以下示例，詭異的是並非所有種子都會發生。更新：非模型問題，而是工作流程問題，我正努力修正。若出現問題，可嘗試將第一次放大設定改為1.14而非1.2。

版本 2.1 設定與工作流程：

工作流程在此：https://civitai.com/articles/8419

設定：與普通 Flux 不同，此版本不需 Flux Guidance scale，用 CFG 代替。我一般使用 3 CFG，部分圖片可能需較低 CFG。

最重要的是關閉 Flux Guidance scale。

未使用工作流程時，我測試過30步和2-3 CFG，Forge 也可用此設定。建議多試驗。

推薦在負向提示使用「blurry」一詞。

採樣器與調度器：

可選擇多種工作采樣器：

Euler、Heun、DPM++2m、deis、DDIM 都表現良好。

我多用“simple”調度器。

若你發現更佳設定，告訴我 :-)

Forge 推薦使用 AIO 模型，這是 Forge 範例設定：

版本 2.0_dev_experimental

這是實驗性版本，目標是創造更連貫快速模型。我融合了額外訓練的 Lora，並用特殊方式（Tensor merge）合併模型。裡面有我用 "Attention Seeker" 修改的自訂 T5xxl。同時為加速與提升質量，我融合了 ByteDance 的 Hyper Flux lora，Shift 了工作區域。我給你看看主標題圖片。