模型/Colossus Project Flux - v10_Behemoth_AIO_FP16

Colossus Project Flux - v10_Behemoth_AIO_FP16

陳嘉欣 (Chan Ka-yan)

12/8/2025

12:43:15 AM

| Discussion|

提示

使用負向提示詞 'blurry' 以提升圖像品質。

為達最佳真實感，建議 cfg 指導強度介於 1.5 至 3，1.8 為真實圖像的良好平衡值。

推薦使用的取樣器包括 Euler、Heun、DPM++ 2M、deis 及 DDIM，Simple 排程器表現良好。

某些檢查點須關閉 Flux 引導比例，改用 cfg 比例。

建議使用一體化模型，因其內建 Clip_L、T5xxl 及 VAE，使用方便。

安裝及工作流程請參考描述中的 civitai.com 官方指南。

存在兩個量化版本 FP4 及 int4：FP4 適用於 Nvidia 50xx 顯卡，int4 適用於 40xx 及以下（至少需 20xx 顯卡）。

SVDQ Nunchaku 量化大幅縮減模型大小，提升生成速度，僅有細微品質損失。

版本亮點

此版本仍屬實驗階段。主要焦點是取得更真實結果，也成功減少部分「Flux 線條」。此版本基於 Colossus Project V5.0_Behemoth、V9.0 及另一個我稱為 "Ouroborus Project" 的項目。

FP16 版本相當穩定。我也即將發布 FP8 版，此版相當優良但不及 FP16 穩定。

你可以自己試驗，告訴我對此版本的看法。

祝創作愉快 :-)

創作者贊助

如果你喜歡此模型並想支持創作者，請考慮通過 Ko-fi 捐款。

請查看由 Muyang Li 以及 Nunchakutech 完成的 FP4/int4 量化版本。

工作流程和安裝指南可參考 civitai.com/articles/17313 與 civitai.com/articles/17358。

轉換與量化代碼庫訪問：GitHub ComfyUI-nunchaku。

在一座山脈深處，沉睡著一個巨人，既可幫助人類，也可能帶來毀滅……

一個巨像崛起……

繼 SDXL 系列後，現在是此項目 FLUX 系列的時候……這次我從零開始訓練。訓練中我使用了自己的影像，利用我快速的 Flux 模型 DemonFlux/Colossus Project schnell 加上我的 SDXL Colossus Project 12 作為精煉器創造它們。

此 SD Flux 檢查點幾乎能生成所有類型圖像……Colossus 在生成極度真實照片、動漫及藝術圖像方面表現出色。

如果你喜歡，歡迎給我反饋。如果你願意支持我，可以通過這裡幫忙。我花了不少錢建造了一台真正能訓練 Flux 模型的電腦……訓練和測試也耗費大量時間和電力……

https://ko-fi.com/afroman4peace

版本 V12 "Hephaistos"

發布這個檢查點讓我又喜又悲……V12 將是該系列的最後一個檢查點……主要原因是即將實施的歐盟人工智能法律……另一原因是 Flux .1 DEV 本身的許可證。謝謝大家的支持！過去一年我投注大量時間於此專案。現在是時候轉向新的專案了。

無論如何……我會以一個高點結束這個系列……

V12 基於 V10B "BOB"，但將這系列最佳部分整合合併於一個檢查點。（這是利用新合併方法完成，耗時約 1 小時 30 分鐘，使用了我所有 128GB 記憶體。）我也相比 V10 強化了臉部和皮膚紋理。眼睛更加真實且更具「生命感」。

親自試試並給我 V12 的反饋。由於網路較慢，會先上傳 FP8_UNET，接著是 FP8 "一體化" 版本，然後是 FP16_unet 和 FP16_BEHEMOTH。我也會嘗試將其轉換成 int4 和 fp4（祝我好運）。

一如既往，請給我 V12 的反饋……

版本 V12 "Behemoth"（一體化）

此「一體化」模型是我 V12 系列最佳的版本……當然也是最大的一個 :-)

Behemoth 內建了定制的 T5xxl 和 Clip_l。如果你偏好品質勝於數量，這個檢查點適合你！

版本 V12 FP4/int4

感謝 Nunchakutech 的 Muyang Li 進行 V12 量化。https://huggingface.co/nunchaku-tech 及其驚人的 Nunchaku！

此版本令人震撼，結合了前所未有的品質與速度。

注意！

有兩個版本 FP4 和 int4。FP4 僅適用於 Nvidia 50xx 顯卡！int4 適用於 40xx 及以下型號。（至少需要 20xx 系列顯卡）

你也可以直接下載兩個版本：https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus

安裝指南及工作流程

這裡有快速安裝指南和進行中工作流程。

https://civitai.com/articles/17313

詳細工作流程指南

https://civitai.com/articles/17358

我仍在製作新的 Nunchaku 工作流程……以下工作流程仍處於進行中，我會在週末補充詳細文章。

版本 V12 FP16_B_variant

因為我凌晨兩點犯的小失誤，我誤命名並上傳了「錯誤」檢查點。這是非常實驗性的檢查點，原不打算公開。測試不多，但在展示時表現出色。或許比標準版還好。

它偏向亞洲臉孔，因為我想測試混入我仍在開發的側專案。告訴我你對此檢查點的體驗 :-)

版本 V12 一體化 FP8

此版本為 V12 的一體化版本，所有 Clip 模型均內嵌其中。輸出與 FP8_unet 加上我自定義的 clip_l 相同。

版本 V12 GGUF Q5_1

這版是顧客需求產生，品質不錯。

版本 V10B "BOB"

這是 V10 的替代版本，旨在改進 V10 的 FP8 版本。整體來說 FP8 版更精準、色彩更好。最近較忙（現實生活優先），所以發布慢。告訴我你喜歡這版嗎。我也有 "BOB" 的 FP16 版本。根據反饋，也會考慮發布 int4 版本。

工作流程：

這是 V12 和 V10 的工作流程：https://civitai.com/articles/17163

版本 V10_int4_SVDQ "Nunchaku"

首先感謝 theunlikely https://huggingface.co/theunlikely 將 FP16_Unet 轉換成 int4_SVDQ。訪問他的頁面點贊支持。

這版本大致與 FP8 版相當。即使在我工作流程的普通模式下，速度比普通模型快約 2 至 3 倍……在「快模式」可於 3090ti 上約 19 秒渲染 2MP 圖像。

什麼是 SVDQ "Nunchaku"？

這種新量化方法可將 Flux 模型（此為原生 FP16 模型）從 24GB 壓縮至約 6.7GB。不僅如此，生成速度也前所未有地提升，且質量損失極小。雖然和 32GB_Behemoth 略有差異，但運行此版本需要更多 VRAM/RAM。

安裝：請參考我的工作流程／安裝指南：https://civitai.com/articles/15610

版本 V10 "Behemoth" (FP16_AIO)

此版本仍在實驗階段。主要焦點是獲得更真實結果，同時減少「Flux 線條」。本版本基於 Colossus Project V5.0_Behemoth、V9.0 及我稱為 "Ouroborus Project" 的另一個項目。

FP16 版本非常穩定。我也即將發布 FP8 版本，該版本表現也很好但不如 FP16 穩定。

你可以試用並告訴我看法。

願你創作愉快 :-)

版本 V9.0：

必須多說點……首先為何會是 V9.0？

最近搬入新公寓，因為網絡供應商故障，沒有真正網路連線……搬家期間，我讓電腦持續運行。結果產生很多（多數破損）檢查點。不過我有些不錯的 V8 版本，或許也會發布。

有什麼改變？

我將 V5.0 的最佳結果重新訓練於面部和皮膚紋理，並針對腳部／腿部做了解剖訓練。V5.0 有時頭部和腳部會被截斷，我想我修正了部分問題。

此外我增加了更多自有風景圖像訓練。是的，這都是搬家時完成的……大約兩週的整體訓練時間，計算時間不便宜（每小時電費約 0.25 歐元）。

無論如何希望你喜歡此版本。如想支持，請上传好圖或捐贈給我，如在 Buzz 或 Kofi。

告訴我你的想法 :-)

版本 5.0：

V5.0 基於 V4.2 和即將發布的 V4.4，增加了皮膚細節和整體解剖訓練，主要修復了手部和乳頭等問題。臉部細節更精細。我也嘗試修正了一些細微的 Flux 線條。

整體來說，此版本比 V4.2 更真實，細節更豐富。如同 V4.2，此版本也是混合去蒸餾模型。基本上可以用與 V4.2 相同的設置。

這裡有新的工作流程可供嘗試：https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50

告訴我你比較喜歡此版本還是 4.2 或 V2.1……

版本 4.4 "Research"：

為了完整性，我加入此版。其比 V4.2 稍微真實，是版本 5.0 的基礎。可使用 V5.0 和 V4.2 的工作流程。

版本 4.2：

此版本基本是 Demoncore Flux 與 Colossus Project Flux 的進階版。目標是獲得更穩定結果與更好皮膚紋理、手部及多樣臉孔。訓練了混合模型，其中部分為 Demoncore Flux。也加強了乳頭和 NSFW 細節。告訴我你是否偏好 V4.2 而非 2.1 :-)

展覽圖像只使用 SDXL 解像度或 2MP 解像度原生圖像（例如 1216x1632）。此模型可處理更高解像度，我測試至 2500x2500，建議以約 2000x2000 為佳。

建議設置約 30 步驟和 2-2.5 cfg，工作流程中多用 2.2 或 2.3。展覽使用 DPM++ 2M 和簡單排程器。

我將陸續補充更多版本，但聖誕節前時間有限……

設置

我很快會新增專用 Comfy 工作流程。你可以先下載並打開展覽圖片。

「一體化版本」也適用於 Forge。

基本上使用與版本 2.1（如下）相同的設置。

設定 20-30 步驟，cfg 約 2.2 左右。

版本 2.1 去蒸餾實驗合併版（MERGE）

此版本完全不同，實際運作也不同於普通 Flux 模型！

它是我版本 2.0 與一個去蒸餾版本https://huggingface.co/nyanko7/flux-dev-de-distill間的實驗性合併。部分偶然，但結果驚人。細節出色，對提示詞反應靈敏……下一步是直接在去蒸餾模型上訓練。我已做一些測試 Lora。這屬高度實驗性，若發現錯誤請告知，也歡迎分享好或不佳的圖像，有助於改善。可嘗試使用 2.0 版，看看哪種檢查點適合你。

注意！

普通 Flux 工作流程不適用此版本。請下載我的工作流程使用！

你也可自行探索，但請勿因圖像不佳責怪我。這是高度實驗模型，以下列出缺點……

該檢查點優缺點：

本檢查點能創造極致細節，但代價是比普通 Flux 檢查點慢。優點是通常不需額外放大。此模型使用 cfg 比例代替 Flux 引導比例，因此不適用標準工作流程。
支援負向提示，協助剔除不想要的圖像元素。
有時會出現偽影，可通過小幅簡單放大修復（我正在努力改進）。這情況非模型本身問題，而是工作流程問題。若發生，可嘗試首次放大比例設為 1.14 而非 1.2。

版本 2.1 設置與工作流程：

工作流程請見：https://civitai.com/articles/8419

設置：與普通 Flux 不同，不需 Flux 引導比例，使用 cfg 比例。我在工作流程多用 3 cfg，某些圖像則需較低值。

最重要的是關閉 Flux 引導比例……

未用工作流程時我測試過 30 步驟，2-3 cfg。Forge 也建議用此設置，歡迎試驗。

建議在負向提示中加入 "blurry" 字詞。

取樣器與排程器：

可選用多種取樣器：

Euler、Heun、DPM++2m、deis、DDIM 均表現良好。

我多用 "simple" 作為排程器。

如有更好設置，歡迎告訴我 :-)

Forge 推薦用一體化模型。這是 Forge 的設置範例：

版本 2.0_dev_experimental

這是實驗版本，目標是創建更連貫且更快速模型。我訓練了自有 lora，再利用特殊方式（Tensor merge）合併模型。搭配定制的 T5xxl，並用 "Attention Seeker" 修改。為提升速度和品質，合併了來自 ByteDance 的 Hyper Flux lora。這意味著工作區域有所偏移。主標題圖片如下。