兩隻手繪有黃金色調的複雜幾何圖案,置於帶有風格化花朵的紅色花卉背景上。
陽光照射的綠色森林中,一叢白色與黃色花朵金色花蕊,周圍環繞著茂盛綠葉及鮮豔紅色花朵。
極簡白牆形成狹窄走廊,通向鮮豔漸層日落地平線與星光燦爛的星空,以廣角電影寫實風格捕捉。
一把高聳的白色傘下垂掛著粉紅色和奶油色的花卉瀑布,在溫暖的電影燈光照射下,雨滴落下,背景昏暗。
明亮色彩繽紛的花朵,其花瓣及葉子由幾何馬賽克圖案組成,背景是點綴著星星的黑色天空。

推薦反向提示詞

blurry

推薦參數

samplers

Euler, Heun, DPM++ 2M, DEIS, DDIM, Simple scheduler

steps

20 - 30

cfg

1.5 - 3

resolution

1216x1632, 2000x2000, 2500x2500

vae

Custom VAE baked in 'All in one' versions - not specified

提示

使用約 20-30 步,2.2 CFG 可獲得優質結果。

推薦採樣器為 Euler 搭配 Simple 調度器;DPM++ 2M 和 Heun 表現也很好。

加上負向提示 "blurry" 可以減少不需要的偽影。

針對實驗性 v2.1 版本,關閉 Flux guidance scale,改用 CFG scale。

FP4 版本僅適用 Nvidia 50xx 系列;int4 版本適用於 40xx 及以下顯示卡。

下載必要的 Clip_L 檔以確保僅 UNET 版本正常運作。

在推薦範圍內嘗試不同採樣器與 CFG 設定,以獲得多樣效果。

版本亮點

工作流程:https://civitai.com/articles/17163

V12 的 FP8_unet 版本:請配合使用此 clip_l:

https://civitai.com/models/833086?modelVersionId=1985466

同時搭配 t5xxl_fp8_e4m3fn 使用此 unet。

版本 V12 "Hephaistos"

發布這個檢查點讓我既高興又難過…V12 將是這個系列的最後一個檢查點…主要原因是未來實施的 EU AI 法規…另一原因是 Flux .1 DEV 授權。感謝大家支持!

無論如何…我要為這系列畫下完美句點…

V12 基於 V10B "BOB",但基本上將這系列最好的部分合併於一個檢查點中。(這是新合併方法成果,耗時約1小時30分,使用我所有128GB RAM)。我也比較 V10 強化了臉部及皮膚質感,眼睛更逼真、更有生命力。

請自行測試並給我有關 V12 的反饋。由於網速慢,我會先上傳 FP8_UNET,接著是 FP8 "all in one" 版本,再來是 FP16_unet 和 FP16_BEHEMOTH。我也會嘗試將其轉為 int4 和 fp4(希望順利)。

一如既往,請給我一些關於 V12 的反饋…

創作者贊助

如果你喜歡此模型,請在Ko-fi支持創作者。

查看安裝與工作流程指南以便快速設定:

更多工作流程及示範圖片請見這裡

在山下的深處,睡著一個巨人,他可以幫助人類,也可能帶來毀滅…

一個巨像誕生了…

繼我的 SDXL 系列後,現在是這個 Project 的 FLUX 系列時間… 這次我從零開始訓練這個模型。訓練時使用了我自己的圖像。我運用了我的 schnell Flux 模型 DemonFlux/Colossus Project schnell 並以我 SDXL Colossus Project 12 作為微調參考。

這個 SD Flux-Checkpoint 幾乎能產生所有類型的圖像… Colossus 擅長創造極度逼真的圖片、動漫和藝術畫作。

如果你喜歡,歡迎給我反饋。如果你想支持我,也可以在這裡幫助我。我花了不少錢建構一台真正能訓練 Flux 模型的電腦。訓練和測試也需耗費大量時間及電力…

https://ko-fi.com/afroman4peace

版本 V12 "Hephaistos"

發布這個檢查點讓我既高興又難過… V12 將會是這個系列的最後一個檢查點… 主要原因是即將生效的 EU AI 法規… 另一個原因是 Flux .1 DEV 的授權。感謝大家的支持!過去一年我為這個項目投入了大量時間,現在是時候轉向不同的項目。

無論如何… 我會為這個系列畫下完美句點…

V12 建立於 V10B "BOB" 基礎上,但基本上結合了這個系列最好的部分,整合成這個檢查點。(這是新合併方法的成果,合併耗時約1小時30分鐘,使用了我所有的128GB RAM)。相比 V10 我也增強了臉部與皮膚質感,眼睛更逼真且更具生命力。

請自行測試並給我 V12 的反饋。因為我的網速慢,我會先上傳 FP8_UNET,接著是 FP8 "all in one" 版本,然後是 FP16_unet 和 FP16_BEHEMOTH。我也會嘗試把它轉成 int4 和 fp4(希望順利)。

一如既往地,請給我一些關於 V12 的反饋…

版本 V12 "Behemoth" (AIO)

這個 "all in one" 模型是我 V12 系列中最棒的,當然也是最大的 :-)

Behemoth 裡面內嵌了自訂的 T5xxl 和 Clip_l。如果你偏好品質勝於數量,這是你的檢查點!

版本 V12 FP4/int4

感謝 Nunchakutech 的 Muyang Li 進行 V12 量化。https://huggingface.co/nunchaku-tech 和他們出色的 nunchaku!

此版本真是震撼人心。前所未有地將質量與速度結合。

注意!

有兩個版本 FP4 與 int4。FP4 僅適用 Nvidia 50xx 顯示卡!而 int4 適用於 40xx 及以下。(至少需要 20xx 系列顯示卡)

你也可以直接在此下載兩個版本:https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus

安裝指南與工作流程

這裡有快速安裝指南和 WIP 工作流程。

https://civitai.com/articles/17313

詳細工作流程指南

https://civitai.com/articles/17358

我仍在製作 Nunchaku 的新工作流程,接下來的工作流程仍處於 WIP(進行中),週末會新增詳細文章。

版本 V12 FP16_B_variant

感謝我凌晨2點犯的小錯誤,我重命名並上傳了「錯誤」的檢查點。這是非常實驗性的檢查點,從未打算公開發佈。雖然測試不多,但我製作展示時表現非常好。可能比標準版更優秀。

它偏向亞洲面孔… 因為我想測試混合我正在進行的一個副項目。告訴我你對這個檢查點的體驗 :-)

版本 V12 AIO FP8

此版本是 V12 的全合一版本。這表示所有 clip 都內建其中。輸出與 FP8_unet 使用我自定義 clip_l 輸出相同。

版本 V12 GGUF Q5_1

此版本為需求製作,品質不錯。

版本 V10B "BOB"

這是 V10 的替代版本。我創建它是為了提升 V10 的 FP8 版本。一般來說,FP8 版本更精確且色彩更佳。最近沒太多時間(現實生活優先)。所以花了很長時間… 若你偏愛此版本告訴我。我也有 "BOB" 的 FP16 版本。視反饋可能發布 int4 版本。

工作流程:

這是 V12 與 V10 的工作流程:https://civitai.com/articles/17163

版本 V10_int4_SVDQ "Nunchaku"

首先感謝 theunlikely https://huggingface.co/theunlikely,他將 FP16_Unet 轉換成 int4_SVDQ。去看看他的頁面並點讚支持。

此版本大體與 FP8 版相當。即使在我工作流程的普通模式下,它大約比常規模型快2至3倍。透過工作流程中的「快速模式」,我能用我的 3090ti 在約19秒內渲染2MP圖像。

什麼是 SVDQ "Nunchaku"?

這個新量化方法能將 Flux 模型(此處為原生 FP16 模型)從24GB縮減到約6.7GB。但不止如此:你能比以往更快產生圖像而不會損失太多質量。當然,你會看到與我32GB_Behemoth版本有些差異,但若使用那個模型則需要更多 VRAM/RAM才能運行。

更多信息請訪問:https://github.com/mit-han-lab/ComfyUI-nunchaku?tab=readme-ov-file

安裝:請訪問我的工作流程與安裝指南:https://civitai.com/articles/15610

版本 V10 "Behemoth" (FP16_AIO)

此版本仍屬實驗性,重點為取得更逼真結果。我也成功減少了一些「Flux 線條」。此版本基於 Colossus Project V5.0_Behemoth、V9.0 與另一項目「Ouroborus Project」。

FP16 版本非常穩定,我也很快會發佈 FP8 版本,但 FP8 不如 FP16 穩定。

我鼓勵你去試驗它,告訴我你對此版本的看法。

創作愉快 :-)

版本 V9.0:

我得多解釋一下…為什麼會是 V9.0?

我最近搬新家,因為網路供應商出錯,我幾乎無法使用上網。因此搬家過程中我讓電腦持續運行,結果產生了很多(大部分是錯誤)檢查點。但我也有一些很棒的 V8 版本,未來可能會發布。

有什麼改變?

我在模型中進行了新的面部與皮膚質感訓練,基本上融合了 V5.0 最佳結果。此外,新增腳/腿部訓練以改進人體解剖。V5.0 版本有時會裁切頭部與腳部,我認為我已修正部分問題。

此外,我還用更多自己拍攝的風景圖片訓練模型。是的,我是在搬家期間完成的。整體訓練時間約為兩週,電費不算便宜(每小時約25分電費)。

總之,希望你喜歡這個版本。如果你想支持我,請發些漂亮的圖片,或在 Buzz 或 Ko-fi 上給我贊助。

告訴我你的想法 :-)

版本 5.0:

V5.0 其實是基於 V4.2 與 V4.4(也將很快發布)。新增了皮膚細節和人體解剖的訓練,多數修正了手和乳頭等細節,臉部細節更佳。我也嘗試修復部分小的 flux 線條。

整體而言,此版本比 V4.2 更逼真,並擁有更細微的細節。像 V4.2 版本,此版本也是混合去蒸餾模型。你可以用和 V4.2 相同的設定調用。

這裡也有新的工作流程可嘗試:https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50

告訴我你相較於 4.2 或 V2.1 的看法…

版本 4.4 "Research":

我加入此版本僅為完整性考量。它比 V4.2 稍微逼真,且是 V5.0 的基礎。你可以嘗試,也能搭配 V5.0 和 V4.2 使用工作流程。

版本 4.2:

此版是 Demoncore Flux 與 Colossus Project Flux 的進一步發展。目標是獲得更穩定的輸出及更佳的皮膚質感、手部和更多樣化的臉型。我訓練了部分 Demoncore Flux 混合模型,並稍微增強了乳頭和 NSFW 部分。告訴我你是否偏好 V4.2 勝過 2.1 :-)

示範圖片只用原生 SDXL 解析度或 2MP 解析度(例如1216x1632),此模型甚至能處理更高解析度。我試過最高 2500x2500,但建議約 2000x2000 使用。

設定上建議使用約30步和 2-2.5 CFG,大多我用2.2或2.3。在展示中,我用 DPM++ 2M 與 Simple 調度器。

我會很快加入更多版本,但聖誕節前時間不多。

設定

我會盡快新增專門的 Comfy 工作流程。目前你可下載並打開示範圖片使用。

「All in One」版本與 Forge 也很好用。

基本與版本 2.1 使用相同設定(見下方)。

建議 20-30 步,約 2.2 CFG。

版本 2.1_de-distilled_experimental (MERGE)

此版本完全不同,實際運作也與普通 Flux 模型不同!

它是我 2.0 版本與去蒸餾版本https://huggingface.co/nyanko7/flux-dev-de-distill的實驗性合併。這是意外產生,但結果令人驚艷。細節令人驚訝,且對提示詞響應極佳……接下來我將直接使用去蒸餾模型訓練。我已用它製作了一些試驗性 Lora。這是極具實驗性的模型,如果發現未列的錯誤請告知。若你有不錯或有問題的圖片,也請提供,有助改善。或許可試試 2.0 版本,看看哪種檢查點適合你。

注意!

普通 Flux 工作流程不適用此版本,必須下載我專用工作流程!

你也能自行摸索方法,但別怪我成品不佳。這是高度實驗性模型,請參閱以下缺點。

此檢查點的優缺點:

  • 此檢查點能創造極致細節,但代價是速度慢於普通 Flux 檢查點。優點是常常不需額外放大。此版本不使用 Flux Guidance,而是 CFG scale。這也代表它無法用標準工作流程。

  • 可以使用負向提示,有助剔除不想要的元素。

  • 有時會出現偽影,透過簡單小幅放大可解決(我正在改進中)。以下示例,詭異的是並非所有種子都會發生。更新:非模型問題,而是工作流程問題,我正努力修正。若出現問題,可嘗試將第一次放大設定改為1.14而非1.2。

版本 2.1 設定與工作流程:

工作流程在此:https://civitai.com/articles/8419

設定:與普通 Flux 不同,此版本不需 Flux Guidance scale,用 CFG 代替。我一般使用 3 CFG,部分圖片可能需較低 CFG。

最重要的是關閉 Flux Guidance scale。

未使用工作流程時,我測試過30步和2-3 CFG,Forge 也可用此設定。建議多試驗。

推薦在負向提示使用「blurry」一詞。

採樣器與調度器:

可選擇多種工作采樣器:

Euler、Heun、DPM++2m、deis、DDIM 都表現良好。

我多用“simple”調度器。

若你發現更佳設定,告訴我 :-)

Forge 推薦使用 AIO 模型,這是 Forge 範例設定:

版本 2.0_dev_experimental

這是實驗性版本,目標是創造更連貫快速模型。我融合了額外訓練的 Lora,並用特殊方式(Tensor merge)合併模型。裡面有我用 "Attention Seeker" 修改的自訂 T5xxl。同時為加速與提升質量,我融合了 ByteDance 的 Hyper Flux lora,Shift 了工作區域。我給你看看主標題圖片。

16步 版本2.0

30步 版本1.0

缺點:

首先,此版本比上一版稍大,其次,我還需製作單純 Unet 版本,完成後會更新。

版本 2.0 設定與工作流程:

此版本可用更少步數運行,16步相當於舊模型30步。

我仍建議使用20-30步,因大多情況能帶來更好質量。

採樣器:我偏好 Euler 搭配 Simple 調度器。指導比例可設1.5-3(當然可測試範圍外)。1.8 指導比例在逼真圖片表現良好。也可嘗試 DPM++2M、Heun 等採樣器,都工作良好。

工作流程 2.0:

我為 V2.0 和 V1.0 創建了新的工作流程。它擁有新的 Flux 提示詞生成器並且第二階段放大能正常運作。https://civitai.com/articles/7946

Forge:

我用 Forge 試過此模型,效果很好。圖像間可能在 Comfy UI 和 Forge 有些許差異。

版本 1.0_dev_beta:

此模型為該系列首作。請給我反饋並分享圖片,有助模型改進。版本多樣,品質最佳為FP16 版本,但此版本非常大,需求強悍顯示卡和大量記憶體。FP8 是品質與效能間的良好折衷。若想要 GGUF 版本請下載 Q8_0。GGUF Q4_0/4.1 為需求版本,尺寸小但會有部分質量損失。

基本上模型有兩種:「All in one」模型只需下載一個檔案,內建 Clip_l、T5xxl fp8 和 VAE(詳見下方)。放入你的 checkpoints 資料夾。

另一種是只含 UNET 的版本,須分別載入所有檔案。

無論哪種情況,都必須下載我的 Clip_L 以正常運作。

還要選對 T5xxl Clip。FP8 版本用 fp8_e4m3fn t5xxl clip,FP16 版本用 FP16 clip。請確保選擇預設權重類型。(下方有 FP8 範例圖)

使用 GGUF 版本需要 GGUF loader!

目前已知的 V1.0 問題:

此為系列首款模型,故有些提示詞或風格(如藝術)可能不佳。下一版本會進行更多訓練。若模型無法處理某些內容,請讓我知道。

設定與工作流程:

我測試過約30步,Euler,加上 Simple 調度器。指導比例可設1.5-3(可自由嘗試範圍外)。

1.8 指導比例對逼真圖片效果良好。

歡迎試用這些設定,若有良好作品請分享。

我已加入示範圖片作為訓練數據。這是 Comfy 的工作流程下載連結:https://civitai.com/articles/7946

「All in one」模型:

只含 UNET:

你需下載 clip_L 檔案,約240MB。

GGUF:我已加入 GGUF 工作流程:https://civitai.com/articles/7946

重要:

此開發模型非商用,商用版本我會另行發布 "schnell" 模型,更偏向個人或科學研究使用。

授權條款:

https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md

致謝:

theunlikely https://huggingface.co/theunlikel(再次感謝)

版本 2.1/V4.2/5.0: Flux_dev_de-distill 由 nyanko7 提供

https://huggingface.co/nyanko7/flux-dev-de-distill

從 V2.0 起:ByteDance 的 Hyper Lora https://huggingface.co/ByteDance/Hyper-SD

感謝 Black Forrest 提供精彩的 Flux 模型 https://huggingface.co/black-forest-labs

上一個
FLUX 發光夢境 - FLUX v1.0
下一個
動漫風格 - Flux1.D - v1.0

模型詳情

模型類型

Checkpoint

基礎模型

Flux.1 D

模型版本

V12 "Hephaistos" FP8_UNET

模型雜湊值

11852de9e2

創作者

討論

log in以發表評論。