一名穿著歷經洗禮的太空服的宇航員,站立在白色沙漠中,面對巨大的鯊魚形星艦,其開口如同張開的嘴巴,配有大型引擎。

推薦參數

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, Euler, DPM++ SDE, 2M SDE Karras

steps

4 - 40

cfg

2.5 - 7

resolution

1536x1536, 1024x1024

vae

ae.safetensors

推薦高解析度參數

upscale

1.5 - null

提示

使用超過 8 步以提升細節,但 8 步後輸出變化不大。

加入風格提示詞可幫助模型生成更整齊乾淨的輸出。

嘗試提高指導尺度以獲得更清晰的圖像。

若想要自然攝影外觀,避免使用『品質』相關詞如 4K、8K、大師作品、高畫質。

升級時嘗試透過節點放大潛空間,並將潛空間尺度設為 1.5,以得到更高解析度圖像。

訓練時使用 pagedlion8bit 優化器於 24GB GPU,凍結 time_in、vector_in 及 modulation 參數防止去蒸餾。

使用 LR 5e-6 進行幾千步後停止訓練以避免區塊損壞,再合併早期檢查點修正損壞區塊,然後繼續訓練。

版本亮點

schnell 模型的微調,並未使用 dev 模型。Apache 2.0 授權!

使用 kohya 以自訂 sigma 時程訓練,凍結時間與調製參數以防時間蒸餾劣化。

➤ 總訓練步數:1,360,641

➤ 有效訓練時間:1192.61 小時(49.7 天)

創作者贊助

模型亦可於:RunDiffusionRunware.ai取得

衷心感謝 RunDiffusion 贊助本模型的訓練運算資源!

欲取得 API 使用權,請參考 Runware.ai

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Safetensor 檔案: 💾BF16 💾FP8 💾bnb FP4

GGUF 檔案: 💾Q8_0 🤗Q6_K 💾Q4_K_M

連結至 🤗VAE 🤗T5xxl 🤗CLIP L

模型亦可於: RunDiffusionRunware.ai 取得

PixelWave FLUX.1 schnell 04 版本是 FLUX.1-schnell 的美學微調。訓練用的圖片均經過精選,確保模型偏好吸引眼球的圖片,擁有漂亮的顏色、質感與光影效果。

  • 基於原始 schnell 模型訓練,因此採用 Apache 2.0 授權!

  • 無特殊執行要求,支援 FLUX LoRAs

  • Euler Normal,8 步。

你可以使用更多步數以提升細節,但超過 8 步後輸出變化不大。

特別感謝 RunDiffusion

衷心感謝 RunDiffusion(Juggernaut 共同創作者)贊助本模型的運算資源!如何訓練 schnell 而不破壞模型結構經過大量試驗,能使用 RunDiffusion 雲端算力使此過程輕鬆許多。

需要本模型 API 權限者,請與 Runware.ai 合作。

FLUX.1-dev 04 版本暫時僅對 RunDiffusion 與 Runware 提供。未來推出 05 版本時,計畫發布 dev 04 的開放權重。

感謝他們的支持協助本模型發布,請看看他們

訓練資訊

訓練使用 kohya_ss/sd-scripts。我的分支 Kohya 這裡,並包含 sd-scripts 子模組修改,請確保一併克隆。

使用微調分頁。我發現 pagedlion8bit 優化器表現最佳,也適用於我的 4090 24GB GPU,其他優化器學習效果不佳。

我凍結了 time_in、vector_in 和 mod/modulation 參數,阻止「去蒸餾」現象。

避免訓練超過 15 個區塊,可以在 FLUX 區段設定訓練區塊。

LR 5e-6 雖訓練快速,但需在數千步停止,否則會破壞區塊並減慢學習。

可與早期檢查點合併區塊替換損壞部分,然後繼續訓練。

損壞區塊徵兆:大多圖像出現紙張質感,背景細節流失。

聯絡方式

商業或商用相關請聯絡 pixelwave@rundiffusion.com。提供 flux 微調授權、客製訓練專案、商用 AI 開發,團隊通通包辦!

PixelWave Flux.1-dev 03 微調完成!

Safetensor 檔案: 💾BF16 💾FP8 💾NF4

GGUF 檔案: 💾Q8_0 🤗Q6_K 💾Q4_K_M

連結至 🤗VAE 🤗T5xxl 🤗CLIP L

“diffusers” 檔案實際上是 Q8_0 與 Q4_K_M 的 GGUF 版本。GGUF 檔案亦可於 huggingface 取得。

我基於 FLUX.1-dev 版本 03 於 4090 顯卡上微調超過 5 星期,能夠應用於多種藝術風格、攝影及動漫。我發現可協助 LoRAs 的技巧。

展示圖使用 dpmpp 2m sgm uniform 30 步採樣。如需整潔乾淨的輸出,可嘗試提高指導力度。指定風格亦有幫助,避免模型盲猜。

推薦嘗試節點上升級潛空間,並將潛空間尺度調至 1.5,例如生成 1536x1536 而非 1024x1024 圖像。

PixelWave Flux.1-schnell 03

Safetensor 檔案: 💾FP8 💾NF4

GGUF 檔案: 前往 huggingface

展示圖使用 dpmpp 2m sgm uniform 8 步採樣。

可從 4 步開始,但增加步數能減少解剖學錯誤。

PixelWave Flux.1-dev 02

Safetensor 檔案: 💾BF16 💾FP8

GGUF 檔案: 💾Q8_0 🤗Q6_K 💾Q4_K_M

版本 02 顯著改善黑暗及深色圖片,輸出更可靠,手部問題減少。

推薦使用 dpmpp_2s_ancestral beta 模式,14 步,或 euler simple 模式,20 步。

Comfyui-GGUF 節點

PixelWave 11 SDXL。通用型微調模型,適合藝術及攝影風格。

我使用 20 步,DPM++ SDE,CFG 4 至 6 或 40 步,2M SDE Karras

加速版本 - 5+ 步,DPM++ SDE Karras,2.5 CFG

PAG 推薦⚡推薦 1.5 比例,CFG 3。工作流連結

🔗擴展相冊連結 🖼️

提示指南連結⭐ 你無需使用『品質』相關詞匯如 4K、8K、大師作品、高畫質、高質量等。若想獲得自然攝影風格,建議避免使用『鮮豔、強烈、明亮、高對比、霓虹、戲劇性』等詞,否則圖片可能顯得過度調整,這只是 CLIP 按照你的提示操作。🙂 若想要鮮豔霓虹風格,PixelWave 可輕鬆達成!

版本 10 預設重點在訓練 CLIP 模型,提高可靠性,產生多樣風格,且更好地跟隨提示詞。

感謝協助測試的朋友們:masslevelblinksocalguitaristklinterwizard whitebeard

指南:用 LM Studio 與 Mikey 節點進行提示升級

指南:使用跳步法為圖片添加更多細節

無需使用精煉模型。

此模型並非其他模型混合。

我亦開發了Mikey Nodes,包含大量實用節點,可透過 comfy manager 安裝。

上一個
Smol Dragons [LoRA 1.5+SDXL] - SDXL
下一個
ICBINP - 「我真係唔信佢唔係攝影」- LCM

模型詳情

模型類型

Checkpoint

基礎模型

Flux.1 S

模型版本

FLUX.1-schnell 04

模型雜湊值

565b846820

創作者

討論

log in以發表評論。

PixelWave - FLUX.1-schnell 04 的圖片

一名穿著歷經洗禮的太空服的宇航員,站立在白色沙漠中,面對巨大的鯊魚形星艦,其開口如同張開的嘴巴,配有大型引擎。

動畫 圖片

動漫風格數碼插畫展示一座大型尖頂三角形石金字塔結構,矗立在散布岩石的貧瘠土地上,背景是繁星點點的天空和帶橙色環的行星。
細緻動漫風女性戰士穿著黑色皮革服裝,擺出動感姿勢,背景有藍橙色繽紛旋渦效果。
動漫角色Frieren,尖耳朵及綠色眼睛,灰色雙馬尾,穿著透明白色睡裙,坐在柔和光線的臥室床上。
一幅詳細的機械人肖像,擁有長白髮、藍眼睛和精緻的機械裝甲,站立於未來主義賽博朋克城市夜景中。
森林中一位身形嬌小的精靈少女特寫肖像,長銀色雙馬尾,碧綠色眼睛,精緻臉部特徵,穿著金邊白色斗篷及紅色耳環。
一位細膩的仙子,類似小叮噹,帶著精緻透明的翅膀,平靜地睡在繽紛的花朵上,身穿細節豐富的綠色服裝。
Final Fantasy XIV 的 Y'shtola Rhul,身穿黑色無袖中國裙裝,帶有貓耳和尾巴,背景是掛著燈籠的夜景。
一座建於茂密峽谷陡峭懸崖的未來科幻修道院和城市,峽谷下有河流,配有飛行器和一位孤獨女子走過細橋。
一隻鮮豔的紅金剛鸚鵡棲息在熱帶雨林的樹枝上,採用柔和粉彩調和高對比動漫風格。
一位擁有美麗眼睛和瀏海的女孩坐在草地上,陽光與葉子陰影在她和地面上交織。

基礎模型 圖片

寫實風不死角色場景,包括殭屍與骷髏穿行於由發光南瓜燈照亮的陰暗、詭譎天空下的恐怖墳場。

數碼藝術 圖片

Abstract digital artwork depicting a fragmented figure dancing under a large glowing moon, composed of glitch art style shards with stark contrasts and foggy ambiance.
黑白特寫,一位頭髮濕潤被雨水親吻的女性,頭髮部分解體成飄向左方的繽紛虹彩粒子。
深膚色黑女人像,風格如同女神,佩戴金色珠寶及金色服裝,短黑髮。
雪山山景中設有高聳圓柱形玻璃塔樓的未來城市,夕陽下戲劇性的天空。
數碼藝術呈現一隻可愛的深灰色貓咪,擁有明亮藍眼睛,坐在被橙色秋葉包圍的樹枝上。貓咪頭頂漂浮著發光的光環,戴著帶吊墜的項圈。
一名穿著發光高科技外骨骼裝的兇猛女性,在霓虹燈照亮的反烏托邦城市景觀中,在巨大爆炸中發射能量彈。
冬日雪村背景中,棕色頭髮小女孩抱著白兔的特寫數碼繪畫,採用經典藝術風格呈現。
從背後看一條長長龜裂的道路,穿過一個因原子爆炸而 devastated的反烏托邦城鎮,帶有巨大的蘑菇雲和燃燒的廢墟。
一隻白色獨角獸,帶有發光的粉紅色角和飄逸的粉紅鬃毛,紅色眼睛帶有彩色巩膜,背景為暗色調,數碼藝術風格。

攝影 圖片

黎明時分非凡藍松鴉鳥特寫肖像,展現細緻羽毛、鮮明藍色冠羽和銳利眼睛,伴有微妙動態模糊。
穿著栗色V領T恤和花卉微短裙的雀斑金髮女子,微笑坐在戶外,自然光照射下
灰髮爺爺與高馬尾灰髮女子站在碧綠泳池中,旁邊有白狗和袋鼠,背景為粉色牆壁
夜晚被溫暖橙色光芒照亮的層疊混凝土結構,呈現黑暗且憂鬱的現代建築。
一幅神秘的夜間風景,展示有台階的古代石頭遺跡、在遠山後落下的發光滿月、蜿蜒的山谷河流、發光的星星,以及由電影燈光照亮的溫暖魔幻天空。
寫實風格的黑色Lincoln Continental,深色染色車窗,位於黃金時刻夕陽下的紐約市濕潤街道,光滑的路面與film grain風格的雨天氣氛。
一張時尚攝影肖像,展現一位擁有鉑金短髮的女性,從黑暗的門框後探出頭,受冷藍電影燈光照亮,呈現極簡風格。
女性側臉近距離雙重曝光肖像,薄霧與海浪融合,採用柔和電影感色彩
一位綠眼帶雀斑的年輕女子特寫,部分隱藏於鮮豔紫色花朵和綠葉灌木後方,一朵花遮住一隻眼睛
一幅寫實水彩風格插畫,描繪一名穿白色長袍和長褲、戴著太陽眼鏡的非洲女性,在巨大黑色未來太空船內走下樓梯,配合賽博朋克及末日後設計元素,燈光戲劇感十足。

傳統藝術 圖片

一位自信的羅馬女護衛,身穿精細雕刻的青銅戰鬥盔甲,站立在日間歷史街道場景中。
東方水墨畫描繪瀑布從崎嶇山崖傾瀉而下,伴隨霧氣與淡淡書法
一隻玳瑁貓靜坐於生動的日式水彩風格花卉間,背後是大紅日,配有優雅的水墨效果。
閃亮秀髮和清晰肌膚女孩特寫,雙眼閉合。
穿著帶藍色蝴蝶結的傳統日本校服、擁有長金髮的動畫女孩
白虎與穿著傳統服飾的少女,背景為朦朧的山嶺。使用 stable diffusion 生成的AI圖像。
一幕戲劇性場景,一位孤獨的武士立於水面,遠方面對傳統的日本 pagoda,暴風雨天空下雲霧繚繞,由 Stable Diffusion 生成。
使用Stable Diffusion生成的AI圖像,一位穿著傳統中國服飾、飄逸長髮的美麗女性,古典服裝細節豐富,背景為帶有寶塔與樹葉的寧靜東方景致。