PixelWave - FLUX.1-dev 03
推薦參數
samplers
steps
cfg
resolution
vae
推薦高解析度參數
upscale
提示
你可以使用更多步數來提升細節,但超過 8 步後輸出變化不大。
如果想要更整潔/乾淨的輸出,嘗試提高指導尺度(CFG)。
在提示詞中提及風格有助模型生成更佳的結果。
嘗試添加 upscale latent 節點,並將 latent 放大 1.5 倍以生成更高解析度圖片。
避免使用「品質」類詞彙如 4K、8K、傑作、高解析、高品質,除非必要;可能導致圖片過度調整。
攝影風格若需自然外觀,避免使用「鮮豔、強烈、明亮、高對比、霓虹、戲劇化」等詞彙。
訓練使用 kohya_ss/sd-scripts,採用 pagedlion8bit 優化器。
凍結 time_in、vector_in 與調製參數可阻止「去蒸餾」。
避免單塊訓練超過 15 ,可於 FLUX 區段設定訓練塊。
學習率 5e-6 訓練快速,但需於數千步後停止以避免塊崩壞。
版本亮點
在我的 4090 上微調了 5 週。
創作者贊助
PixelWave FLUX.1-schnell 04 - Apache 2.0!
Safetensor Files: 💾BF16 💾FP8 💾bnb FP4
GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M
Model also available at: RunDiffusion and Runware.ai
PixelWave FLUX.1 schnell 版本 04 是基於 FLUX.1-schnell 的美學微調版本。訓練圖像經過精心挑選,確保模型偏向吸引目光的圖片,擁有漂亮的色彩、質感和光影效果。
基於原始 schnell 模型訓練,遵從 Apache 2.0 授權!
無特殊運行要求。支援 FLUX LoRA
Euler Normal,8 步。
你可以使用更多步數來提升細節,但超過 8 步後輸出變化不大。
感謝 RunDiffusion 支持
非常感謝 RunDiffusion(Juggernaut 聯合創作者)贊助計算資源,讓本模型訓練成為可能!如何不對模型做去蒸餾而訓練 schnell 需大量實驗,而能利用 RunDiffusion 雲端算力使流程更加容易。
需要本模型 API 調用,請與 Runware.ai 合作。
我目前將 FLUX.1-dev 04 版本限量提供給 RunDiffusion 和 Runware 使用。未來釋出 05 版本時,計劃公開 dev 04 權重。
感謝他們支持本模型發佈,請關注他們!
訓練說明
訓練透過 kohya_ss/sd-scripts 完成。我的 Kohya 分支 包含對 sd-scripts 子模塊的修改,請務必同時 clone 兩部分。
使用微調選項卡。我發現 pagedlion8bit 優化器適合,且可在我的 4090 24GB GPU 上運行。其他優化器學習效果較差。
凍結 time_in、vector_in 與 mod/modulation 參數,阻止 "去蒸餾"。
避免單塊訓練超過 15。可在 FLUX 區段設定訓練塊。
學習率 5e-6 訓練快速,但需於數千步後停止,以避免塊崩壞及學習變慢。
可用較早的檢查點合併塊,替換崩壞部分後繼續訓練。
崩壞塊跡象:大部分圖像呈現紙張質感,背景細節流失。
聯絡方式
商業或商務洽詢請聯絡 pixelwave@rundiffusion.com。授權 Flux 微調,客製訓練計劃,商用 AI 開發,團隊全能支援!
PixelWave Flux.1-dev 03 精細微調!
Safetensor Files: 💾BF16 💾FP8 💾NF4
GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M
“diffusers” 文件實際為 Q8_0 與 Q4_K_M GGUF 版本。GGUF 文件也可於 huggingface 取得。
我使用 4090 針對基礎 FLUX.1-dev 版本 03 微調超過 5 週。可執行多種藝術風格、攝影與動畫。我發現的有助 LoRA 的技巧。
展覽圖片使用 dpmpp 2m sgm uniform 30 步。如果想更整潔/乾淨的輸出,可嘗試提高指導力度。提及風格也有助模型精準生成。
推薦嘗試添加 upscale latent 節點,並將 latent 乘以 1.5,生成 1536x1536 解析度圖片,提升輸出品質。
PixelWave Flux.1-schnell 03
GGUF Files: 前往 huggingface
展覽圖片使用 dpmpp 2m sgm uniform 8 步。
可從 4 步開始,但步數越多解剖結構錯誤越少。
PixelWave Flux.1-dev 02
GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M
版本 02 大幅改善黑暗與陰影圖像,並提升手部細節的輸出穩定性。
建議使用 dpmpp_2s_ancestral beta,14 步。或是 euler simple,20 步。
PixelWave 11 SDXL。通用型微調模型,適用於藝術與攝影風格。
我使用 20 步,DPM++ SDE,CFG 4 至 6 或 40 步,2M SDE Karras
加速版本 - 5+ 步,DPM++ SDE Karras,2.5 CFG
⭐提示詞指南連結 ⭐ 你無需使用「品質」相關詞彙,如 4K、8K、傑作、高解析、高品質,除非你想要。我建議若想要更自然的攝影效果,避免使用 「鮮豔、強烈、明亮、高對比、霓虹、戲劇化」等詞,這會導致圖像有過度調整的感覺,但只是 CLIP 按提示調整而已。🙂 若想要鮮豔霓虹風,PixelWave 也能提供!
版本 10 的重點是訓練 CLIP 模型,提升可靠性,確保能多樣化產出風格並更好遵循提示詞。
感謝協助測試的朋友:masslevel、blink、socalguitarist、klinter、wizard whitebeard。
指南:利用 LM Studio 和 Mikey Nodes 進行提示詞放大
無需使用精煉模型。
本模型非其他模型混合版本。
我還開發了 Mikey Nodes,包含多個實用節點,可透過 comfy manager 安裝。





