RAYFLUX - PhotoPlus
推薦參數
samplers
steps
cfg
resolution
vae
other models
推薦高解析度參數
upscaler
upscale
提示
使用採樣器組合 'dpm_adaptive' 與 'ddim_uniform' 獲得最佳創意與攝影風格。
調整 max shift 在 1.2 到 1.8 之間,base shift 在 0.5 到 1 之間,自訂輸出圖像。
Flux Guidance 於約 2-3 的低值下表現最佳。
利用 SD 放大時提示詞調整風格,例如加入「顆粒感」增強顆粒,「柔和」減少顆粒。
版本亮點
簡言之:如果你想要更像真實照片的圖像,PHOTOPLUS 是最佳選擇;如果喜歡異國風情、電影感的影像,仍可使用 RAYFLUXv1.0。
創作者贊助
風格化模型:RAYBURN
寫實模型:RAYMNANTS
繪畫風模型:RAYCTIFIER
感謝用戶 @sheerazrazak90434 及 awskr 提供 Hugging Face 上的 Draw Things 版本。
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
請查看我的 SDXL 模型:
風格化模型: RAYBURN
寫實模型:RAYMNANTS
繪畫風模型:RAYCTIFIER
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
編輯:感謝用戶 @sheerazrazak90434 和 awskr 在 Hugging Face 上,
你們現在可以在Draw Things Hugging Face 這裏找到 v3 AIO 轉換版本。
感謝他們兩位的大力支持!
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
介紹 RAYFLUX v3 AIO
AIO 是我 RAYFLUX 系列的下一代,技術上 Photoplus 是 v2 。
它將一些 v1 的創意元素帶回 Photoplus,現在全部內置 T5、Clip 與 VAE,意味著你可以用 Comfy 的 Load Checkpoint 正常載入並使用。
希望你會喜歡,
R.
有何不同?
AIO 是全新的嘗試,既擅長攝影,也能在創意與一般非照片主題上表現出色。它是由 v1 與 Photoplus 的數據集合併,搭配一些自訂 LoRA 及手動區塊權重調整。模型提升到 FP16,但做了一些優化,保留包含 VAE、T5XXL-FP16 和來自 Zeroint 的 ViT-L-14-BEST-smooth-GmP-TE-only-HF-format,且規模合理。雖然模型有其特性,但在多數主題上的反應比 Photoplus 更佳,故決定公開分享。
簡言之: AIO 基本上能很好地處理任何題材,保留 Photoplus 稍帶顆粒攝影風,但更具創意。
示例
一幅引人注目的高級時裝近距離肖像,女子戴著黑色罩袍,背景為鮮明深紅色。光線強烈,突顯布料質感及女子銳利的目光。

一張鮮明細緻的近距離照片,一隻幼年冠鬃壁虎停在人體指尖,背景為模糊帶有光斑的都市夜景。

RAW 攝影,一名 20 歲女子,身形苗條,憤怒表情,置於岩石山峰,色彩以粉紅與紫色為限。

設定
AIO 在我看來擅長的組合是 dpm_adaptive 與 ddim_uniform。Photoplus 或 v1 使用的所有設定依舊可用,但此組合創意效果更佳。
與其他 RAYFLUX 模型不同,max shift 和 base shift 可調整,max 約為 1.2-1.8,min 則為 0.5-1。Flux Guidance 於較低值表現最佳,約為 2-3。
提醒一下, RAYFLUXv1.0 使用 Heun/beta,Photoplus 則使用 DPM_adaptive/beta。
步驟方面,AIO 適合 14 至 20 步之間。
值得一提的是,AIO 在 2MP 解析度下表現優異!(見下方範例)

我通常會用 SD 放大,2 步,降噪設定於 0.2-0.3 做第二次修飾。根據想要的風格切換放大模型,例如:1x_ITF_SkinDiffDetail_lite 適合顆粒人像(2 倍放大效果也很好!),4xUltrasharp 適用於一般插畫,4x_Foolhardy_Remacri 則適合柔和且乾淨的數位插畫風。使用 SD 放大時撰寫的提示詞相當重要,別猶豫多用它來引導風格,例寫「顆粒感」增強顆粒,「柔和」減少顆粒,或增加主角詳細描述等。
這裡是 Comfy 中 Rayflux AIO 的簡易起步範例。節點少,效果佳!
已知問題與特性
男性或女性乳頭識別。我的數據集對裸體資料較少,此版本改善不大。市面上有大量 LoRA 可協助,故情況不算嚴重。
運行速度較之前版本慢,且更耗 VRAM。檢查點大小約 21GB(包含 T5、Clip 與 VAE,使 UNET 佔用約 16GB)。在 4090 顯卡上生成單張 2MP 圖像需約 50-60 秒。
因調整導致種子間變化更多,相較前兩版是好事,但也使馴服難度稍增。
內建編碼器確實提升模型反應與易用性,但使得 GGUF 量化更棘手,因為基礎模型區塊精度不同(原為 FP8 再轉 FP16 後訓練)。用戶 foggyghost0 在評論中也反映部分編碼精度問題,請耐心等待我解決中。
