Wan Video 2.2 - t2v_high_noise_14B
推薦參數
resolution
vae
版本亮點
wan2.2_t2v_high_noise_14B_fp8_scaled
創作者贊助
Wan Video
注意:Civitai 上還有其他 Wan Video 文件—這些可能是重複文件,但本模型頁主要用於存放 Wan Video 在 Civitai Generator 中使用的文件。
這些文件是 ComfyUI 重新打包版,原始文件可於 Diffusers/multi-part safetensors 格式 中找到。
Wan2.2 是我們視覺生成模型的一次重大升級,已開源,具備更強大功能、更佳性能和優越視覺品質。Wan2.2 主要聚焦於以下技術創新:
👍 MoE 架構: Wan2.2 在視頻擴散模型中引入了 Mixture-of-Experts (MoE) 架構,通過將降噪過程在不同時間步由專門的強大專家模型負責,擴大整體模型容量,同時維持相同計算成本。
💪🏻 數據擴展: 與 Wan2.1 相比,Wan2.2 的訓練數據量大幅增加,圖片數量提升 65.6%,視頻數量提升 83.2%。此擴展顯著提升模型在運動、語義和美學等多維度的泛化能力,達到開源及閉源模型中的頂級表現。
🎬 影視美學: Wan2.2 融入精心策劃的美學數據,配有細緻的照明、構圖及色彩標籤,實現更精確且可控的電影風格生成,便於創作具有自訂美學偏好的視頻。
🚀 高效高清混合 TI2V: Wan2.2 開源一款基於我們先進 Wan2.2-VAE 的 5B 模型,壓縮率達 16×16×4。該模型支持 720P 解析度、24fps 的文本轉視頻和圖片轉視頻生成,且可運行於如 4090 的消費級顯卡。它是目前最快的 720P@24fps 模型之一,能同時滿足工業及學術領域需求。
Wan2.2-T2V-A14B
T2V-A14B 模型支持生成 5 秒長度的 480P 及 720P 解析度視頻。該模型採用 Mixture-of-Experts (MoE) 架構,提供出色的視頻生成質量。在我們最新基準 Wan-Bench 2.0 上,該模型在多數主要評估指標中均超越領先商業模型。
Wan2.2-I2V-A14B
I2V-A14B 模型專為圖片轉視頻生成設計,支持 480P 及 720P 解析度。採用 Mixture-of-Experts (MoE) 架構,實現更穩定的視頻合成,減少不自然的鏡頭運動,並增強對多樣化風格化場景的支持。
Wan2.2-TI2V-5B
TI2V-5B 模型基於先進的 Wan2.2-VAE,達到 16×16×4 的壓縮率。該模型支持 720P 解析度、24fps 的文本轉視頻及圖片轉視頻生成,可在單張消費級 GPU(如 4090)上運行。它是目前最快的 720P@24fps 模型之一,可滿足工業應用與學術研究需求。
GitHub:https://github.com/Wan-Video/Wan2.2
原 HuggingFace 倉庫:https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
