推薦參數

resolution

1280x720, 854x480

vae

Wan2.2-VAE

版本亮點

wan2.2_t2v_high_noise_14B_fp8_scaled

創作者贊助

Wan Video

注意:Civitai 上還有其他 Wan Video 文件—這些可能是重複文件,但本模型頁主要用於存放 Wan Video 在 Civitai Generator 中使用的文件。

這些文件是 ComfyUI 重新打包版,原始文件可於 Diffusers/multi-part safetensors 格式 中找到。

Wan2.2 是我們視覺生成模型的一次重大升級,已開源,具備更強大功能、更佳性能和優越視覺品質。Wan2.2 主要聚焦於以下技術創新:

👍 MoE 架構: Wan2.2 在視頻擴散模型中引入了 Mixture-of-Experts (MoE) 架構,通過將降噪過程在不同時間步由專門的強大專家模型負責,擴大整體模型容量,同時維持相同計算成本。

💪🏻 數據擴展: 與 Wan2.1 相比,Wan2.2 的訓練數據量大幅增加,圖片數量提升 65.6%,視頻數量提升 83.2%。此擴展顯著提升模型在運動、語義和美學等多維度的泛化能力,達到開源及閉源模型中的頂級表現。

🎬 影視美學: Wan2.2 融入精心策劃的美學數據,配有細緻的照明、構圖及色彩標籤,實現更精確且可控的電影風格生成,便於創作具有自訂美學偏好的視頻。

🚀 高效高清混合 TI2V: Wan2.2 開源一款基於我們先進 Wan2.2-VAE 的 5B 模型,壓縮率達 16×16×4。該模型支持 720P 解析度、24fps 的文本轉視頻和圖片轉視頻生成,且可運行於如 4090 的消費級顯卡。它是目前最快的 720P@24fps 模型之一,能同時滿足工業及學術領域需求。

Wan2.2-T2V-A14B

T2V-A14B 模型支持生成 5 秒長度的 480P 及 720P 解析度視頻。該模型採用 Mixture-of-Experts (MoE) 架構,提供出色的視頻生成質量。在我們最新基準 Wan-Bench 2.0 上,該模型在多數主要評估指標中均超越領先商業模型。

Wan2.2-I2V-A14B

I2V-A14B 模型專為圖片轉視頻生成設計,支持 480P 及 720P 解析度。採用 Mixture-of-Experts (MoE) 架構,實現更穩定的視頻合成,減少不自然的鏡頭運動,並增強對多樣化風格化場景的支持。

Wan2.2-TI2V-5B

TI2V-5B 模型基於先進的 Wan2.2-VAE,達到 16×16×4 的壓縮率。該模型支持 720P 解析度、24fps 的文本轉視頻及圖片轉視頻生成,可在單張消費級 GPU(如 4090)上運行。它是目前最快的 720P@24fps 模型之一,可滿足工業應用與學術研究需求。

GitHub:https://github.com/Wan-Video/Wan2.2

原 HuggingFace 倉庫:https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

上一個
Plagion - v1.0
下一個
寫實街頭攝影 - J^p^N - 日本

模型詳情

模型類型

Checkpoint

基礎模型

Wan Video 2.2 T2V-A14B

模型版本

t2v_high_noise_14B

模型雜湊值

cad711ae21

創作者

討論

log in以發表評論。