모델/Wan Video 2.2 - 14B 이미지-비디오

Wan Video 2.2 - 14B 이미지-비디오

김지훈 (Kim Ji-hoon)

10/15/2025

1:15:42 PM

| Discussion|

팁

Wan2.2는 Wan2.1에 비해 +65.6% 더 많은 이미지와 +83.2% 더 많은 비디오로 구성된 대규모 데이터셋의 이점을 누립니다.

Mixture-of-Experts (MoE) 아키텍처를 사용하면 계산 비용을 유지하면서 모델 용량을 증가시킬 수 있습니다.

이 모델은 특히 이미지-비디오 생성에 있어 비현실적인 카메라 움직임을 줄인 안정적인 비디오 합성을 지원합니다.

버전 하이라이트

현장 이미지-비디오 생성을 위한 Wan 2.2 14B

크리에이터 스폰서

공식 Wan2.2 GitHub 저장소에서 소스 코드와 업데이트를 확인하세요.

HuggingFace에서 Wan2.2 모델의 ComfyUI 재패키지를 다운로드할 수 있습니다.

원본 Diffusers 멀티파트 safetensors 파일은 Wan-AI HuggingFace 저장소에서 이용 가능합니다.

Wan Video

노트: Civitai에 호스팅된 다른 Wan Video 파일들도 있지만 - 이들은 중복일 수 있으나, 이 모델 카드는 주로 Civitai Generator에서 Wan Video가 사용하는 파일들을 호스팅하기 위한 것입니다.

이 파일들은 ComfyUI 재패키지입니다 - 원본 파일은 Diffusers/멀티파트 safetensors 형식에서 확인할 수 있습니다.

Wan2.2는 시각적 생성 모델의 주요 업그레이드로, 이제 오픈소스로 공개되어 더 강력한 성능, 향상된 시각적 품질을 제공합니다. Wan2.2에서는 다음과 같은 기술 혁신에 중점을 두었습니다:

👍 MoE 아키텍처: Wan2.2는 비디오 확산 모델에 Mixture-of-Experts (MoE) 아키텍처를 도입했습니다. 시점별로 분리된 노이즈 제거 과정을 전문화된 강력한 전문가 모델들과 함께 수행하여 동일한 계산 비용으로 전체 모델 용량을 확장합니다.

💪🏻 데이터 확장: Wan2.1에 비해 Wan2.2는 +65.6% 더 많은 이미지와 +83.2% 더 많은 비디오로 크게 확대된 데이터로 훈련되었습니다. 이러한 확장은 동작, 의미론, 미학 등 다차원에서 모델의 일반화 능력을 크게 향상시켜, 모든 오픈소스 및 클로즈소스 모델 중 최고 성능을 달성했습니다.

🎬 영화적 미학: Wan2.2는 조명, 구도, 색상에 대한 세밀한 라벨이 부착된 특별히 선별된 미학 데이터를 통합했습니다. 이를 통해 보다 정밀하고 제어 가능한 영화 스타일 생성이 가능하며, 사용자 맞춤형 미학적 선호도를 반영한 비디오 제작을 지원합니다.

🚀 효율적인 고화질 하이브리드 TI2V: Wan2.2는 16×16×4 압축 비율을 달성한 고급 Wan2.2-VAE로 구축된 5B 모델을 오픈소스로 제공합니다. 이 모델은 720P 해상도, 24fps에서 텍스트-비디오 및 이미지-비디오 생성을 지원하며 4090과 같은 소비자용 그래픽 카드에서도 실행 가능합니다. 현재 사용 가능한 720P@24fps 모델 중 가장 빠른 모델 중 하나로 산업 및 학계 모두에서 사용 가능 합니다.

Wan2.2-T2V-A14B

T2V-A14B 모델은 480P와 720P 해상도에서 5초 길이 비디오 생성을 지원합니다. Mixture-of-Experts (MoE) 아키텍처로 구축되어 뛰어난 비디오 생성 품질을 제공합니다. 새로운 벤치마크 Wan-Bench 2.0에서 대부분의 주요 평가 지표에서 선두 상업용 모델을 능가합니다.

Wan2.2-I2V-A14B

I2V-A14B 모델은 이미지-비디오 생성용으로 설계되었으며 480P와 720P 해상도 지원합니다. Mixture-of-Experts (MoE) 아키텍처로 구축되었으며, 비현실적인 카메라 움직임이 감소한 안정적인 비디오 합성을 달성하고 다양한 스타일화된 장면에 대한 지원을 강화합니다.

Wan2.2-TI2V-5B

TI2V-5B 모델은 16×16×4 압축 비율을 달성한 고급 Wan2.2-VAE로 구축되었습니다. 이 모델은 720P 해상도 24fps에서 텍스트-비디오 및 이미지-비디오 생성을 지원하며 단일 소비자용 GPU (예: 4090)에서 실행 가능합니다. 산업용 및 학술 연구 모두의 요구를 충족시키는 가장 빠른 720P@24fps 모델 중 하나입니다.

GitHub: https://github.com/Wan-Video/Wan2.2

원본 HuggingFace 저장소: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models