Wan Video 2.2 - 14B Imagen a Video
Palabras Clave y Etiquetas Relacionadas
Parámetros Recomendados
resolution
vae
Consejos
Wan2.2 se beneficia de un conjunto de datos a gran escala con +65.6% más imágenes y +83.2% más videos en comparación con Wan2.1.
El uso de la arquitectura Mixture-of-Experts (MoE) permite mantener el costo computacional mientras se incrementa la capacidad del modelo.
El modelo soporta síntesis de video estable con movimientos de cámara menos irreales, especialmente para generación de imagen a video.
Aspectos Destacados de la Versión
Wan 2.2 14B para generación de imagen a video en sitio
Patrocinadores del Creador
Consulta el repositorio oficial de Wan2.2 en GitHub para el código fuente y actualizaciones.
Descarga el Reempaquetado ComfyUI de los modelos Wan2.2 desde HuggingFace.
Los archivos originales Diffusers multi-part safetensors están disponibles en el Repositorio Wan-AI en HuggingFace.
Wan Video
Nota: Hay otros archivos Wan Video alojados en Civitai - estos pueden ser duplicados, pero esta tarjeta del modelo está principalmente para alojar los archivos usados por Wan Video en el Generador Civitai.
Estos archivos son el Reempaquetado ComfyUI - los archivos originales se pueden encontrar en Diffusers/formato safetensors multipart aquí.
Wan2.2, una gran actualización de nuestros modelos generativos visuales, que ahora es de código abierto, ofrece capacidades más potentes, mejor rendimiento y calidad visual superior. Con Wan2.2, nos centramos en incorporar las siguientes innovaciones técnicas:
👍 Arquitectura MoE: Wan2.2 introduce una arquitectura Mixture-of-Experts (MoE) en modelos de difusión de video. Al separar el proceso de desruido a lo largo de los tiempos con modelos expertos especializados y potentes, esto aumenta la capacidad total del modelo manteniendo el mismo costo computacional.
💪🏻 Escalado de Datos: En comparación con Wan2.1, Wan2.2 se entrena con un conjunto de datos significativamente mayor, con +65.6% más imágenes y +83.2% más videos. Esta expansión mejora notablemente la generalización del modelo en múltiples dimensiones como movimientos, semántica y estética, logrando un rendimiento TOP entre modelos de código abierto y cerrados.
🎬 Estética Cinematográfica: Wan2.2 incorpora datos estéticos especialmente seleccionados con etiquetas detalladas para iluminación, composición y color. Esto permite una generación de estilo cinematográfico más precisa y controlable, facilitando la creación de videos con preferencias estéticas personalizables.
🚀 TI2V Híbrido en Alta Definición Eficiente: Wan2.2 libera un modelo de 5B construido con nuestro avanzado Wan2.2-VAE que logra una tasa de compresión de 16×16×4. Este modelo soporta generación tanto de texto a video como de imagen a video en resolución 720P a 24fps y puede correr en tarjetas gráficas de consumo como la 4090. Es uno de los modelos más rápidos en 720P@24fps disponibles, capaz de servir tanto al sector industrial como académico simultáneamente.
Wan2.2-T2V-A14B
El modelo T2V-A14B soporta la generación de videos de 5s en resoluciones 480P y 720P. Construido con una arquitectura Mixture-of-Experts (MoE), ofrece una calidad sobresaliente en la generación de video. En nuestro nuevo benchmark Wan-Bench 2.0, el modelo supera a los principales modelos comerciales en la mayoría de las dimensiones clave de evaluación.
Wan2.2-I2V-A14B
El modelo I2V-A14B, diseñado para generación de imagen a video, soporta resoluciones de 480P y 720P. Construido con arquitectura Mixture-of-Experts (MoE), logra una síntesis de video más estable con movimientos de cámara menos irreales y ofrece mejor soporte para escenas estilizadas diversas.
Wan2.2-TI2V-5B
El modelo TI2V-5B está construido con el avanzado Wan2.2-VAE que logra una tasa de compresión de 16×16×4. Este modelo soporta generación tanto de texto a video como de imagen a video en resolución 720P a 24fps y puede funcionar en una sola GPU de consumo como la 4090. Es uno de los modelos más rápidos en 720P@24fps disponibles, satisfaciendo las necesidades tanto de aplicaciones industriales como de investigación académica.
GitHub: https://github.com/Wan-Video/Wan2.2
Repositorio Original en HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.
