Wan Video 2.2 - t2v_high_noise_14B
Palabras Clave y Etiquetas Relacionadas
Parámetros Recomendados
resolution
vae
Aspectos Destacados de la Versión
wan2.2_t2v_high_noise_14B_fp8_scaled
Patrocinadores del Creador
Estos archivos son el Reempaquetado ComfyUI - los archivos originales se pueden encontrar en Diffusers/formato safetensors multipart aquí.
GitHub: https://github.com/Wan-Video/Wan2.2
Repositorio Original en HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Wan Video
Nota: Hay otros archivos de Wan Video alojados en Civitai - estos pueden ser duplicados, pero esta tarjeta de modelo es principalmente para alojar los archivos usados por Wan Video en el Generador Civitai.
Estos archivos son el Reempaquetado ComfyUI - los archivos originales se pueden encontrar en Diffusers/formato safetensors multipart aquí.
Wan2.2, una actualización importante de nuestros modelos generativos visuales, que ahora es de código abierto, ofrece capacidades más potentes, mejor rendimiento y calidad visual superior. Con Wan2.2, nos hemos enfocado en incorporar las siguientes innovaciones técnicas:
👍 Arquitectura MoE: Wan2.2 introduce una arquitectura Mixture-of-Experts (MoE) en modelos de difusión de video. Al separar el proceso de reducción de ruido a través de intervalos de tiempo con modelos expertos especializados y potentes, esto amplía la capacidad total del modelo manteniendo el mismo costo computacional.
💪🏻 Escalado de Datos: En comparación con Wan2.1, Wan2.2 se entrena con datos significativamente mayores, con un +65.6% más de imágenes y +83.2% más de videos. Esta expansión mejora notablemente la generalización del modelo en múltiples dimensiones como movimientos, semántica y estética, logrando un rendimiento TOP entre todos los modelos de código abierto y cerrados.
🎬 Estética Cinematográfica: Wan2.2 incorpora datos estéticos especialmente seleccionados con etiquetas detalladas para iluminación, composición y color. Esto permite una generación de estilo cinematográfico más precisa y controlable, facilitando la creación de videos con preferencias estéticas personalizables.
🚀 Híbrido TI2V Eficiente en Alta Definición: Wan2.2 abre su código para un modelo 5B construido con nuestro avanzado Wan2.2-VAE que logra una relación de compresión de 16×16×4. Este modelo soporta generación de texto a video e imagen a video en resolución 720P con 24fps y puede funcionar en tarjetas gráficas de consumo como la 4090. Es uno de los modelos 720P@24fps más rápidos disponibles, capaz de atender sectores industriales y académicos simultáneamente.
Wan2.2-T2V-A14B
El modelo T2V-A14B soporta la generación de videos de 5s en resoluciones 480P y 720P. Construido con una arquitectura Mixture-of-Experts (MoE), ofrece una calidad sobresaliente en la generación de video. En nuestro nuevo benchmark Wan-Bench 2.0, el modelo supera a los principales modelos comerciales en la mayoría de las dimensiones clave de evaluación.
Wan2.2-I2V-A14B
El modelo I2V-A14B, diseñado para generación de video a partir de imagen, soporta resoluciones 480P y 720P. Construido con arquitectura Mixture-of-Experts (MoE), logra una síntesis de video más estable con movimientos de cámara menos irreales y ofrece mejor soporte para escenas estilizadas diversas.
Wan2.2-TI2V-5B
El modelo TI2V-5B está construido con el avanzado Wan2.2-VAE que logra una relación de compresión de 16×16×4. Este modelo soporta generación de texto a video y de imagen a video a resolución 720P con 24fps y puede funcionar con una GPU de consumo única como la 4090. Es uno de los modelos 720P@24fps más rápidos disponibles, satisfaciendo las necesidades tanto de aplicaciones industriales como de investigación académica.
GitHub: https://github.com/Wan-Video/Wan2.2
Repositorio Original en HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.
