Parámetros Recomendados

resolution

1280x720, 854x480

vae

Wan2.2-VAE

Aspectos Destacados de la Versión

wan2.2_t2v_high_noise_14B_fp8_scaled

Patrocinadores del Creador

Wan Video

Nota: Hay otros archivos de Wan Video alojados en Civitai - estos pueden ser duplicados, pero esta tarjeta de modelo es principalmente para alojar los archivos usados por Wan Video en el Generador Civitai.

Estos archivos son el Reempaquetado ComfyUI - los archivos originales se pueden encontrar en Diffusers/formato safetensors multipart aquí.

Wan2.2, una actualización importante de nuestros modelos generativos visuales, que ahora es de código abierto, ofrece capacidades más potentes, mejor rendimiento y calidad visual superior. Con Wan2.2, nos hemos enfocado en incorporar las siguientes innovaciones técnicas:

👍 Arquitectura MoE: Wan2.2 introduce una arquitectura Mixture-of-Experts (MoE) en modelos de difusión de video. Al separar el proceso de reducción de ruido a través de intervalos de tiempo con modelos expertos especializados y potentes, esto amplía la capacidad total del modelo manteniendo el mismo costo computacional.

💪🏻 Escalado de Datos: En comparación con Wan2.1, Wan2.2 se entrena con datos significativamente mayores, con un +65.6% más de imágenes y +83.2% más de videos. Esta expansión mejora notablemente la generalización del modelo en múltiples dimensiones como movimientos, semántica y estética, logrando un rendimiento TOP entre todos los modelos de código abierto y cerrados.

🎬 Estética Cinematográfica: Wan2.2 incorpora datos estéticos especialmente seleccionados con etiquetas detalladas para iluminación, composición y color. Esto permite una generación de estilo cinematográfico más precisa y controlable, facilitando la creación de videos con preferencias estéticas personalizables.

🚀 Híbrido TI2V Eficiente en Alta Definición: Wan2.2 abre su código para un modelo 5B construido con nuestro avanzado Wan2.2-VAE que logra una relación de compresión de 16×16×4. Este modelo soporta generación de texto a video e imagen a video en resolución 720P con 24fps y puede funcionar en tarjetas gráficas de consumo como la 4090. Es uno de los modelos 720P@24fps más rápidos disponibles, capaz de atender sectores industriales y académicos simultáneamente.

Wan2.2-T2V-A14B

El modelo T2V-A14B soporta la generación de videos de 5s en resoluciones 480P y 720P. Construido con una arquitectura Mixture-of-Experts (MoE), ofrece una calidad sobresaliente en la generación de video. En nuestro nuevo benchmark Wan-Bench 2.0, el modelo supera a los principales modelos comerciales en la mayoría de las dimensiones clave de evaluación.

Wan2.2-I2V-A14B

El modelo I2V-A14B, diseñado para generación de video a partir de imagen, soporta resoluciones 480P y 720P. Construido con arquitectura Mixture-of-Experts (MoE), logra una síntesis de video más estable con movimientos de cámara menos irreales y ofrece mejor soporte para escenas estilizadas diversas.

Wan2.2-TI2V-5B

El modelo TI2V-5B está construido con el avanzado Wan2.2-VAE que logra una relación de compresión de 16×16×4. Este modelo soporta generación de texto a video y de imagen a video a resolución 720P con 24fps y puede funcionar con una GPU de consumo única como la 4090. Es uno de los modelos 720P@24fps más rápidos disponibles, satisfaciendo las necesidades tanto de aplicaciones industriales como de investigación académica.

GitHub: https://github.com/Wan-Video/Wan2.2

Repositorio Original en HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Anterior
Plagion - v1.0
Siguiente
Fotografía Callejera Fotorrealista - J^p^N - Japón

Detalles del Modelo

Tipo de modelo

Checkpoint

Modelo base

Wan Video 2.2 T2V-A14B

Versión del modelo

t2v_high_noise_14B

Hash del modelo

cad711ae21

Creador

Discusión

Por favor log in para dejar un comentario.