Un robot blanco y elegante sirviendo una taza de café a un hombre sentado en un cómodo asiento de cabina en un café bajo luces colgantes cálidas, capturado con fotografía natural de smartphone.
Fotografía nostálgica de los 1990s de un estudiante universitario escribiendo código en una computadora vintage de los 90 en una habitación de dormitorio con papel tapiz verde y piso alfombrado, iluminada por una lámpara de escritorio.
Una figura misteriosa vestida con una capa negra completa está en un callejón poco iluminado rodeado de edificios altos con tuberías visibles, fuga de vapor y cableado eléctrico, evocando una atmósfera cyberpunk y ligeramente inquietante.
Vista desde el interior de un coche conduciendo por una carretera tropical mojada con palmeras que bordean la carretera durante un día lluvioso.
Vista desde dentro de un auto conduciendo por un vecindario suburbano en un día lluvioso y ventoso con casas de estilo americano a lo largo de la calle.
Hombre vistiendo un traje blanco a rayas y gafas de sol parado cerca de palmeras con un rascacielos moderno de Miami al fondo, tomado desde un ángulo de cámara bajo.
Hombre afroamericano con afro y gafas de sol, vestido con traje rosa, de pie en una calle de Miami de noche con palmeras y rascacielos iluminados con neón al fondo, visto desde un ángulo bajo.
Grupo de jóvenes vestidas con shorts de mezclilla y crop tops disfrutando una noche cerca de palmeras, iluminadas por luces de neón y rascacielos modernos en Miami

Parámetros Recomendados

resolution

720x480, 720x720

vae

Wan2.2-VAE - advanced

Consejos

Wan2.2 se beneficia de un conjunto de datos a gran escala con +65.6% más imágenes y +83.2% más videos en comparación con Wan2.1.

El uso de la arquitectura Mixture-of-Experts (MoE) permite mantener el costo computacional mientras se incrementa la capacidad del modelo.

El modelo soporta síntesis de video estable con movimientos de cámara menos irreales, especialmente para generación de imagen a video.

Aspectos Destacados de la Versión

Wan 2.2 14B para generación de imagen a video en sitio

Patrocinadores del Creador

Consulta el repositorio oficial de Wan2.2 en GitHub para el código fuente y actualizaciones.

Descarga el Reempaquetado ComfyUI de los modelos Wan2.2 desde HuggingFace.

Los archivos originales Diffusers multi-part safetensors están disponibles en el Repositorio Wan-AI en HuggingFace.

Wan Video

Nota: Hay otros archivos Wan Video alojados en Civitai - estos pueden ser duplicados, pero esta tarjeta del modelo está principalmente para alojar los archivos usados por Wan Video en el Generador Civitai.

Estos archivos son el Reempaquetado ComfyUI - los archivos originales se pueden encontrar en Diffusers/formato safetensors multipart aquí.

Wan2.2, una gran actualización de nuestros modelos generativos visuales, que ahora es de código abierto, ofrece capacidades más potentes, mejor rendimiento y calidad visual superior. Con Wan2.2, nos centramos en incorporar las siguientes innovaciones técnicas:

👍 Arquitectura MoE: Wan2.2 introduce una arquitectura Mixture-of-Experts (MoE) en modelos de difusión de video. Al separar el proceso de desruido a lo largo de los tiempos con modelos expertos especializados y potentes, esto aumenta la capacidad total del modelo manteniendo el mismo costo computacional.

💪🏻 Escalado de Datos: En comparación con Wan2.1, Wan2.2 se entrena con un conjunto de datos significativamente mayor, con +65.6% más imágenes y +83.2% más videos. Esta expansión mejora notablemente la generalización del modelo en múltiples dimensiones como movimientos, semántica y estética, logrando un rendimiento TOP entre modelos de código abierto y cerrados.

🎬 Estética Cinematográfica: Wan2.2 incorpora datos estéticos especialmente seleccionados con etiquetas detalladas para iluminación, composición y color. Esto permite una generación de estilo cinematográfico más precisa y controlable, facilitando la creación de videos con preferencias estéticas personalizables.

🚀 TI2V Híbrido en Alta Definición Eficiente: Wan2.2 libera un modelo de 5B construido con nuestro avanzado Wan2.2-VAE que logra una tasa de compresión de 16×16×4. Este modelo soporta generación tanto de texto a video como de imagen a video en resolución 720P a 24fps y puede correr en tarjetas gráficas de consumo como la 4090. Es uno de los modelos más rápidos en 720P@24fps disponibles, capaz de servir tanto al sector industrial como académico simultáneamente.

Wan2.2-T2V-A14B

El modelo T2V-A14B soporta la generación de videos de 5s en resoluciones 480P y 720P. Construido con una arquitectura Mixture-of-Experts (MoE), ofrece una calidad sobresaliente en la generación de video. En nuestro nuevo benchmark Wan-Bench 2.0, el modelo supera a los principales modelos comerciales en la mayoría de las dimensiones clave de evaluación.

Wan2.2-I2V-A14B

El modelo I2V-A14B, diseñado para generación de imagen a video, soporta resoluciones de 480P y 720P. Construido con arquitectura Mixture-of-Experts (MoE), logra una síntesis de video más estable con movimientos de cámara menos irreales y ofrece mejor soporte para escenas estilizadas diversas.

Wan2.2-TI2V-5B

El modelo TI2V-5B está construido con el avanzado Wan2.2-VAE que logra una tasa de compresión de 16×16×4. Este modelo soporta generación tanto de texto a video como de imagen a video en resolución 720P a 24fps y puede funcionar en una sola GPU de consumo como la 4090. Es uno de los modelos más rápidos en 720P@24fps disponibles, satisfaciendo las necesidades tanto de aplicaciones industriales como de investigación académica.

GitHub: https://github.com/Wan-Video/Wan2.2

Repositorio Original en HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Anterior
Plenty of Consent - V1
Siguiente
WAN 25 Realistic - I2V LOW v1.0

Detalles del Modelo

Tipo de modelo

Checkpoint

Modelo base

Wan Video 2.2 I2V-A14B

Versión del modelo

14B Image-to-Video

Hash del modelo

33fc2f5384

Creador

Discusión

Por favor log in para dejar un comentario.