modelos/Wan Video 2.2 - 5B Texto-Imagens-para-Vídeo

Wan Video 2.2 - 5B Texto-Imagens-para-Vídeo

|
8/25/2025
|
1:26:46 AM
| Discussion|
0
Um robô branco elegante servindo uma xícara de café para um homem sentado em uma cabine aconchegante de café sob luzes quentes penduradas no teto, capturado com fotografia natural de smartphone.
Fotografia nostálgica dos anos 1990 de um estudante universitário digitando código em um computador vintage dos anos 90 em um dormitório com papel de parede verde e piso de carpete, iluminado por uma luminária de mesa.
Uma figura misteriosa vestindo um manto preto completo está em um beco pouco iluminado cercado por prédios altos com canos visíveis, vazamento de vapor e fiação elétrica, evocando uma atmosfera cyberpunk e levemente assustadora.
Vista de dentro de um carro dirigindo por uma rodovia tropical molhada com palmeiras alinhando a estrada durante um dia chuvoso.
Vista de dentro de um carro dirigindo por um bairro suburbano em um dia chuvoso e ventoso com casas ao estilo americano alinhando a rua.
Homem vestindo um terno branco listrado e óculos escuros, perto de palmeiras com um arranha-céu moderno de Miami ao fundo, fotografado de um ângulo baixo.
Homem afro-americano com afro e óculos escuros vestindo um terno rosa, em pé numa rua de Miami à noite com coqueiros e arranha-céus iluminados por neon ao fundo, visto de um ângulo baixo.
Grupo de jovens vestindo shorts jeans e tops curtos curtindo a noite perto de palmeiras, iluminadas por luzes de neon e arranha-céus modernos em Miami

Parâmetros Recomendados

resolution

1280x720, 854x480

vae

Wan2.2-VAE - advanced

Dicas

Wan2.2 incorpora uma arquitetura Mixture-of-Experts (MoE) para separar o desnoising entre os timesteps, aumentando a capacidade sem aumentar a carga computacional.

Os dados de treinamento foram expandidos em +65,6% para imagens e +83,2% para vídeos, melhorando a generalização em movimento, semântica e estética.

Dados estéticos especialmente selecionados com etiquetas detalhadas permitem uma geração precisa e controlável de estilo cinematográfico.

Wan2.2-VAE alcança uma taxa de compressão de 16×16×4, suportando geração eficiente de vídeo em 720P@24fps em GPUs de consumidor como a Nvidia 4090.

Destaques da Versão

Wan 2.2 5B para Geração On-site

Wan Video

Nota: Existem outros arquivos Wan Video hospedados no Civitai - eles podem ser duplicatas, mas esta ficha do modelo é principalmente para hospedar os arquivos usados pelo Wan Video no Gerador do Civitai.

Estes arquivos são o ComfyUI Repack - os arquivos originais podem ser encontrados em Diffusers/formato safetensors multipartes aqui.

Wan2.2, uma grande atualização dos nossos modelos generativos visuais, agora open-source, oferecendo capacidades mais poderosas, melhor desempenho e qualidade visual superior. Com Wan2.2, focamos em incorporar as seguintes inovações técnicas:

👍 Arquitetura MoE: Wan2.2 introduz uma arquitetura Mixture-of-Experts (MoE) nos modelos de difusão de vídeo. Ao separar o processo de desnoising entre os timesteps com modelos especializados e poderosos de especialistas, isso amplia a capacidade total do modelo mantendo o mesmo custo computacional.

💪🏻 Escala de Dados: Comparado ao Wan2.1, o Wan2.2 foi treinado com um conjunto de dados significativamente maior, com +65,6% mais imagens e +83,2% mais vídeos. Essa expansão melhora notavelmente a generalização do modelo em múltiplas dimensões como movimentos, semântica e estética, alcançando desempenho TOP entre todos os modelos abertos e fechados.

🎬 Estética Cinematográfica: Wan2.2 incorpora dados estéticos cuidadosamente selecionados com etiquetas detalhadas para iluminação, composição e cor. Isso permite uma geração de estilo cinematográfico mais precisa e controlável, facilitando a criação de vídeos com preferências estéticas personalizáveis.

🚀 TI2V Híbrido de Alta Definição Eficiente: Wan2.2 disponibiliza open-source um modelo 5B construído com nosso avançado Wan2.2-VAE que alcança uma taxa de compressão de 16×16×4. Este modelo suporta geração tanto de texto-para-vídeo quanto de imagem-para-vídeo em resolução 720P a 24fps e pode rodar em placas gráficas de consumidor como a 4090. É um dos modelos 720P@24fps mais rápidos atualmente disponíveis, capaz de atender tanto os setores industrial quanto acadêmico simultaneamente.

Wan2.2-T2V-A14B

O modelo T2V-A14B suporta a geração de vídeos de 5 segundos nas resoluções 480P e 720P. Construído com arquitetura Mixture-of-Experts (MoE), oferece qualidade excepcional na geração de vídeos. No nosso novo benchmark Wan-Bench 2.0, o modelo supera os principais modelos comerciais na maioria das avaliações-chave.

Wan2.2-I2V-A14B

O modelo I2V-A14B, projetado para geração de imagem-para-vídeo, suporta resoluções 480P e 720P. Construído com arquitetura Mixture-of-Experts (MoE), alcança uma síntese de vídeo mais estável com movimentos de câmera menos irreais e oferece suporte aprimorado para cenas estilizadas variadas.

Wan2.2-TI2V-5B

O modelo TI2V-5B é construído com o avançado Wan2.2-VAE que alcança uma taxa de compressão de 16×16×4. Este modelo suporta geração tanto de texto-para-vídeo quanto imagem-para-vídeo em resolução 720P a 24fps e roda em uma GPU de consumidor única como a 4090. É um dos modelos 720P@24fps mais rápidos disponíveis, atendendo às necessidades de aplicações industriais e pesquisa acadêmica.

GitHub: https://github.com/Wan-Video/Wan2.2

Repositório Original no HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Anterior
Impressionismo - Flux
Próximo
Estilo Vibrantly Sharp - Estilo Vibrantly Sharp v.3

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

Wan Video 2.2 TI2V-5B

Versão do modelo

5B Text-Image-to-Video

Hash do modelo

33fc2f5384

Criador

Discussão

Por favor, faça log in para deixar um comentário.