Um robô branco elegante servindo uma xícara de café para um homem sentado em uma cabine aconchegante de café sob luzes quentes penduradas no teto, capturado com fotografia natural de smartphone.
Fotografia nostálgica dos anos 1990 de um estudante universitário digitando código em um computador vintage dos anos 90 em um dormitório com papel de parede verde e piso de carpete, iluminado por uma luminária de mesa.
Uma figura misteriosa vestindo um manto preto completo está em um beco pouco iluminado cercado por prédios altos com canos visíveis, vazamento de vapor e fiação elétrica, evocando uma atmosfera cyberpunk e levemente assustadora.
Vista de dentro de um carro dirigindo por uma rodovia tropical molhada com palmeiras alinhando a estrada durante um dia chuvoso.
Vista de dentro de um carro dirigindo por um bairro suburbano em um dia chuvoso e ventoso com casas ao estilo americano alinhando a rua.
Homem vestindo um terno branco listrado e óculos escuros, perto de palmeiras com um arranha-céu moderno de Miami ao fundo, fotografado de um ângulo baixo.
Homem afro-americano com afro e óculos escuros vestindo um terno rosa, em pé numa rua de Miami à noite com coqueiros e arranha-céus iluminados por neon ao fundo, visto de um ângulo baixo.
Grupo de jovens vestindo shorts jeans e tops curtos curtindo a noite perto de palmeiras, iluminadas por luzes de neon e arranha-céus modernos em Miami

Parâmetros Recomendados

resolution

720x480, 720x720

vae

Wan2.2-VAE - advanced

Dicas

Wan2.2 se beneficia de um conjunto de dados em grande escala com +65,6% mais imagens e +83,2% mais vídeos comparado ao Wan2.1.

Usar a arquitetura Mixture-of-Experts (MoE) permite manter o custo computacional enquanto aumenta a capacidade do modelo.

O modelo suporta síntese estável de vídeo com redução em movimentos de câmera não realistas, especialmente para geração de imagem para vídeo.

Destaques da Versão

Wan 2.2 14B para geração de Imagem para Vídeo no local

Patrocinadores do Criador

Confira o repositório oficial Wan2.2 no GitHub para código-fonte e atualizações.

Baixe o ComfyUI Repack dos modelos Wan2.2 em HuggingFace.

Arquivos originais Diffusers multipart safetensors estão disponíveis no Repositório Wan-AI HuggingFace.

Wan Video

Nota: Existem outros arquivos Wan Video hospedados no Civitai - estes podem ser duplicatas, mas este cartão de modelo serve principalmente para hospedar os arquivos usados pelo Wan Video no Civitai Generator.

Estes arquivos são o ComfyUI Repack - os arquivos originais podem ser encontrados em Diffusers/formato safetensors multipartes aqui.

Wan2.2, uma grande atualização de nossos modelos generativos visuais, agora open-source, oferecendo capacidades mais poderosas, melhor desempenho e qualidade visual superior. Com Wan2.2, focamos em incorporar as seguintes inovações técnicas:

👍 Arquitetura MoE: Wan2.2 introduz uma arquitetura Mixture-of-Experts (MoE) nos modelos de difusão de vídeo. Ao separar o processo de denoising por passos de tempo com modelos especialistas poderosos, isso amplia a capacidade total do modelo mantendo o mesmo custo computacional.

💪🏻 Escalonamento de Dados: Comparado ao Wan2.1, o Wan2.2 é treinado em uma base de dados significativamente maior, com +65,6% mais imagens e +83,2% mais vídeos. Essa expansão melhora notavelmente a generalização do modelo em múltiplas dimensões, como movimentos, semântica e estética, alcançando desempenho TOP entre todos os modelos open-source e fechados.

🎬 Estética Cinematográfica: Wan2.2 incorpora dados estéticos especialmente selecionados com rótulos detalhados para iluminação, composição e cor. Isso permite uma geração de estilo cinematográfico mais precisa e controlável, facilitando a criação de vídeos com preferências estéticas customizáveis.

🚀 TI2V Híbrido Eficiente em Alta Definição: Wan2.2 open-source um modelo 5B construído com nosso avançado Wan2.2-VAE que alcança uma taxa de compressão de 16×16×4. Este modelo suporta geração de texto para vídeo e imagem para vídeo em resolução 720P com 24fps e também pode ser executado em placas gráficas de consumo como a 4090. É um dos modelos 720P@24fps mais rápidos disponíveis, capaz de atender simultaneamente setores industrial e acadêmico.

Wan2.2-T2V-A14B

O modelo T2V-A14B suporta geração de vídeos de 5 segundos nas resoluções 480P e 720P. Construído com arquitetura Mixture-of-Experts (MoE), oferece qualidade excepcional de geração de vídeo. Em nosso novo benchmark Wan-Bench 2.0, o modelo supera os principais modelos comerciais em quase todas as dimensões-chave de avaliação.

Wan2.2-I2V-A14B

O modelo I2V-A14B, projetado para geração de imagem para vídeo, suporta resoluções 480P e 720P. Construído com arquitetura Mixture-of-Experts (MoE), consegue uma síntese de vídeo mais estável com movimentos de câmera irrealistas reduzidos e oferece suporte aprimorado para cenas estilizadas diversificadas.

Wan2.2-TI2V-5B

O modelo TI2V-5B é construído com o avançado Wan2.2-VAE que alcança uma taxa de compressão de 16×16×4. Este modelo suporta geração de texto para vídeo e imagem para vídeo em resolução 720P com 24fps e pode rodar em GPU de consumo única como a 4090. É um dos modelos 720P@24fps mais rápidos disponíveis, atendendo às necessidades tanto de aplicações industriais quanto de pesquisas acadêmicas.

GitHub: https://github.com/Wan-Video/Wan2.2

Repositório original HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Anterior
Plenty of Consent - V1
Próximo
WAN 25 Realistic - I2V LOW v1.0

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

Wan Video 2.2 I2V-A14B

Versão do modelo

14B Image-to-Video

Hash do modelo

33fc2f5384

Criador

Discussão

Por favor, faça log in para deixar um comentário.