Um robô branco elegante servindo uma xícara de café para um homem sentado em uma cabine aconchegante de café sob luzes quentes penduradas no teto, capturado com fotografia natural de smartphone.
Fotografia nostálgica dos anos 1990 de um estudante universitário digitando código em um computador vintage dos anos 90 em um dormitório com papel de parede verde e piso de carpete, iluminado por uma luminária de mesa.
Uma figura misteriosa vestindo um manto preto completo está em um beco pouco iluminado cercado por prédios altos com canos visíveis, vazamento de vapor e fiação elétrica, evocando uma atmosfera cyberpunk e levemente assustadora.
Vista de dentro de um carro dirigindo por uma rodovia tropical molhada com palmeiras alinhando a estrada durante um dia chuvoso.
Vista de dentro de um carro dirigindo por um bairro suburbano em um dia chuvoso e ventoso com casas ao estilo americano alinhando a rua.
Homem vestindo um terno branco listrado e óculos escuros, perto de palmeiras com um arranha-céu moderno de Miami ao fundo, fotografado de um ângulo baixo.
Homem afro-americano com afro e óculos escuros vestindo um terno rosa, em pé numa rua de Miami à noite com coqueiros e arranha-céus iluminados por neon ao fundo, visto de um ângulo baixo.
Grupo de jovens vestindo shorts jeans e tops curtos curtindo a noite perto de palmeiras, iluminadas por luzes de neon e arranha-céus modernos em Miami

Parâmetros Recomendados

resolution

1280x720, 854x480

vae

Wan2.2-VAE - advanced

Dicas

Wan2.2 incorpora uma arquitetura Mixture-of-Experts (MoE) para separar a remoção de ruído entre os timesteps, aumentando a capacidade sem aumentar a carga computacional.

Os dados de treinamento foram ampliados em +65,6% em imagens e +83,2% em vídeos, melhorando a generalização em movimento, semântica e estética.

Dados estéticos especialmente selecionados com rótulos detalhados permitem uma geração de estilo cinematográfico precisa e controlável.

Wan2.2-VAE alcança uma taxa de compressão de 16×16×4, suportando geração eficiente de vídeo em 720P@24fps em GPUs de consumidor como a Nvidia 4090.

Destaques da Versão

Wan 2.2 14B para Geração On-site de Texto para Vídeo

Wan Video

Aviso: Existem outros arquivos Wan Video hospedados no Civitai - estes podem ser duplicatas, mas esta ficha do modelo é principalmente para hospedar os arquivos usados pelo Wan Video no Gerador Civitai.

Estes arquivos são o Pacote Reempacotado ComfyUI - os arquivos originais podem ser encontrados em Diffusers/formato safetensors multipart aqui.

Wan2.2, uma grande atualização para nossos modelos visuais generativos, agora open-source, oferecendo capacidades mais poderosas, melhor desempenho e qualidade visual superior. Com Wan2.2, focamos na incorporação das seguintes inovações técnicas:

👍 Arquitetura MoE: Wan2.2 introduz uma arquitetura Mixture-of-Experts (MoE) nos modelos de difusão de vídeo. Separando o processo de remoção de ruído entre os timesteps com modelos especializados, isso amplia a capacidade total do modelo mantendo o mesmo custo computacional.

💪🏻 Escalonamento de Dados: Comparado ao Wan2.1, Wan2.2 é treinado com dados significativamente maiores, com +65,6% mais imagens e +83,2% mais vídeos. Essa expansão melhora notavelmente a generalização do modelo em múltiplas dimensões como movimentos, semântica e estética, alcançando desempenho TOP entre todos os modelos open-source e fechados.

🎬 Estética Cinematográfica: Wan2.2 incorpora dados estéticos especialmente selecionados com rótulos detalhados para iluminação, composição e cor. Isso permite uma geração de estilo cinematográfico mais precisa e controlável, facilitando a criação de vídeos com preferências estéticas personalizáveis.

🚀 TI2V Híbrido em Alta Definição Eficiente: Wan2.2 open-sourca um modelo 5B construído com nosso avançado Wan2.2-VAE que alcança uma taxa de compressão de 16×16×4. Este modelo suporta geração texto para vídeo e imagem para vídeo em resolução 720P a 24fps, podendo rodar em placas gráficas de consumidor como a 4090. É um dos modelos 720P@24fps mais rápidos disponíveis, capaz de atender simultaneamente os setores industrial e acadêmico.

Wan2.2-T2V-A14B

O modelo T2V-A14B suporta geração de vídeos de 5 segundos nas resoluções 480P e 720P. Construído com arquitetura Mixture-of-Experts (MoE), oferece qualidade excepcional na geração de vídeo. Em nosso novo benchmark Wan-Bench 2.0, o modelo supera os principais modelos comerciais na maioria das dimensões de avaliação.

Wan2.2-I2V-A14B

O modelo I2V-A14B, projetado para geração de imagem para vídeo, suporta as resoluções 480P e 720P. Construído com a arquitetura Mixture-of-Experts (MoE), alcança uma síntese de vídeo mais estável com movimentos de câmera menos irreais e oferece suporte aprimorado para cenas estilizadas diversas.

Wan2.2-TI2V-5B

O modelo TI2V-5B é construído com o avançado Wan2.2-VAE que atinge uma taxa de compressão de 16×16×4. Esse modelo suporta geração tanto de texto para vídeo quanto de imagem para vídeo em resolução 720P a 24fps e pode rodar em uma única GPU de consumidor como a 4090. É um dos modelos 720P@24fps mais rápidos disponíveis, atendendo às necessidades de aplicações industriais e pesquisas acadêmicas.

GitHub: https://github.com/Wan-Video/Wan2.2

Repositório Original HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Anterior
Konya Karasue | TIA V7 | Illustrious XL - v1.0
Próximo
Niji semi realism - v3.0 - Flux

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

Wan Video 2.2 T2V-A14B

Versão do modelo

14B Text-to-Video

Hash do modelo

33fc2f5384

Criador

Discussão

Por favor, faça log in para deixar um comentário.