Wan Video 2.2 - 14B Texto para Vídeo
Parâmetros Recomendados
resolution
vae
Dicas
Wan2.2 incorpora uma arquitetura Mixture-of-Experts (MoE) para separar a remoção de ruído entre os timesteps, aumentando a capacidade sem aumentar a carga computacional.
Os dados de treinamento foram ampliados em +65,6% em imagens e +83,2% em vídeos, melhorando a generalização em movimento, semântica e estética.
Dados estéticos especialmente selecionados com rótulos detalhados permitem uma geração de estilo cinematográfico precisa e controlável.
Wan2.2-VAE alcança uma taxa de compressão de 16×16×4, suportando geração eficiente de vídeo em 720P@24fps em GPUs de consumidor como a Nvidia 4090.
Destaques da Versão
Wan 2.2 14B para Geração On-site de Texto para Vídeo
Wan Video
Aviso: Existem outros arquivos Wan Video hospedados no Civitai - estes podem ser duplicatas, mas esta ficha do modelo é principalmente para hospedar os arquivos usados pelo Wan Video no Gerador Civitai.
Estes arquivos são o Pacote Reempacotado ComfyUI - os arquivos originais podem ser encontrados em Diffusers/formato safetensors multipart aqui.
Wan2.2, uma grande atualização para nossos modelos visuais generativos, agora open-source, oferecendo capacidades mais poderosas, melhor desempenho e qualidade visual superior. Com Wan2.2, focamos na incorporação das seguintes inovações técnicas:
👍 Arquitetura MoE: Wan2.2 introduz uma arquitetura Mixture-of-Experts (MoE) nos modelos de difusão de vídeo. Separando o processo de remoção de ruído entre os timesteps com modelos especializados, isso amplia a capacidade total do modelo mantendo o mesmo custo computacional.
💪🏻 Escalonamento de Dados: Comparado ao Wan2.1, Wan2.2 é treinado com dados significativamente maiores, com +65,6% mais imagens e +83,2% mais vídeos. Essa expansão melhora notavelmente a generalização do modelo em múltiplas dimensões como movimentos, semântica e estética, alcançando desempenho TOP entre todos os modelos open-source e fechados.
🎬 Estética Cinematográfica: Wan2.2 incorpora dados estéticos especialmente selecionados com rótulos detalhados para iluminação, composição e cor. Isso permite uma geração de estilo cinematográfico mais precisa e controlável, facilitando a criação de vídeos com preferências estéticas personalizáveis.
🚀 TI2V Híbrido em Alta Definição Eficiente: Wan2.2 open-sourca um modelo 5B construído com nosso avançado Wan2.2-VAE que alcança uma taxa de compressão de 16×16×4. Este modelo suporta geração texto para vídeo e imagem para vídeo em resolução 720P a 24fps, podendo rodar em placas gráficas de consumidor como a 4090. É um dos modelos 720P@24fps mais rápidos disponíveis, capaz de atender simultaneamente os setores industrial e acadêmico.
Wan2.2-T2V-A14B
O modelo T2V-A14B suporta geração de vídeos de 5 segundos nas resoluções 480P e 720P. Construído com arquitetura Mixture-of-Experts (MoE), oferece qualidade excepcional na geração de vídeo. Em nosso novo benchmark Wan-Bench 2.0, o modelo supera os principais modelos comerciais na maioria das dimensões de avaliação.
Wan2.2-I2V-A14B
O modelo I2V-A14B, projetado para geração de imagem para vídeo, suporta as resoluções 480P e 720P. Construído com a arquitetura Mixture-of-Experts (MoE), alcança uma síntese de vídeo mais estável com movimentos de câmera menos irreais e oferece suporte aprimorado para cenas estilizadas diversas.
Wan2.2-TI2V-5B
O modelo TI2V-5B é construído com o avançado Wan2.2-VAE que atinge uma taxa de compressão de 16×16×4. Esse modelo suporta geração tanto de texto para vídeo quanto de imagem para vídeo em resolução 720P a 24fps e pode rodar em uma única GPU de consumidor como a 4090. É um dos modelos 720P@24fps mais rápidos disponíveis, atendendo às necessidades de aplicações industriais e pesquisas acadêmicas.
GitHub: https://github.com/Wan-Video/Wan2.2
Repositório Original HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Detalhes do Modelo
Tipo de modelo
Modelo base
Versão do modelo
Hash do modelo
Criador
Discussão
Por favor, faça log in para deixar um comentário.
