Wan Video 2.2 - t2v_high_noise_14B
Parâmetros Recomendados
resolution
vae
Destaques da Versão
wan2.2_t2v_high_noise_14B_fp8_scaled
Patrocinadores do Criador
Estes arquivos são o Repack do ComfyUI - os arquivos originais podem ser encontrados em formato Diffusers/multi-part safetensors aqui.
GitHub: https://github.com/Wan-Video/Wan2.2
Repo original no HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Wan Video
Nota: Há outros arquivos Wan Video hospedados no Civitai - podem ser duplicatas, mas esta ficha de modelo é principalmente para hospedar os arquivos usados pelo Wan Video no Civitai Generator.
Estes arquivos são o Repack do ComfyUI - os arquivos originais podem ser encontrados em formato Diffusers/multi-part safetensors aqui.
Wan2.2, uma atualização importante dos nossos modelos generativos visuais, agora open-source, oferecendo capacidades mais poderosas, melhor desempenho e qualidade visual superior. Com Wan2.2, focamos em incorporar as seguintes inovações técnicas:
👍 Arquitetura MoE: Wan2.2 introduz uma arquitetura Mixture-of-Experts (MoE) em modelos de difusão de vídeo. Ao separar o processo de remoção de ruído entre passos temporais com modelos especialistas poderosos especializados, isto amplia a capacidade total do modelo mantendo o mesmo custo computacional.
💪🏻 Escala de Dados: Comparado ao Wan2.1, Wan2.2 é treinado em dados significativamente maiores, com +65,6% mais imagens e +83,2% mais vídeos. Essa expansão melhora notavelmente a generalização do modelo em múltiplas dimensões como movimentos, semântica e estética, alcançando desempenho TOP entre todos os modelos open-source e closed-source.
🎬 Estética Cinematográfica: Wan2.2 incorpora dados estéticos especialmente curados com rótulos detalhados para iluminação, composição e cor. Isso permite uma geração de estilo cinematográfico mais precisa e controlável, facilitando a criação de vídeos com preferências estéticas personalizáveis.
🚀 TI2V Híbrido em Alta Definição Eficiente: Wan2.2 open-sourca um modelo 5B construído com nosso avançado Wan2.2-VAE que alcança uma taxa de compressão de 16×16×4. Este modelo suporta geração de texto para vídeo e imagem para vídeo em resolução 720P com 24fps, e também pode rodar em placas gráficas de consumidor como a 4090. É um dos modelos 720P@24fps mais rápidos disponíveis atualmente, capaz de atender tanto setores industriais quanto acadêmicos simultaneamente.
Wan2.2-T2V-A14B
O modelo T2V-A14B suporta geração de vídeos de 5 segundos em resoluções 480P e 720P. Construído com a arquitetura Mixture-of-Experts (MoE), oferece qualidade excepcional na geração de vídeos. Em nosso novo benchmark Wan-Bench 2.0, o modelo supera os principais modelos comerciais na maioria das dimensões chave de avaliação.
Wan2.2-I2V-A14B
O modelo I2V-A14B, projetado para geração de vídeo a partir de imagem, suporta resoluções 480P e 720P. Construído com arquitetura Mixture-of-Experts (MoE), alcança uma síntese de vídeo mais estável com movimentos de câmera menos irreais e oferece suporte aprimorado para cenas estilizadas diversas.
Wan2.2-TI2V-5B
O modelo TI2V-5B é construído com o avançado Wan2.2-VAE que alcança uma taxa de compressão de 16×16×4. Este modelo suporta geração de texto para vídeo e imagem para vídeo em resolução 720P com 24fps e pode rodar em uma única GPU de consumo como a 4090. É um dos modelos mais rápidos 720P@24fps disponíveis, atendendo as necessidades tanto de aplicações industriais quanto de pesquisa acadêmica.
GitHub: https://github.com/Wan-Video/Wan2.2
Repo original no HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Detalhes do Modelo
Tipo de modelo
Modelo base
Versão do modelo
Hash do modelo
Criador
Discussão
Por favor, faça log in para deixar um comentário.
