Wan Video 2.2 - 14B Texte-à-Vidéo
Paramètres recommandés
resolution
vae
Conseils
Wan2.2 intègre une architecture Mixture-of-Experts (MoE) pour séparer le débruitage sur les étapes temporelles, augmentant la capacité sans accroître la charge computationnelle.
Les données d'entraînement ont été étendues de +65.6 % en images et +83.2 % en vidéos, améliorant la généralisation en mouvements, sémantique et esthétique.
Des données esthétiques spécialement sélectionnées avec des labels détaillés permettent une génération précise et contrôlable de styles cinématographiques.
Wan2.2-VAE atteint un taux de compression de 16×16×4, supportant une génération vidéo efficace en 720P@24fps sur GPU grand public comme le Nvidia 4090.
Points forts de la version
Wan 2.2 14B pour génération Texte-à-Vidéo sur site
Wan Video
Note : D'autres fichiers Wan Video sont hébergés sur Civitai - ils peuvent être des doublons, mais cette fiche modèle sert principalement à héberger les fichiers utilisés par Wan Video dans le Générateur Civitai.
Ces fichiers sont la Repack ComfyUI - les fichiers originaux se trouvent dans Diffusers/format safetensors multipart ici.
Wan2.2, une mise à jour majeure de nos modèles génératifs visuels, désormais open-source, offrant des capacités plus puissantes, de meilleures performances et une qualité visuelle supérieure. Avec Wan2.2, nous nous sommes concentrés sur l’intégration des innovations techniques suivantes :
👍 Architecture MoE : Wan2.2 introduit une architecture Mixture-of-Experts (MoE) dans les modèles de diffusion vidéo. En séparant le processus de débruitage sur plusieurs étapes temporelles avec des modèles experts spécialisés et puissants, cela agrandit la capacité globale du modèle tout en maintenant le même coût computationnel.
💪🏻 Échelle des données : Par rapport à Wan2.1, Wan2.2 est entraîné sur une quantité de données nettement supérieure, avec +65.6 % d’images en plus et +83.2 % de vidéos en plus. Cette expansion améliore notablement la généralisation du modèle à plusieurs dimensions telles que les mouvements, la sémantique et l’esthétique, atteignant une performance TOP parmi tous les modèles open-source et propriétaires.
🎬 Esthétique cinématographique : Wan2.2 intègre des données esthétiques spécialement sélectionnées avec des labels détaillés pour l’éclairage, la composition et la couleur. Cela permet une génération de style cinématographique plus précise et contrôlable, facilitant la création de vidéos avec des préférences esthétiques personnalisables.
🚀 TI2V hybride haute définition efficace : Wan2.2 rend open-source un modèle 5B construit avec notre Wan2.2-VAE avancé qui atteint un taux de compression de 16×16×4. Ce modèle prend en charge la génération texte-à-vidéo et image-à-vidéo en résolution 720P à 24fps et peut fonctionner sur des cartes graphiques grand public comme la 4090. C’est l’un des modèles 720P@24fps les plus rapides disponibles, capable de répondre simultanément aux secteurs industriel et académique.
Wan2.2-T2V-A14B
Le modèle T2V-A14B supporte la génération de vidéos de 5 secondes en résolution 480P et 720P. Construit avec une architecture Mixture-of-Experts (MoE), il offre une qualité de génération vidéo remarquable. Sur notre nouveau benchmark Wan-Bench 2.0, ce modèle dépasse les modèles commerciaux leaders sur la plupart des dimensions clés d’évaluation.
Wan2.2-I2V-A14B
Le modèle I2V-A14B, conçu pour la génération image-à-vidéo, prend en charge les résolutions 480P et 720P. Grâce à l’architecture Mixture-of-Experts (MoE), il réalise une synthèse vidéo plus stable avec des mouvements de caméra irréalistes réduits et offre un support amélioré pour des scènes stylisées variées.
Wan2.2-TI2V-5B
Le modèle TI2V-5B est construit avec le Wan2.2-VAE avancé qui atteint un taux de compression de 16×16×4. Ce modèle supporte la génération texte-à-vidéo et image-à-vidéo en résolution 720P à 24fps et peut fonctionner sur un seul GPU grand public tel que le 4090. C’est l’un des modèles 720P@24fps les plus rapides disponibles, répondant aux besoins des applications industrielles et de la recherche académique.
GitHub : https://github.com/Wan-Video/Wan2.2
Dépôt HuggingFace original : https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Détails du modèle
Type de modèle
Modèle de base
Version du modèle
Hash du modèle
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.
