Wan Video 2.2 - 14B Image-to-Video
Paramètres recommandés
resolution
vae
Conseils
Wan2.2 bénéficie d'un jeu de données à grande échelle avec +65,6 % d'images en plus et +83,2 % de vidéos en plus par rapport à Wan2.1.
L'utilisation de l'architecture Mixture-of-Experts (MoE) permet de maintenir le coût computationnel tout en augmentant la capacité du modèle.
Le modèle supporte une synthèse vidéo stable avec des mouvements de caméra irréalistes réduits, en particulier pour la génération image-à-vidéo.
Points forts de la version
Wan 2.2 14B pour génération sur site Image-à-Video
Sponsors du créateur
Découvrez le dépôt GitHub officiel Wan2.2 pour le code source et les mises à jour.
Téléchargez le ComfyUI Repack des modèles Wan2.2 depuis HuggingFace.
Les fichiers originaux multi-part safetensors Diffusers sont disponibles sur le dépôt Wan-AI HuggingFace.
Wan Video
Note: D'autres fichiers Wan Video sont hébergés sur Civitai - ils peuvent être des doublons, mais cette fiche modèle sert principalement à héberger les fichiers utilisés par Wan Video dans le générateur Civitai.
Ces fichiers sont le ComfyUI Repack - les fichiers originaux peuvent être trouvés dans le format safetensors multi-part de Diffusers ici.
Wan2.2, une mise à jour majeure de nos modèles génératifs visuels, est maintenant open-source, offrant des capacités plus puissantes, de meilleures performances et une qualité visuelle supérieure. Avec Wan2.2, nous nous sommes concentrés sur l'incorporation des innovations techniques suivantes :
👍 Architecture MoE : Wan2.2 introduit une architecture Mixture-of-Experts (MoE) dans les modèles de diffusion vidéo. En séparant le processus de débruitage à travers les étapes temporelles avec des modèles experts spécialisés et puissants, cela augmente la capacité globale du modèle tout en maintenant le même coût computationnel.
💪🏻 Échelle de données : Comparé à Wan2.1, Wan2.2 est entraîné sur un jeu de données beaucoup plus large, avec +65,6 % d'images supplémentaires et +83,2 % de vidéos en plus. Cette expansion améliore notablement la généralisation du modèle à travers plusieurs dimensions telles que les mouvements, la sémantique et l'esthétique, atteignant des performances de premier rang parmi tous les modèles open-source et propriétaires.
🎬 Esthétique cinématographique : Wan2.2 intègre des données esthétiques spécialement sélectionnées avec des étiquettes fines pour l'éclairage, la composition et la couleur. Cela permet une génération de style cinématographique plus précise et contrôlable, facilitant la création de vidéos avec des préférences esthétiques personnalisables.
🚀 Hybridation haute définition TI2V efficace : Wan2.2 open-source un modèle 5B construit avec notre Wan2.2-VAE avancé qui atteint un taux de compression de 16×16×4. Ce modèle prend en charge la génération texte-à-vidéo et image-à-vidéo en résolution 720P à 24fps et peut également fonctionner sur des cartes graphiques grand public telles que le 4090. C’est l'un des modèles 720P@24fps les plus rapides actuellement disponibles, capable de répondre aux besoins industriels et académiques simultanément.
Wan2.2-T2V-A14B
Le modèle T2V-A14B prend en charge la génération de vidéos de 5 secondes en résolutions 480P et 720P. Construit avec une architecture Mixture-of-Experts (MoE), il offre une qualité de génération vidéo exceptionnelle. Sur notre nouveau benchmark Wan-Bench 2.0, le modèle dépasse les meilleurs modèles commerciaux sur la plupart des critères clés d’évaluation.
Wan2.2-I2V-A14B
Le modèle I2V-A14B, conçu pour la génération image-à-vidéo, prend en charge les résolutions 480P et 720P. Construit avec une architecture Mixture-of-Experts (MoE), il réalise une synthèse vidéo plus stable avec des mouvements de caméra irréalistes réduits et offre un meilleur support pour diverses scènes stylisées.
Wan2.2-TI2V-5B
Le modèle TI2V-5B est construit avec le Wan2.2-VAE avancé qui atteint un taux de compression de 16×16×4. Ce modèle prend en charge la génération texte-à-vidéo et image-à-vidéo en résolution 720P à 24fps et peut fonctionner sur un GPU grand public unique comme le 4090. C’est l'un des modèles 720P@24fps les plus rapides disponibles, répondant aux besoins des applications industrielles et de la recherche académique.
GitHub : https://github.com/Wan-Video/Wan2.2
Dépôt original HuggingFace : https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Détails du modèle
Type de modèle
Modèle de base
Version du modèle
Hash du modèle
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.
