Paramètres recommandés

resolution

1280x720, 854x480

vae

Wan2.2-VAE

Points forts de la version

wan2.2_t2v_high_noise_14B_fp8_scaled

Sponsors du créateur

Wan Video

Note : Il existe d'autres fichiers Wan Video hébergés sur Civitai – ceux-ci peuvent être des doublons, mais cette fiche modèle sert principalement à héberger les fichiers utilisés par Wan Video dans le générateur Civitai.

Ces fichiers sont le ComfyUI Repack – les fichiers originaux sont disponibles dans le format Diffusers/multi-part safetensors ici.

Wan2.2, une mise à niveau majeure de nos modèles génératifs visuels, désormais open-source, offrant des capacités plus puissantes, de meilleures performances et une qualité visuelle supérieure. Avec Wan2.2, nous avons mis l'accent sur l’intégration des innovations techniques suivantes :

👍 Architecture MoE : Wan2.2 introduit une architecture Mixture-of-Experts (MoE) dans les modèles de diffusion vidéo. En séparant le processus de débruitage selon les étapes temporelles avec des modèles experts spécialisés et puissants, cela augmente la capacité globale du modèle tout en maintenant le même coût de calcul.

💪🏻 Échelle des données : Comparé à Wan2.1, Wan2.2 est entraîné sur des données beaucoup plus volumineuses, avec +65,6% d’images en plus et +83,2% de vidéos supplémentaires. Cette expansion améliore notablement la généralisation du modèle dans plusieurs dimensions telles que les mouvements, la sémantique et l’esthétique, atteignant des performances de pointe parmi tous les modèles open-source et propriétaire.

🎬 Esthétique cinématographique : Wan2.2 intègre des données esthétiques spécialement sélectionnées avec des étiquettes fines pour l’éclairage, la composition et la couleur. Cela permet une génération de style cinématographique plus précise et contrôlable, facilitant la création de vidéos avec des préférences esthétiques personnalisables.

🚀 TI2V hybride haute définition efficace : Wan2.2 open-source un modèle 5B construit avec notre avancé Wan2.2-VAE qui atteint un ratio de compression de 16×16×4. Ce modèle prend en charge la génération texte-en-vidéo et image-en-vidéo en résolution 720P à 24fps et peut également fonctionner sur des cartes graphiques grand public comme le 4090. C’est l’un des modèles 720P@24fps les plus rapides actuellement disponibles, capable de servir à la fois les secteurs industriel et académique.

Wan2.2-T2V-A14B

Le modèle T2V-A14B prend en charge la génération de vidéos de 5 secondes en résolutions 480P et 720P. Construit avec une architecture Mixture-of-Experts (MoE), il offre une qualité exceptionnelle de génération vidéo. Sur notre nouveau benchmark Wan-Bench 2.0, le modèle dépasse les modèles commerciaux leaders sur la plupart des dimensions clés d’évaluation.

Wan2.2-I2V-A14B

Le modèle I2V-A14B, conçu pour la génération d’image en vidéo, supporte les résolutions 480P et 720P. Construit avec une architecture Mixture-of-Experts (MoE), il réalise une synthèse vidéo plus stable avec des mouvements de caméra irréalistes réduits et offre un meilleur support pour des scènes stylisées diverses.

Wan2.2-TI2V-5B

Le modèle TI2V-5B est construit avec le Wan2.2-VAE avancé qui atteint un ratio de compression de 16×16×4. Ce modèle prend en charge la génération texte-en-vidéo et image-en-vidéo en résolution 720P à 24fps et peut fonctionner sur un seul GPU grand public tel que le 4090. C’est l’un des modèles 720P@24fps les plus rapides disponibles, répondant aux besoins des applications industrielles et de la recherche académique.

GitHub : https://github.com/Wan-Video/Wan2.2

Dépôt HuggingFace original : https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Précédent
Plagion - v1.0
Suivant
Photographie de rue photoréaliste - J^p^N - Japon

Détails du modèle

Type de modèle

Checkpoint

Modèle de base

Wan Video 2.2 T2V-A14B

Version du modèle

t2v_high_noise_14B

Hash du modèle

cad711ae21

Créateur

Discussion

Veuillez vous log in pour laisser un commentaire.