Un robot blanc élégant servant une tasse de café à un homme assis dans une cabine de café confortable sous des lumières chaudes suspendues au plafond, capturé avec une photographie naturelle au smartphone.
Photographie nostalgique des années 1990 d'un étudiant tapant du code sur un ordinateur vintage des années 90 dans une chambre universitaire avec papier peint vert et tapis, éclairée par une lampe de bureau.
Une figure mystérieuse portant une cape noire complète se tient dans une ruelle faiblement éclairée entourée de hauts bâtiments avec des tuyaux visibles, une fuite de vapeur et des câbles électriques, évoquant une atmosphère cyberpunk légèrement inquiétante.
Vue depuis l'intérieur d'une voiture roulant sur une autoroute tropicale humide bordée de palmiers pendant une journée pluvieuse.
Vue depuis l'intérieur d'une voiture roulant dans un quartier suburbain par une journée pluvieuse et venteuse avec des maisons de style américain le long de la rue.
Homme portant un costume blanc à fines rayures et des lunettes de soleil, debout près de palmiers avec un gratte-ciel moderne de Miami en arrière-plan, photographié sous un angle de caméra bas.
Homme afro-américain avec afro et lunettes de soleil portant un costume rose debout dans une rue de Miami la nuit avec des palmiers et des gratte-ciel éclairés au néon en arrière-plan, vu en contre-plongée.
Groupe de jeunes femmes vêtues de shorts en denim et de crop tops profitant d'une soirée près des palmiers, illuminées par des lumières au néon et des gratte-ciels modernes à Miami

Paramètres recommandés

resolution

720x480, 720x720

vae

Wan2.2-VAE - advanced

Conseils

Wan2.2 bénéficie d'un jeu de données à grande échelle avec +65,6 % d'images en plus et +83,2 % de vidéos en plus par rapport à Wan2.1.

L'utilisation de l'architecture Mixture-of-Experts (MoE) permet de maintenir le coût computationnel tout en augmentant la capacité du modèle.

Le modèle supporte une synthèse vidéo stable avec des mouvements de caméra irréalistes réduits, en particulier pour la génération image-à-vidéo.

Points forts de la version

Wan 2.2 14B pour génération sur site Image-à-Video

Sponsors du créateur

Découvrez le dépôt GitHub officiel Wan2.2 pour le code source et les mises à jour.

Téléchargez le ComfyUI Repack des modèles Wan2.2 depuis HuggingFace.

Les fichiers originaux multi-part safetensors Diffusers sont disponibles sur le dépôt Wan-AI HuggingFace.

Wan Video

Note: D'autres fichiers Wan Video sont hébergés sur Civitai - ils peuvent être des doublons, mais cette fiche modèle sert principalement à héberger les fichiers utilisés par Wan Video dans le générateur Civitai.

Ces fichiers sont le ComfyUI Repack - les fichiers originaux peuvent être trouvés dans le format safetensors multi-part de Diffusers ici.

Wan2.2, une mise à jour majeure de nos modèles génératifs visuels, est maintenant open-source, offrant des capacités plus puissantes, de meilleures performances et une qualité visuelle supérieure. Avec Wan2.2, nous nous sommes concentrés sur l'incorporation des innovations techniques suivantes :

👍 Architecture MoE : Wan2.2 introduit une architecture Mixture-of-Experts (MoE) dans les modèles de diffusion vidéo. En séparant le processus de débruitage à travers les étapes temporelles avec des modèles experts spécialisés et puissants, cela augmente la capacité globale du modèle tout en maintenant le même coût computationnel.

💪🏻 Échelle de données : Comparé à Wan2.1, Wan2.2 est entraîné sur un jeu de données beaucoup plus large, avec +65,6 % d'images supplémentaires et +83,2 % de vidéos en plus. Cette expansion améliore notablement la généralisation du modèle à travers plusieurs dimensions telles que les mouvements, la sémantique et l'esthétique, atteignant des performances de premier rang parmi tous les modèles open-source et propriétaires.

🎬 Esthétique cinématographique : Wan2.2 intègre des données esthétiques spécialement sélectionnées avec des étiquettes fines pour l'éclairage, la composition et la couleur. Cela permet une génération de style cinématographique plus précise et contrôlable, facilitant la création de vidéos avec des préférences esthétiques personnalisables.

🚀 Hybridation haute définition TI2V efficace : Wan2.2 open-source un modèle 5B construit avec notre Wan2.2-VAE avancé qui atteint un taux de compression de 16×16×4. Ce modèle prend en charge la génération texte-à-vidéo et image-à-vidéo en résolution 720P à 24fps et peut également fonctionner sur des cartes graphiques grand public telles que le 4090. C’est l'un des modèles 720P@24fps les plus rapides actuellement disponibles, capable de répondre aux besoins industriels et académiques simultanément.

Wan2.2-T2V-A14B

Le modèle T2V-A14B prend en charge la génération de vidéos de 5 secondes en résolutions 480P et 720P. Construit avec une architecture Mixture-of-Experts (MoE), il offre une qualité de génération vidéo exceptionnelle. Sur notre nouveau benchmark Wan-Bench 2.0, le modèle dépasse les meilleurs modèles commerciaux sur la plupart des critères clés d’évaluation.

Wan2.2-I2V-A14B

Le modèle I2V-A14B, conçu pour la génération image-à-vidéo, prend en charge les résolutions 480P et 720P. Construit avec une architecture Mixture-of-Experts (MoE), il réalise une synthèse vidéo plus stable avec des mouvements de caméra irréalistes réduits et offre un meilleur support pour diverses scènes stylisées.

Wan2.2-TI2V-5B

Le modèle TI2V-5B est construit avec le Wan2.2-VAE avancé qui atteint un taux de compression de 16×16×4. Ce modèle prend en charge la génération texte-à-vidéo et image-à-vidéo en résolution 720P à 24fps et peut fonctionner sur un GPU grand public unique comme le 4090. C’est l'un des modèles 720P@24fps les plus rapides disponibles, répondant aux besoins des applications industrielles et de la recherche académique.

GitHub : https://github.com/Wan-Video/Wan2.2

Dépôt original HuggingFace : https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Précédent
Plenty of Consent - V1
Suivant
WAN 25 Realistic - I2V LOW v1.0

Détails du modèle

Type de modèle

Checkpoint

Modèle de base

Wan Video 2.2 I2V-A14B

Version du modèle

14B Image-to-Video

Hash du modèle

33fc2f5384

Créateur

Discussion

Veuillez vous log in pour laisser un commentaire.