Wan Video 2.2 - 5B Testo-Video-Immagine
Parametri Consigliati
resolution
vae
Suggerimenti
Wan2.2 incorpora un'architettura Mixture-of-Experts (MoE) per separare il denoising nei vari timestep, aumentando la capacità senza incrementare il carico computazionale.
Il dataset di addestramento è stato ampliato del +65.6% in immagini e +83.2% in video, migliorando la generalizzazione in movimento, semantica ed estetica.
Dati estetici appositamente curati con etichette dettagliate permettono una generazione precisa e controllabile di stile cinematografico.
Wan2.2-VAE raggiunge un rapporto di compressione 16×16×4, supportando una generazione video efficiente a 720P@24fps su GPU consumer come la Nvidia 4090.
Punti Salienti della Versione
Wan 2.2 5B per generazione locale
Wan Video
Nota: Sono presenti altri file Wan Video ospitati su Civitai - potrebbero essere duplicati, ma questa scheda modello serve principalmente a ospitare i file usati da Wan Video nel Generatore Civitai.
Questi file sono il ComfyUI Repack - i file originali si trovano in formato Diffusers/safetensors multipart qui.
Wan2.2, un importante aggiornamento dei nostri modelli generativi visivi ora open-source, offre capacità più potenti, migliori prestazioni e qualità visiva superiore. Con Wan2.2 ci siamo concentrati sull'integrazione delle seguenti innovazioni tecniche:
👍 Architettura MoE: Wan2.2 introduce un'architettura Mixture-of-Experts (MoE) nei modelli di diffusione video. Separando il processo di denoising nei vari timestep con modelli esperti specializzati e potenti, aumenta la capacità complessiva del modello mantenendo lo stesso costo computazionale.
💪🏻 Scalabilità dei dati: Rispetto a Wan2.1, Wan2.2 è addestrato su un dataset significativamente più ampio, con +65.6% di immagini e +83.2% di video in più. Questa espansione migliora notevolmente la generalizzazione del modello su molteplici dimensioni come movimenti, semantica ed estetica, raggiungendo prestazioni TOP tra tutti i modelli open-source e closed-source.
🎬 Estetica cinematografica: Wan2.2 incorpora dati estetici appositamente curati con etichette dettagliate per illuminazione, composizione e colore. Questo consente una generazione di stile cinematografico più precisa e controllabile, facilitando la creazione di video con preferenze estetiche personalizzabili.
🚀 Hybrid TI2V ad alta definizione efficiente: Wan2.2 rilascia open-source un modello 5B costruito con il nostro avanzato Wan2.2-VAE che raggiunge un rapporto di compressione 16×16×4. Questo modello supporta sia la generazione testo-video che immagine-video a risoluzione 720P con 24fps e può funzionare su schede grafiche consumer come la 4090. È uno dei modelli 720P@24fps più veloci attualmente disponibili, capace di servire sia il settore industriale che quello accademico.
Wan2.2-T2V-A14B
Il modello T2V-A14B supporta la generazione di video di 5 secondi sia a risoluzione 480P che 720P. Costruito con un'architettura Mixture-of-Experts (MoE), offre qualità di generazione video eccellente. Nel nostro nuovo benchmark Wan-Bench 2.0, il modello supera i principali modelli commerciali nella maggior parte delle dimensioni chiave di valutazione.
Wan2.2-I2V-A14B
Il modello I2V-A14B, progettato per la generazione immagine-video, supporta risoluzioni 480P e 720P. Costruito con un'architettura Mixture-of-Experts (MoE), raggiunge una sintesi video più stabile con movimenti della camera meno irrealistici e offre un supporto migliorato per diverse scene stilizzate.
Wan2.2-TI2V-5B
Il modello TI2V-5B è costruito con l'avanzato Wan2.2-VAE che raggiunge un rapporto di compressione 16×16×4. Questo modello supporta la generazione testo-video e immagine-video a risoluzione 720P con 24fps e può funzionare su una singola GPU consumer come la 4090. È uno dei modelli 720P@24fps più veloci disponibili, soddisfacendo le esigenze sia delle applicazioni industriali sia della ricerca accademica.
GitHub: https://github.com/Wan-Video/Wan2.2
Repository originale HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Creatore
Discussione
Per favore log in per lasciare un commento.
