Wan Video 2.2 - t2v_high_noise_14B
Parametri Consigliati
resolution
vae
Punti Salienti della Versione
wan2.2_t2v_high_noise_14B_fp8_scaled
Sponsor del Creatore
Questi file sono il ComfyUI Repack - i file originali si trovano in formato Diffusers/safetensors multi-part qui.
GitHub: https://github.com/Wan-Video/Wan2.2
Repo originale HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Wan Video
Nota: Ci sono altri file Wan Video ospitati su Civitai - potrebbero essere duplicati, ma questa scheda modello serve principalmente ad ospitare i file usati da Wan Video nel Civitai Generator.
Questi file sono il ComfyUI Repack - i file originali si possono trovare in formato Diffusers/safetensors multi-part qui.
Wan2.2, un grande aggiornamento dei nostri modelli generativi visivi, ora open-source, offre capacità più potenti, migliori prestazioni e qualità visiva superiore. Con Wan2.2, ci siamo concentrati nell’incorporare le seguenti innovazioni tecnologiche:
👍 Architettura MoE: Wan2.2 introduce un'architettura Mixture-of-Experts (MoE) nei modelli di diffusione video. Separando il processo di denoising tra i diversi timestep con modelli esperti specializzati e potenti, questo amplia la capacità complessiva del modello mantenendo lo stesso costo computazionale.
💪🏻 Scaling dei Dati: Rispetto a Wan2.1, Wan2.2 è addestrato su un dataset significativamente più grande, con +65,6% di immagini e +83,2% di video in più. Questa espansione migliora notevolmente la generalizzazione del modello su più dimensioni come movimenti, semantica ed estetica, raggiungendo prestazioni TOP tra tutti i modelli open-source e closed-source.
🎬 Estetica Cinematografica: Wan2.2 incorpora dati estetici appositamente curati con etichette dettagliate per illuminazione, composizione e colore. Ciò consente una generazione di stile cinematografico più precisa e controllabile, facilitando la creazione di video con preferenze estetiche personalizzabili.
🚀 TI2V Ibrido ad Alta Definizione ed Efficiente: Wan2.2 open-source un modello 5B costruito con il nostro avanzato Wan2.2-VAE che raggiunge un rapporto di compressione di 16×16×4. Questo modello supporta la generazione da testo a video e da immagine a video a risoluzione 720P con 24fps e può anche funzionare su schede grafiche consumer come la 4090. È uno dei modelli 720P@24fps più veloci attualmente disponibili, capace di servire contemporaneamente sia il settore industriale che quello accademico.
Wan2.2-T2V-A14B
Il modello T2V-A14B supporta la generazione di video di 5 secondi sia a risoluzione 480P che 720P. Costruito con un’architettura Mixture-of-Experts (MoE), garantisce una qualità di generazione video eccezionale. Sul nostro nuovo benchmark Wan-Bench 2.0, il modello supera i principali modelli commerciali nella maggior parte delle dimensioni chiave di valutazione.
Wan2.2-I2V-A14B
Il modello I2V-A14B, progettato per la generazione da immagine a video, supporta sia risoluzioni 480P che 720P. Costruito con un’architettura Mixture-of-Experts (MoE), realizza una sintesi video più stabile con movimenti della camera meno irrealistici e offre un supporto migliorato per scene stilizzate diverse.
Wan2.2-TI2V-5B
Il modello TI2V-5B è costruito con l’avanzato Wan2.2-VAE che raggiunge un rapporto di compressione di 16×16×4. Questo modello supporta la generazione da testo a video e da immagine a video a risoluzione 720P con 24fps e funziona su singola GPU consumer come la 4090. È uno dei modelli 720P@24fps più veloci disponibili, soddisfacendo le esigenze sia delle applicazioni industriali che della ricerca accademica.
GitHub: https://github.com/Wan-Video/Wan2.2
Repo originale HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Creatore
Discussione
Per favore log in per lasciare un commento.
