Parametri Consigliati

resolution

1280x720, 854x480

vae

Wan2.2-VAE

Punti Salienti della Versione

wan2.2_t2v_high_noise_14B_fp8_scaled

Sponsor del Creatore

Wan Video

Nota: Ci sono altri file Wan Video ospitati su Civitai - potrebbero essere duplicati, ma questa scheda modello serve principalmente ad ospitare i file usati da Wan Video nel Civitai Generator.

Questi file sono il ComfyUI Repack - i file originali si possono trovare in formato Diffusers/safetensors multi-part qui.

Wan2.2, un grande aggiornamento dei nostri modelli generativi visivi, ora open-source, offre capacità più potenti, migliori prestazioni e qualità visiva superiore. Con Wan2.2, ci siamo concentrati nell’incorporare le seguenti innovazioni tecnologiche:

👍 Architettura MoE: Wan2.2 introduce un'architettura Mixture-of-Experts (MoE) nei modelli di diffusione video. Separando il processo di denoising tra i diversi timestep con modelli esperti specializzati e potenti, questo amplia la capacità complessiva del modello mantenendo lo stesso costo computazionale.

💪🏻 Scaling dei Dati: Rispetto a Wan2.1, Wan2.2 è addestrato su un dataset significativamente più grande, con +65,6% di immagini e +83,2% di video in più. Questa espansione migliora notevolmente la generalizzazione del modello su più dimensioni come movimenti, semantica ed estetica, raggiungendo prestazioni TOP tra tutti i modelli open-source e closed-source.

🎬 Estetica Cinematografica: Wan2.2 incorpora dati estetici appositamente curati con etichette dettagliate per illuminazione, composizione e colore. Ciò consente una generazione di stile cinematografico più precisa e controllabile, facilitando la creazione di video con preferenze estetiche personalizzabili.

🚀 TI2V Ibrido ad Alta Definizione ed Efficiente: Wan2.2 open-source un modello 5B costruito con il nostro avanzato Wan2.2-VAE che raggiunge un rapporto di compressione di 16×16×4. Questo modello supporta la generazione da testo a video e da immagine a video a risoluzione 720P con 24fps e può anche funzionare su schede grafiche consumer come la 4090. È uno dei modelli 720P@24fps più veloci attualmente disponibili, capace di servire contemporaneamente sia il settore industriale che quello accademico.

Wan2.2-T2V-A14B

Il modello T2V-A14B supporta la generazione di video di 5 secondi sia a risoluzione 480P che 720P. Costruito con un’architettura Mixture-of-Experts (MoE), garantisce una qualità di generazione video eccezionale. Sul nostro nuovo benchmark Wan-Bench 2.0, il modello supera i principali modelli commerciali nella maggior parte delle dimensioni chiave di valutazione.

Wan2.2-I2V-A14B

Il modello I2V-A14B, progettato per la generazione da immagine a video, supporta sia risoluzioni 480P che 720P. Costruito con un’architettura Mixture-of-Experts (MoE), realizza una sintesi video più stabile con movimenti della camera meno irrealistici e offre un supporto migliorato per scene stilizzate diverse.

Wan2.2-TI2V-5B

Il modello TI2V-5B è costruito con l’avanzato Wan2.2-VAE che raggiunge un rapporto di compressione di 16×16×4. Questo modello supporta la generazione da testo a video e da immagine a video a risoluzione 720P con 24fps e funziona su singola GPU consumer come la 4090. È uno dei modelli 720P@24fps più veloci disponibili, soddisfacendo le esigenze sia delle applicazioni industriali che della ricerca accademica.

GitHub: https://github.com/Wan-Video/Wan2.2

Repo originale HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Precedente
Plagion - v1.0
Successivo
Fotografia di strada fotorealistica - J^p^N - Giappone

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

Wan Video 2.2 T2V-A14B

Versione del modello

t2v_high_noise_14B

Hash del modello

cad711ae21

Creatore

Discussione

Per favore log in per lasciare un commento.