Un robot bianco ed elegante che serve una tazza di caffè a un uomo seduto in una confortevole cabina di caffetteria sotto calde luci a soffitto sospese, catturato con fotografia naturale da smartphone.
Fotografia nostalgica anni '90 di uno studente universitario che digita codice su un computer vintage anni '90 in una stanza del dormitorio con carta da parati verde e pavimento in moquette, illuminata da una lampada da scrivania.
Una figura misteriosa che indossa un mantello nero completo si trova in un vicolo poco illuminato circondato da edifici alti con tubi visibili, perdite di vapore e cablaggi elettrici, evocando un'atmosfera cyberpunk e leggermente inquietante.
Vista dall'interno di un'auto che percorre un'autostrada tropicale bagnata con palme lungo la strada durante una giornata piovosa.
Vista dall'interno di un'auto che guida attraverso un quartiere suburbano in un giorno piovoso e ventoso con case in stile americano che fiancheggiano la strada.
Uomo che indossa un completo bianco a righe e occhiali da sole in piedi vicino a palme con un moderno grattacielo di Miami sullo sfondo, fotografato da un angolo basso.
Uomo afroamericano con afro e occhiali da sole che indossa un completo rosa, in piedi su una strada di Miami di notte con palme e grattacieli illuminati al neon sullo sfondo, visto da un angolo basso.
Gruppo di giovani donne vestite con shorts di denim e crop top che si divertono una serata vicino a palme illuminate da luci al neon e moderni grattacieli a Miami

Parametri Consigliati

resolution

1280x720, 854x480

vae

Wan2.2-VAE - advanced

Suggerimenti

Wan2.2 incorpora un’architettura Mixture-of-Experts (MoE) per separare il denoising tra i timesteps, migliorando la capacità senza aumentare il carico computazionale.

I dati di addestramento sono stati espansi di +65,6% per le immagini e +83,2% per i video, migliorando la generalizzazione in movimento, semantica ed estetica.

Dati estetici appositamente curati con etichette dettagliate permettono una generazione precisa e controllabile di stile cinematografico.

Wan2.2-VAE raggiunge un rapporto di compressione di 16×16×4, supportando una generazione video efficiente a 720P@24fps su GPU consumer come Nvidia 4090.

Punti Salienti della Versione

Wan 2.2 14B per generazione onsite Testo-a-Video

Wan Video

Nota: Ci sono altri file Wan Video ospitati su Civitai - potrebbero essere duplicati, ma questa scheda modello serve principalmente per ospitare i file usati da Wan Video nel Civitai Generator.

Questi file sono il ComfyUI Repack - i file originali si trovano in Diffusers/formato safetensors multi-parte qui.

Wan2.2, un grande aggiornamento ai nostri modelli generativi visivi, ora open-source, che offre capacità più potenti, prestazioni migliori e qualità visiva superiore. Con Wan2.2 abbiamo focalizzato l’attenzione sull’incorporazione delle seguenti innovazioni tecniche:

👍 Architettura MoE: Wan2.2 introduce un’architettura Mixture-of-Experts (MoE) nei modelli di diffusione video. Separando il processo di denoising tra i timesteps con modelli esperti specializzati e potenti, questo amplia la capacità complessiva del modello mantenendo lo stesso costo computazionale.

💪🏻 Scalatura dei Dati: Rispetto a Wan2.1, Wan2.2 è addestrato su dati significativamente più grandi, con +65,6% immagini e +83,2% video. Questa espansione migliora notevolmente la generalizzazione del modello in molteplici dimensioni come movimenti, semantica ed estetica, raggiungendo performance TOP tra tutti i modelli open-source e closed-source.

🎬 Estetica Cinematografica: Wan2.2 incorpora dati estetici appositamente curati con etichette dettagliate per illuminazione, composizione e colore. Ciò consente una generazione di stile cinematografico più precisa e controllabile, facilitando la creazione di video con preferenze estetiche personalizzabili.

🚀 Hybrid TI2V ad Alta Definizione Efficiente: Wan2.2 rilascia open-source un modello 5B costruito con il nostro avanzato Wan2.2-VAE che raggiunge un rapporto di compressione di 16×16×4. Questo modello supporta sia la generazione testo-a-video che immagine-a-video a risoluzione 720P con 24fps e può funzionare su schede grafiche consumer come la 4090. È uno dei modelli 720P@24fps più veloci disponibili, capace di servire contemporaneamente sia il settore industriale che quello accademico.

Wan2.2-T2V-A14B

Il modello T2V-A14B supporta la generazione di video di 5 secondi a risoluzioni 480P e 720P. Costruito con un’architettura Mixture-of-Experts (MoE), offre qualità di generazione video eccellente. Nel nostro nuovo benchmark Wan-Bench 2.0, il modello supera i principali modelli commerciali nella maggior parte delle dimensioni chiave di valutazione.

Wan2.2-I2V-A14B

Il modello I2V-A14B, progettato per la generazione immagine-a-video, supporta risoluzioni sia 480P che 720P. Costruito con un’architettura Mixture-of-Experts (MoE), raggiunge una sintesi video più stabile con movimenti della camera meno irreali e offre un supporto migliorato per scene stilizzate diversificate.

Wan2.2-TI2V-5B

Il modello TI2V-5B è costruito con l’avanzato Wan2.2-VAE che raggiunge un rapporto di compressione di 16×16×4. Supporta la generazione testo-a-video e immagine-a-video a risoluzione 720P con 24fps e può funzionare su singola GPU consumer come la 4090. È uno dei modelli 720P@24fps più veloci disponibili, rispondendo alle esigenze sia di applicazioni industriali che di ricerca accademica.

GitHub: https://github.com/Wan-Video/Wan2.2

Repository originale HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Precedente
Konya Karasue | TIA V7 | Illustrious XL - v1.0
Successivo
Niji semi realism - v3.0 - Flux

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

Wan Video 2.2 T2V-A14B

Versione del modello

14B Text-to-Video

Hash del modello

33fc2f5384

Creatore

Discussione

Per favore log in per lasciare un commento.