Wan Video 2.2 - 14B Bild-zu-Video
Empfohlene Parameter
resolution
vae
Tipps
Wan2.2 profitiert von einem groß angelegten Datensatz mit +65,6 % mehr Bildern und +83,2 % mehr Videos im Vergleich zu Wan2.1.
Die Nutzung der Mixture-of-Experts (MoE) Architektur ermöglicht es, die Rechenkosten beizubehalten und gleichzeitig die Modellkapazität zu erhöhen.
Das Modell unterstützt stabile Videosynthese mit reduzierten unrealistischen Kamerabewegungen, besonders bei Bild-zu-Video-Generierung.
Versions-Highlights
Wan 2.2 14B für Bild-zu-Video Onsite-Generierung
Ersteller-Sponsoren
Besuchen Sie das offizielle Wan2.2 GitHub-Repository für Quellcode und Updates.
Laden Sie das ComfyUI Repack der Wan2.2-Modelle von HuggingFace herunter.
Originale Diffusers Multi-Part Safetensors-Dateien sind im Wan-AI HuggingFace Repo verfügbar.
Wan Video
Hinweis: Es gibt weitere Wan Video-Dateien auf Civitai – diese könnten Duplikate sein, aber diese Modellkarte dient hauptsächlich dazu, die von Wan Video im Civitai Generator genutzten Dateien zu hosten.
Diese Dateien sind das ComfyUI Repack – die Originaldateien sind unter Diffusers/multi-part safetensors Format hier. zu finden.
Wan2.2, ein großes Upgrade unserer visuellen generativen Modelle, ist nun Open Source und bietet leistungsstärkere Fähigkeiten, bessere Leistung und überlegene visuelle Qualität. Mit Wan2.2 haben wir uns auf folgende technische Innovationen konzentriert:
👍 MoE-Architektur: Wan2.2 führt eine Mixture-of-Experts (MoE)-Architektur in Video-Diffusionsmodelle ein. Durch die Trennung des Denoising-Prozesses über Zeitpunkte hinweg mit spezialisierten, leistungsstarken Expertenmodellen wird die Gesamtmodellkapazität vergrößert bei gleichem Rechenaufwand.
💪🏻 Datenskalierung: Im Vergleich zu Wan2.1 wurde Wan2.2 mit deutlich größeren Datenmengen trainiert, mit +65,6 % mehr Bildern und +83,2 % mehr Videos. Diese Erweiterung verbessert die Generalisierung des Modells über mehrere Dimensionen wie Bewegungen, Semantik und Ästhetik und erreicht Spitzenleistungen unter allen open-source und closed-source Modellen.
🎬 Kinoästhetik: Wan2.2 integriert speziell kuratierte ästhetische Daten mit fein abgestuften Labels für Beleuchtung, Komposition und Farbe. Dies ermöglicht präzisere und kontrollierbare kinostilistische Erzeugung und unterstützt die Erstellung von Videos mit anpassbaren ästhetischen Präferenzen.
🚀 Effizientes High-Definition Hybrid TI2V: Wan2.2 stellt ein 5B Modell mit unserem fortschrittlichen Wan2.2-VAE als Open Source bereit, das eine Kompressionsrate von 16×16×4 erzielt. Dieses Modell unterstützt sowohl Text-zu-Video- als auch Bild-zu-Video-Erzeugung in 720P Auflösung bei 24fps und läuft auf Consumer-Grafikkarten wie der 4090. Es ist eines der schnellsten 720P@24fps Modelle derzeit verfügbar und bedient gleichzeitig Industrie- sowie den akademischen Bereich.
Wan2.2-T2V-A14B
Das T2V-A14B-Modell unterstützt die Erzeugung von 5-sekündigen Videos sowohl in 480P als auch 720P Auflösung. Es wurde mit einer Mixture-of-Experts (MoE) Architektur gebaut und liefert herausragende Videoerzeugungsqualität. Auf unserem neuen Benchmark Wan-Bench 2.0 übertrifft das Modell die führenden kommerziellen Modelle in den meisten wichtigen Bewertungskriterien.
Wan2.2-I2V-A14B
Das I2V-A14B-Modell, speziell für Bild-zu-Video-Erzeugung, unterstützt sowohl 480P als auch 720P Auflösungen. Mit einer Mixture-of-Experts (MoE) Architektur erreicht es stabilere Videosynthese mit reduzierten unrealistischen Kamerabewegungen und bietet erweiterte Unterstützung für vielfältige stilisierte Szenen.
Wan2.2-TI2V-5B
Das TI2V-5B-Modell basiert auf dem fortschrittlichen Wan2.2-VAE, der eine Kompressionsrate von 16×16×4 erzielt. Dieses Modell unterstützt Text-zu-Video- sowie Bild-zu-Video-Erzeugung mit 720P Auflösung bei 24fps und kann auf einer einzelnen Consumer-GPU wie der 4090 laufen. Es gehört zu den schnellsten verfügbaren 720P@24fps Modellen und erfüllt die Anforderungen sowohl industrieller Anwendungen als auch akademischer Forschung.
GitHub: https://github.com/Wan-Video/Wan2.2
Original HuggingFace Repo: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Modell-Details
Modelltyp
Basismodell
Modellversion
Modell-Hash
Ersteller
Diskussion
Bitte log in um einen Kommentar zu hinterlassen.
