Ein schlanker weißer Roboter serviert einem Mann, der in einer gemütlichen Café-Ecke unter warmen hängenden Deckenlampen sitzt, eine Tasse Kaffee, aufgenommen mit natürlicher Smartphone-Fotografie.
Nostalgisches 1990er-Foto eines Studenten, der auf einem Vintage-90er-Computer in einem Schlafsaal mit grüner Tapete und Teppichboden tippt, beleuchtet von einer Schreibtischlampe.
Eine geheimnisvolle Gestalt in einem vollständig schwarzen Umhang steht in einer schwach beleuchteten Seitengasse, umgeben von hohen Gebäuden mit sichtbaren Rohren, Dampfaustritt und elektrischen Leitungen, die eine cyberpunkige und leicht unheimliche Atmosphäre erzeugen.
Blick aus einem Auto, das bei regnerischem Tag über eine nasse tropische Autobahn mit Palmen entlang der Straße fährt.
Blick aus einem Auto, das an einem regnerischen, windigen Tag durch eine Vorstadtsiedlung mit amerikanischen Häusern entlang der Straße fährt.
Mann trägt weißen Nadelstreifenanzug und Sonnenbrille, steht nahe Palmen mit modernem Miami-Wolkenkratzer im Hintergrund, aufgenommen aus niedriger Kameraperspektive.
Afroamerikanischer Mann mit Afro und Sonnenbrille, der einen rosa Anzug trägt und nachts auf einer Straße in Miami steht, mit Palmen und neongeschmückten Wolkenkratzern im Hintergrund, aus der Froschperspektive betrachtet.
Gruppe junger Frauen in Jeansshorts und bauchfreien Tops, die einen Abend in der Nähe von Palmen genießen, beleuchtet von Neonlichtern und modernen Wolkenkratzern in Miami

Empfohlene Parameter

resolution

720x480, 720x720

vae

Wan2.2-VAE - advanced

Tipps

Wan2.2 profitiert von einem groß angelegten Datensatz mit +65,6 % mehr Bildern und +83,2 % mehr Videos im Vergleich zu Wan2.1.

Die Nutzung der Mixture-of-Experts (MoE) Architektur ermöglicht es, die Rechenkosten beizubehalten und gleichzeitig die Modellkapazität zu erhöhen.

Das Modell unterstützt stabile Videosynthese mit reduzierten unrealistischen Kamerabewegungen, besonders bei Bild-zu-Video-Generierung.

Versions-Highlights

Wan 2.2 14B für Bild-zu-Video Onsite-Generierung

Ersteller-Sponsoren

Besuchen Sie das offizielle Wan2.2 GitHub-Repository für Quellcode und Updates.

Laden Sie das ComfyUI Repack der Wan2.2-Modelle von HuggingFace herunter.

Originale Diffusers Multi-Part Safetensors-Dateien sind im Wan-AI HuggingFace Repo verfügbar.

Wan Video

Hinweis: Es gibt weitere Wan Video-Dateien auf Civitai – diese könnten Duplikate sein, aber diese Modellkarte dient hauptsächlich dazu, die von Wan Video im Civitai Generator genutzten Dateien zu hosten.

Diese Dateien sind das ComfyUI Repack – die Originaldateien sind unter Diffusers/multi-part safetensors Format hier. zu finden.

Wan2.2, ein großes Upgrade unserer visuellen generativen Modelle, ist nun Open Source und bietet leistungsstärkere Fähigkeiten, bessere Leistung und überlegene visuelle Qualität. Mit Wan2.2 haben wir uns auf folgende technische Innovationen konzentriert:

👍 MoE-Architektur: Wan2.2 führt eine Mixture-of-Experts (MoE)-Architektur in Video-Diffusionsmodelle ein. Durch die Trennung des Denoising-Prozesses über Zeitpunkte hinweg mit spezialisierten, leistungsstarken Expertenmodellen wird die Gesamtmodellkapazität vergrößert bei gleichem Rechenaufwand.

💪🏻 Datenskalierung: Im Vergleich zu Wan2.1 wurde Wan2.2 mit deutlich größeren Datenmengen trainiert, mit +65,6 % mehr Bildern und +83,2 % mehr Videos. Diese Erweiterung verbessert die Generalisierung des Modells über mehrere Dimensionen wie Bewegungen, Semantik und Ästhetik und erreicht Spitzenleistungen unter allen open-source und closed-source Modellen.

🎬 Kinoästhetik: Wan2.2 integriert speziell kuratierte ästhetische Daten mit fein abgestuften Labels für Beleuchtung, Komposition und Farbe. Dies ermöglicht präzisere und kontrollierbare kinostilistische Erzeugung und unterstützt die Erstellung von Videos mit anpassbaren ästhetischen Präferenzen.

🚀 Effizientes High-Definition Hybrid TI2V: Wan2.2 stellt ein 5B Modell mit unserem fortschrittlichen Wan2.2-VAE als Open Source bereit, das eine Kompressionsrate von 16×16×4 erzielt. Dieses Modell unterstützt sowohl Text-zu-Video- als auch Bild-zu-Video-Erzeugung in 720P Auflösung bei 24fps und läuft auf Consumer-Grafikkarten wie der 4090. Es ist eines der schnellsten 720P@24fps Modelle derzeit verfügbar und bedient gleichzeitig Industrie- sowie den akademischen Bereich.

Wan2.2-T2V-A14B

Das T2V-A14B-Modell unterstützt die Erzeugung von 5-sekündigen Videos sowohl in 480P als auch 720P Auflösung. Es wurde mit einer Mixture-of-Experts (MoE) Architektur gebaut und liefert herausragende Videoerzeugungsqualität. Auf unserem neuen Benchmark Wan-Bench 2.0 übertrifft das Modell die führenden kommerziellen Modelle in den meisten wichtigen Bewertungskriterien.

Wan2.2-I2V-A14B

Das I2V-A14B-Modell, speziell für Bild-zu-Video-Erzeugung, unterstützt sowohl 480P als auch 720P Auflösungen. Mit einer Mixture-of-Experts (MoE) Architektur erreicht es stabilere Videosynthese mit reduzierten unrealistischen Kamerabewegungen und bietet erweiterte Unterstützung für vielfältige stilisierte Szenen.

Wan2.2-TI2V-5B

Das TI2V-5B-Modell basiert auf dem fortschrittlichen Wan2.2-VAE, der eine Kompressionsrate von 16×16×4 erzielt. Dieses Modell unterstützt Text-zu-Video- sowie Bild-zu-Video-Erzeugung mit 720P Auflösung bei 24fps und kann auf einer einzelnen Consumer-GPU wie der 4090 laufen. Es gehört zu den schnellsten verfügbaren 720P@24fps Modellen und erfüllt die Anforderungen sowohl industrieller Anwendungen als auch akademischer Forschung.

GitHub: https://github.com/Wan-Video/Wan2.2

Original HuggingFace Repo: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Zurück
Plenty of Consent - V1
Weiter
WAN 25 Realistic - I2V LOW v1.0

Modell-Details

Modelltyp

Checkpoint

Basismodell

Wan Video 2.2 I2V-A14B

Modellversion

14B Image-to-Video

Modell-Hash

33fc2f5384

Ersteller

Diskussion

Bitte log in um einen Kommentar zu hinterlassen.