Smukły biały robot serwujący filiżankę kawy mężczyźnie siedzącemu w przytulnym kąciku kawiarni pod ciepłym, wiszącym oświetleniem sufitowym, uchwycony za pomocą naturalnej fotografii smartfonowej.
Nostalgiczne zdjęcie z lat 90. przedstawiające studenta piszącego kod na vintage'owym komputerze z lat 90. w pokoju akademickim z zielonymi tapetami i wykładziną, oświetlone lampką biurkową.
Tajemnicza postać ubrana w pełną czarną pelerynę stoi w słabo oświetlonej bocznej uliczce otoczonej wysokimi budynkami z widocznymi rurami, wyciekiem pary i instalacją elektryczną, wywołując atmosferę cyberpunku i lekkiego niepokoju.
Widok z wnętrza samochodu jadącego mokrą tropikalną autostradą, z palmami wzdłuż drogi podczas deszczowego dnia.
Widok z wnętrza samochodu jadącego przez przedmiejską dzielnicę w deszczowy, wietrzny dzień, z amerykańskimi domami przy ulicy.
Mężczyzna w białym garniturze w prążki i okularach przeciwsłonecznych stojący obok palm z nowoczesnym drapaczem chmur w Miami w tle, zdjęcie wykonane z niskiego kąta kamery.
Afroamerykanin z afro i okularami przeciwsłonecznymi w różowym garniturze stojący na ulicy Miami nocą, w tle palmy i neonowe drapacze chmur, widok z niskiego kąta.
Grupa młodych kobiet ubranych w jeansowe szorty i crop topy, bawiących się nocą w pobliżu palm, oświetlonych neonowymi światłami i nowoczesnymi drapaczami chmur w Miami

Zalecane parametry

resolution

720x480, 720x720

vae

Wan2.2-VAE - advanced

Wskazówki

Wan2.2 korzysta z dużego zbioru danych, mającego +65.6% więcej obrazów i +83.2% więcej wideo w porównaniu do Wan2.1.

Wykorzystanie architektury Mixture-of-Experts (MoE) pozwala na utrzymanie kosztów obliczeniowych przy jednoczesnym zwiększeniu pojemności modelu.

Model obsługuje stabilną syntezę wideo z redukcją nierealistycznych ruchów kamery, szczególnie podczas generowania obraz-do-wideo.

Najważniejsze informacje o wersji

Wan 2.2 14B do generowania obraz-do-wideo na miejscu

Sponsorzy twórcy

Sprawdź oficjalne repozytorium Wan2.2 na GitHub z kodem źródłowym i aktualizacjami.

Pobierz ComfyUI Repack modeli Wan2.2 z HuggingFace.

Oryginalne wieloczęściowe pliki safetensors Diffusers dostępne są w repozytorium Wan-AI na HuggingFace.

Wan Video

Uwaga: Istnieją inne pliki Wan Video hostowane na Civitai - mogą to być duplikaty, ale ta karta modelu służy przede wszystkim do udostępniania plików używanych przez Wan Video w Generatorze Civitai.

Te pliki to ComfyUI Repack - oryginalne pliki można znaleźć w formacie Diffusers/multi-part safetensors tutaj.

Wan2.2, znacząca aktualizacja naszych wizualnych modeli generatywnych, która jest teraz open-source, oferuje potężniejsze możliwości, lepszą wydajność i wyższą jakość wizualną. W Wan2.2 skoncentrowaliśmy się na wprowadzeniu następujących innowacji technicznych:

👍 Architektura MoE: Wan2.2 wprowadza architekturę Mixture-of-Experts (MoE) do modeli dyfuzji wideo. Poprzez rozdzielenie procesu denoisingu w kolejnych krokach czasowych z wykorzystaniem wyspecjalizowanych, potężnych modeli ekspertów, powiększa to ogólną pojemność modelu przy zachowaniu tego samego kosztu obliczeniowego.

💪🏻 Skalowanie danych: W porównaniu z Wan2.1, Wan2.2 jest trenowany na znacznie większym zbiorze danych, z +65.6% więcej obrazów i +83.2% więcej wideo. Ta ekspansja znacząco poprawia uogólnianie modelu w wielu wymiarach, takich jak ruchy, semantyka i estetyka, osiągając TOP wydajność wśród wszystkich modeli open- i closed-source.

🎬 Kinowa estetyka: Wan2.2 zawiera specjalnie dobrane dane estetyczne z drobiazgowymi etykietami dotyczącymi oświetlenia, kompozycji i koloru. Pozwala to na precyzyjniejsze i kontrolowane generowanie stylu kinowego, ułatwiając tworzenie wideo z konfigurowalnymi preferencjami estetycznymi.

🚀 Wydajny hybrydowy TI2V w wysokiej rozdzielczości: Wan2.2 open-source’uje model 5B zbudowany z wykorzystaniem zaawansowanego Wan2.2-VAE, osiągającego współczynnik kompresji 16×16×4. Model ten wspiera generowanie tekst-do-wideo i obraz-do-wideo w rozdzielczości 720P przy 24fps oraz może działać na kartach graficznych klasy konsumenckiej jak 4090. Jest to jeden z najszybszych modeli 720P@24fps dostępnych obecnie, zdolny obsłużyć jednocześnie sektor przemysłowy i akademicki.

Wan2.2-T2V-A14B

Model T2V-A14B wspiera generowanie 5-sekundowych wideo w rozdzielczościach 480P i 720P. Zbudowany z architekturą Mixture-of-Experts (MoE), oferuje doskonałą jakość generowania wideo. Na naszym nowym benchmarku Wan-Bench 2.0, model przewyższa wiodące modele komercyjne we większości kluczowych wymiarów oceny.

Wan2.2-I2V-A14B

Model I2V-A14B, zaprojektowany do generowania obraz-do-wideo, obsługuje rozdzielczości 480P i 720P. Opiera się na architekturze Mixture-of-Experts (MoE), osiąga bardziej stabilną syntezę wideo z redukcją nierealistycznych ruchów kamery oraz oferuje lepsze wsparcie dla różnorodnych stylizowanych scen.

Wan2.2-TI2V-5B

Model TI2V-5B zbudowany jest z zaawansowanego Wan2.2-VAE, który osiąga współczynnik kompresji 16×16×4. Ten model wspiera generowanie tekst-do-wideo i obraz-do-wideo w rozdzielczości 720P przy 24fps i może działać na pojedynczej karcie GPU klasy konsumenckiej, takiej jak 4090. Jest jednym z najszybszych modeli 720P@24fps dostępnych obecnie, spełniającym potrzeby zarówno zastosowań przemysłowych, jak i badań akademickich.

GitHub: https://github.com/Wan-Video/Wan2.2

Oryginalne repozytorium HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Poprzedni
Plenty of Consent - V1
Następny
WAN 25 Realistic - I2V LOW v1.0

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

Wan Video 2.2 I2V-A14B

Wersja modelu

14B Image-to-Video

Hash modelu

33fc2f5384

Twórca

Dyskusja

Proszę się log in, aby dodać komentarz.