Wan Video 2.2 - 14B Image-to-Video
Zalecane parametry
resolution
vae
Wskazówki
Wan2.2 korzysta z dużego zbioru danych, mającego +65.6% więcej obrazów i +83.2% więcej wideo w porównaniu do Wan2.1.
Wykorzystanie architektury Mixture-of-Experts (MoE) pozwala na utrzymanie kosztów obliczeniowych przy jednoczesnym zwiększeniu pojemności modelu.
Model obsługuje stabilną syntezę wideo z redukcją nierealistycznych ruchów kamery, szczególnie podczas generowania obraz-do-wideo.
Najważniejsze informacje o wersji
Wan 2.2 14B do generowania obraz-do-wideo na miejscu
Sponsorzy twórcy
Sprawdź oficjalne repozytorium Wan2.2 na GitHub z kodem źródłowym i aktualizacjami.
Pobierz ComfyUI Repack modeli Wan2.2 z HuggingFace.
Oryginalne wieloczęściowe pliki safetensors Diffusers dostępne są w repozytorium Wan-AI na HuggingFace.
Wan Video
Uwaga: Istnieją inne pliki Wan Video hostowane na Civitai - mogą to być duplikaty, ale ta karta modelu służy przede wszystkim do udostępniania plików używanych przez Wan Video w Generatorze Civitai.
Te pliki to ComfyUI Repack - oryginalne pliki można znaleźć w formacie Diffusers/multi-part safetensors tutaj.
Wan2.2, znacząca aktualizacja naszych wizualnych modeli generatywnych, która jest teraz open-source, oferuje potężniejsze możliwości, lepszą wydajność i wyższą jakość wizualną. W Wan2.2 skoncentrowaliśmy się na wprowadzeniu następujących innowacji technicznych:
👍 Architektura MoE: Wan2.2 wprowadza architekturę Mixture-of-Experts (MoE) do modeli dyfuzji wideo. Poprzez rozdzielenie procesu denoisingu w kolejnych krokach czasowych z wykorzystaniem wyspecjalizowanych, potężnych modeli ekspertów, powiększa to ogólną pojemność modelu przy zachowaniu tego samego kosztu obliczeniowego.
💪🏻 Skalowanie danych: W porównaniu z Wan2.1, Wan2.2 jest trenowany na znacznie większym zbiorze danych, z +65.6% więcej obrazów i +83.2% więcej wideo. Ta ekspansja znacząco poprawia uogólnianie modelu w wielu wymiarach, takich jak ruchy, semantyka i estetyka, osiągając TOP wydajność wśród wszystkich modeli open- i closed-source.
🎬 Kinowa estetyka: Wan2.2 zawiera specjalnie dobrane dane estetyczne z drobiazgowymi etykietami dotyczącymi oświetlenia, kompozycji i koloru. Pozwala to na precyzyjniejsze i kontrolowane generowanie stylu kinowego, ułatwiając tworzenie wideo z konfigurowalnymi preferencjami estetycznymi.
🚀 Wydajny hybrydowy TI2V w wysokiej rozdzielczości: Wan2.2 open-source’uje model 5B zbudowany z wykorzystaniem zaawansowanego Wan2.2-VAE, osiągającego współczynnik kompresji 16×16×4. Model ten wspiera generowanie tekst-do-wideo i obraz-do-wideo w rozdzielczości 720P przy 24fps oraz może działać na kartach graficznych klasy konsumenckiej jak 4090. Jest to jeden z najszybszych modeli 720P@24fps dostępnych obecnie, zdolny obsłużyć jednocześnie sektor przemysłowy i akademicki.
Wan2.2-T2V-A14B
Model T2V-A14B wspiera generowanie 5-sekundowych wideo w rozdzielczościach 480P i 720P. Zbudowany z architekturą Mixture-of-Experts (MoE), oferuje doskonałą jakość generowania wideo. Na naszym nowym benchmarku Wan-Bench 2.0, model przewyższa wiodące modele komercyjne we większości kluczowych wymiarów oceny.
Wan2.2-I2V-A14B
Model I2V-A14B, zaprojektowany do generowania obraz-do-wideo, obsługuje rozdzielczości 480P i 720P. Opiera się na architekturze Mixture-of-Experts (MoE), osiąga bardziej stabilną syntezę wideo z redukcją nierealistycznych ruchów kamery oraz oferuje lepsze wsparcie dla różnorodnych stylizowanych scen.
Wan2.2-TI2V-5B
Model TI2V-5B zbudowany jest z zaawansowanego Wan2.2-VAE, który osiąga współczynnik kompresji 16×16×4. Ten model wspiera generowanie tekst-do-wideo i obraz-do-wideo w rozdzielczości 720P przy 24fps i może działać na pojedynczej karcie GPU klasy konsumenckiej, takiej jak 4090. Jest jednym z najszybszych modeli 720P@24fps dostępnych obecnie, spełniającym potrzeby zarówno zastosowań przemysłowych, jak i badań akademickich.
GitHub: https://github.com/Wan-Video/Wan2.2
Oryginalne repozytorium HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Szczegóły modelu
Typ modelu
Model bazowy
Wersja modelu
Hash modelu
Twórca
Dyskusja
Proszę się log in, aby dodać komentarz.
