Zalecane parametry

resolution

1280x720, 854x480

vae

Wan2.2-VAE

Najważniejsze informacje o wersji

wan2.2_t2v_high_noise_14B_fp8_scaled

Sponsorzy twórcy

Wan Video

Uwaga: Istnieją inne pliki Wan Video dostępne na Civitai - mogą to być duplikaty, ale ta karta modelu służy głównie do hostowania plików używanych przez Wan Video w Generatorze Civitai.

Te pliki to ComfyUI Repack - oryginalne pliki można znaleźć w Diffusers/multi-part safetensors format tutaj.

Wan2.2, znacząca aktualizacja naszych wizualnych modeli generatywnych, obecnie open-source, oferująca potężniejsze możliwości, lepszą wydajność i wyższą jakość wizualną. W Wan2.2 skupiliśmy się na wprowadzeniu następujących innowacji technicznych:

👍 Architektura MoE: Wan2.2 wprowadza architekturę Mixture-of-Experts (MoE) do modeli dyfuzji wideo. Dzięki separacji procesu usuwania szumu na kolejnych krokach przez wyspecjalizowane potężne modele ekspertów, zwiększa to ogólną pojemność modelu przy utrzymaniu tych samych kosztów obliczeniowych.

💪🏻 Skalowanie danych: W porównaniu do Wan2.1, Wan2.2 został wytrenowany na znacznie większych danych, z +65,6% więcej obrazów i +83,2% więcej wideo. To rozszerzenie znacząco poprawia generalizację modelu w wielu wymiarach, takich jak ruch, semantyka i estetyka, osiągając TOP wyniki wśród wszystkich modeli open-source i zamkniętego źródła.

🎬 Estetyka kinowa: Wan2.2 zawiera specjalnie wybrane dane estetyczne z precyzyjnymi etykietami dotyczącymi oświetlenia, kompozycji i kolorów. Umożliwia to dokładniejsze i kontrolowane generowanie stylu kinowego, ułatwiając tworzenie wideo z konfigurowalnymi preferencjami estetycznymi.

🚀 Wydajny hybrydowy TI2V w wysokiej rozdzielczości: Wan2.2 udostępnia model 5B zbudowany z użyciem zaawansowanego Wan2.2-VAE, który osiąga współczynnik kompresji 16×16×4. Ten model obsługuje generowanie tekst-na-wideo i obraz-na-wideo w rozdzielczości 720P przy 24fps oraz może działać na konsumenckich kartach graficznych takich jak 4090. Jest jednym z najszybszych modeli 720P@24fps dostępnych obecnie, zdolnym obsługiwać zarówno sektor przemysłowy, jak i akademicki jednocześnie.

Wan2.2-T2V-A14B

Model T2V-A14B wspiera generowanie 5-sekundowych wideo w rozdzielczościach 480P i 720P. Zbudowany z architekturą Mixture-of-Experts (MoE), zapewnia doskonałą jakość generowania wideo. W naszym nowym benchmarku Wan-Bench 2.0 model przewyższa czołowe modele komercyjne w większości kluczowych wymiarów oceny.

Wan2.2-I2V-A14B

Model I2V-A14B, zaprojektowany do generowania wideo z obrazów, obsługuje rozdzielczości 480P i 720P. Zbudowany z architekturą Mixture-of-Experts (MoE), osiąga bardziej stabilną syntezę wideo z redukcją nierealistycznych ruchów kamery oraz oferuje zwiększone wsparcie dla różnorodnych stylizowanych scen.

Wan2.2-TI2V-5B

Model TI2V-5B jest zbudowany z zaawansowanego Wan2.2-VAE, który osiąga współczynnik kompresji 16×16×4. Ten model obsługuje generowanie tekst-na-wideo i obraz-na-wideo w rozdzielczości 720P przy 24fps i może działać na pojedynczej konsumenckiej karcie GPU, takiej jak 4090. Jest jednym z najszybszych modeli 720P@24fps dostępnych, zaspokajając potrzeby zarówno zastosowań przemysłowych, jak i badań akademickich.

GitHub: https://github.com/Wan-Video/Wan2.2

Oryginalne repozytorium HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

Poprzedni
Plagion - v1.0
Następny
Fotorealistyczna fotografia uliczna - J^p^N - Japonia

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

Wan Video 2.2 T2V-A14B

Wersja modelu

t2v_high_noise_14B

Hash modelu

cad711ae21

Twórca

Dyskusja

Proszę się log in, aby dodać komentarz.