Wan Video 2.2 - t2v_high_noise_14B
Zalecane parametry
resolution
vae
Najważniejsze informacje o wersji
wan2.2_t2v_high_noise_14B_fp8_scaled
Sponsorzy twórcy
Te pliki to ComfyUI Repack - oryginalne pliki można znaleźć w Diffusers/multi-part safetensors format tutaj.
GitHub: https://github.com/Wan-Video/Wan2.2
Oryginalne repozytorium HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Wan Video
Uwaga: Istnieją inne pliki Wan Video dostępne na Civitai - mogą to być duplikaty, ale ta karta modelu służy głównie do hostowania plików używanych przez Wan Video w Generatorze Civitai.
Te pliki to ComfyUI Repack - oryginalne pliki można znaleźć w Diffusers/multi-part safetensors format tutaj.
Wan2.2, znacząca aktualizacja naszych wizualnych modeli generatywnych, obecnie open-source, oferująca potężniejsze możliwości, lepszą wydajność i wyższą jakość wizualną. W Wan2.2 skupiliśmy się na wprowadzeniu następujących innowacji technicznych:
👍 Architektura MoE: Wan2.2 wprowadza architekturę Mixture-of-Experts (MoE) do modeli dyfuzji wideo. Dzięki separacji procesu usuwania szumu na kolejnych krokach przez wyspecjalizowane potężne modele ekspertów, zwiększa to ogólną pojemność modelu przy utrzymaniu tych samych kosztów obliczeniowych.
💪🏻 Skalowanie danych: W porównaniu do Wan2.1, Wan2.2 został wytrenowany na znacznie większych danych, z +65,6% więcej obrazów i +83,2% więcej wideo. To rozszerzenie znacząco poprawia generalizację modelu w wielu wymiarach, takich jak ruch, semantyka i estetyka, osiągając TOP wyniki wśród wszystkich modeli open-source i zamkniętego źródła.
🎬 Estetyka kinowa: Wan2.2 zawiera specjalnie wybrane dane estetyczne z precyzyjnymi etykietami dotyczącymi oświetlenia, kompozycji i kolorów. Umożliwia to dokładniejsze i kontrolowane generowanie stylu kinowego, ułatwiając tworzenie wideo z konfigurowalnymi preferencjami estetycznymi.
🚀 Wydajny hybrydowy TI2V w wysokiej rozdzielczości: Wan2.2 udostępnia model 5B zbudowany z użyciem zaawansowanego Wan2.2-VAE, który osiąga współczynnik kompresji 16×16×4. Ten model obsługuje generowanie tekst-na-wideo i obraz-na-wideo w rozdzielczości 720P przy 24fps oraz może działać na konsumenckich kartach graficznych takich jak 4090. Jest jednym z najszybszych modeli 720P@24fps dostępnych obecnie, zdolnym obsługiwać zarówno sektor przemysłowy, jak i akademicki jednocześnie.
Wan2.2-T2V-A14B
Model T2V-A14B wspiera generowanie 5-sekundowych wideo w rozdzielczościach 480P i 720P. Zbudowany z architekturą Mixture-of-Experts (MoE), zapewnia doskonałą jakość generowania wideo. W naszym nowym benchmarku Wan-Bench 2.0 model przewyższa czołowe modele komercyjne w większości kluczowych wymiarów oceny.
Wan2.2-I2V-A14B
Model I2V-A14B, zaprojektowany do generowania wideo z obrazów, obsługuje rozdzielczości 480P i 720P. Zbudowany z architekturą Mixture-of-Experts (MoE), osiąga bardziej stabilną syntezę wideo z redukcją nierealistycznych ruchów kamery oraz oferuje zwiększone wsparcie dla różnorodnych stylizowanych scen.
Wan2.2-TI2V-5B
Model TI2V-5B jest zbudowany z zaawansowanego Wan2.2-VAE, który osiąga współczynnik kompresji 16×16×4. Ten model obsługuje generowanie tekst-na-wideo i obraz-na-wideo w rozdzielczości 720P przy 24fps i może działać na pojedynczej konsumenckiej karcie GPU, takiej jak 4090. Jest jednym z najszybszych modeli 720P@24fps dostępnych, zaspokajając potrzeby zarówno zastosowań przemysłowych, jak i badań akademickich.
GitHub: https://github.com/Wan-Video/Wan2.2
Oryginalne repozytorium HuggingFace: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
Szczegóły modelu
Typ modelu
Model bazowy
Wersja modelu
Hash modelu
Twórca
Dyskusja
Proszę się log in, aby dodać komentarz.
