暖かい吊り下げ天井照明の下、居心地の良いカフェのブース席に座る男性に白く洗練されたロボットがコーヒーを提供している様子を、自然なスマートフォン撮影で捉えた画像。
緑色の壁紙とカーペットの床がある寮の部屋で、デスクランプに照らされながら90年代のビンテージPCでコードを入力する大学生の懐かしい1990年代の写真。
全身黒いマントを着た謎の人物が、蒸気の漏れるパイプや電線が見える高層ビルに囲まれた薄暗い裏路地に立ち、サイバーパンクでやや不気味な雰囲気を醸し出している。
雨の降る昼間にヤシの木が道路沿いに並ぶ濡れた熱帯高速道路を走る車内からの眺め。
雨と風が強い日に郊外住宅街を走る車の内部からの眺め。アメリカ風の家々が通りに沿って並んでいる。
白いピンストライプのスーツとサングラスを着用し、近くにヤシの木、背景にモダンなマイアミの高層ビルがあり、低いカメラアングルから撮影された男性。
アフロヘアとサングラスを着用し、ピンクスーツをまとったアフリカ系アメリカ人男性がマイアミの夜の通りに立っており、背景にはヤシの木とネオンに照らされた高層ビルが低いアングルで見えます。
デニムショーツとクロップトップを着た若い女性たちのグループが、マイアミのヤシの木の近くで夜を楽しんでいる様子。ネオンライトとモダンな高層ビルに照らされている

推奨パラメータ

resolution

1280x720, 854x480

vae

Wan2.2-VAE - advanced

ヒント

Wan2.2はMixture-of-Experts (MoE) アーキテクチャを導入し、時間ステップごとにノイズ除去を分離。計算負荷を増やさずに容量を拡張。

画像+65.6%、動画+83.2%のトレーニングデータ拡大により、動き、意味論、美学における汎化性能を向上。

詳細なラベル付きの特別にキュレーションされた美学データにより、精密で制御可能な映画スタイルの生成が可能。

Wan2.2-VAEは16×16×4の圧縮率を達成し、Nvidia 4090のような消費者向けGPUで720P@24fpsの効率的な動画生成をサポート。

バージョンのハイライト

現場でのテキストから動画生成向けWan 2.2 14B

Wan Video

注意: Civitaiに他のWan Videoファイルもホストされていますが、それらは重複している可能性があり、このモデルカードは主にCivitai Generatorで使用されるWan Videoのファイルをホストするものです。

これらのファイルはComfyUIリパックで、元のファイルはDiffusersのマルチパートsafetensors形式はこちら。

Wan2.2は視覚生成モデルの大幅なアップグレードで、オープンソースとして提供され、より強力な性能と優れた視覚品質を実現しています。Wan2.2では、以下の技術的革新を取り入れました:

👍 MoEアーキテクチャ: Wan2.2は動画拡散モデルにMixture-of-Experts (MoE) アーキテクチャを導入。専門の強力なエキスパートモデルを用いて時間ステップごとにノイズ除去を分割し、計算量を増やさずに全体のモデル容量を拡大します。

💪🏻 データ拡大: Wan2.1と比較して、Wan2.2は画像+65.6%、動画+83.2%の大幅増加したデータで学習。この拡大により動き、意味論、美学など多面的にモデルの汎化性能を向上させ、オープンソース・クローズドソース問わずトップクラスの性能を達成しました。

🎬 映画的美学: Wan2.2は照明、構図、色に関する詳細なラベル付きの特別にキュレーションされた美学データを取り入れ、より精密かつ制御可能な映画スタイルの生成を可能にし、カスタマイズ可能な美的嗜好をもつ動画作成を支援します。

🚀 高効率高解像度ハイブリッドTI2V: Wan2.2は最新のWan2.2-VAEを搭載した5Bモデルをオープンソース化しており、16×16×4の圧縮率を達成。720P・24fpsのテキストから動画および画像から動画生成に対応し、4090のような一般消費者向けGPUでも動作可能。現在最速クラスの720P@24fpsモデルで、産業界と学術界の両方のニーズに応えます。

Wan2.2-T2V-A14B

T2V-A14Bモデルは480Pおよび720P解像度で5秒動画の生成をサポート。Mixture-of-Experts (MoE) アーキテクチャを採用し、優れた動画生成品質を実現。新ベンチマークWan-Bench 2.0では主要評価項目のほとんどで商用モデルを上回っています。

Wan2.2-I2V-A14B

I2V-A14Bモデルは画像から動画生成向けで480P・720P解像度に対応。Mixture-of-Experts (MoE) アーキテクチャにより、不自然なカメラ動作を減らし安定した動画合成と多様なスタイライズシーンの強化を実現しています。

Wan2.2-TI2V-5B

TI2V-5Bモデルは先進のWan2.2-VAE搭載で16×16×4の圧縮率を誇る。720P・24fpsのテキスト動画および画像動画生成に対応し、4090など単一の一般消費者向けGPUで動作。産業用途及び学術研究のニーズを満たす最速クラスの720P@24fpsモデルの一つです。

GitHub: https://github.com/Wan-Video/Wan2.2

元のHuggingFaceリポジトリ: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

前の画像
Konya Karasue | TIA V7 | Illustrious XL - v1.0
次の画像
Niji セミリアリズム - v3.0 - Flux

モデル詳細

モデルタイプ

Checkpoint

ベースモデル

Wan Video 2.2 T2V-A14B

モデルバージョン

14B Text-to-Video

モデルハッシュ

33fc2f5384

作成者

ディスカッション

コメントを残すには log in してください。