モデル/Qwen-Image - Qwen_Image_fp8_e4m3fn

Qwen-Image - Qwen_Image_fp8_e4m3fn

沢岡美纪子

9/23/2025

12:52:17 AM

| Discussion|

推奨ネガティブプロンプト

asian

推奨パラメータ

samplers

Euler, Undefined

steps

25 - 40

cfg

3 - 3.5

clip skip

resolution

832x1216

バージョンのハイライト

qwen_image_fp8_e4m3fn

クリエイタースポンサー

Qwenがオンサイト生成で利用可能に！これは実験的なビルドであることにご注意ください！価格と品質は変更される可能性があります。

Qwenシリーズの画像生成基盤モデルであるQwen-Imageをリリースできることを大変嬉しく思います。本モデルは複雑なテキスト表現と精密な画像編集において大きな進歩を遂げています。実験では、画像生成と編集の両面で強力な汎用能力を示し、特に中国語でのテキスト表現で卓越した性能を発揮しています。

特徴的な能力の一つは、多様な画像にわたる高忠実度なテキストレンダリングです。英語のようなアルファベット言語から中国語のような表語文字体系まで、Qwen-Imageは書体の詳細、レイアウトの一貫性、文脈の調和を驚くべき正確さで保持します。テキストは単に重ね合わせられるのではなく、視覚的な構造にシームレスに統合されます。

テキストを超えて、Qwen-Imageは幅広い芸術スタイルに対応した一般的な画像生成に優れています。フォトリアリスティックなシーンから印象派の絵画、アニメ風の美学からミニマリストデザインまで、モデルは創造的なプロンプトに柔軟に適応し、アーティスト、デザイナー、ストーリーテラーにとって多用途なツールとなっています。

画像編集に関しては、Qwen-Imageは単純な調整をはるかに超えています。スタイル転送、オブジェクトの挿入や削除、ディテールの強調、画像内のテキスト編集、さらには人間のポーズ操作など高度な操作を、直感的な入力と整合性のある出力で可能にします。このレベルのコントロールにより、プロフェッショナル並みの編集が一般ユーザーにも手が届くものとなっています。

しかしQwen-Imageは単に生成や編集を行うだけでなく、理解もします。オブジェクト検出、セマンティックセグメンテーション、深度およびエッジ（キャニー）推定、新規視点合成、超解像などの画像理解タスクの一式をサポートします。これらの機能は技術的には異なりますが、すべて深い視覚的理解に基づく知的な画像編集の特殊形態と見ることができます。

これらの特徴を合わせ持つことで、Qwen-Imageは美しい画像を生成する単なるツールではなく、言語、レイアウト、画像が融合するインテリジェントな視覚創作と操作のための包括的基盤モデルとなっています。