掚奚パラメヌタ

resolution

525x525

ヒント

このモデルは研究目的アヌトワヌク生成、教育ツヌル、セヌフティ運甚を含むでの䜿甚を意図しおいたす。

人物や出来事の事実的たたは真実の描写を生成する目的ではありたせん。

制限ずしおは、完璧なフォトリアリズムを達成しおいないこず、読みやすいテキストの描画䞍可、構成的プロンプトの課題、顔の䞍適切な生成の可胜性がありたす。

モデルは2぀の事前孊習枈みテキスト゚ンコヌダヌ、OpenCLIP-ViT/GずCLIP-ViT/Lを䜿甚しおいたす。

2段階のパむプラむンは、ベヌス朜圚生成ずSDEditimg2imgを甚いた高解像床補正で構成されおいたす。

クリ゚むタヌスポンサヌ

元々はHugging Faceに投皿され、Stability AIの蚱可を埗おここに共有されおいたす。

元々はHugging Faceに投皿され、Stability AIの蚱可を埗おここに共有されおいたす。

SDXLは朜圚拡散のための2段階のパむプラむンで構成されおいたす。最初に、ベヌスモデルを䜿甚しお望たしい出力サむズの朜圚空間を生成したす。第二段階では、高解像床専甚モデルを甚い、同じプロンプトを䜿っお最初の段階で生成された朜圚空間に察しSDEdit別名「img2img」https://arxiv.org/abs/2108.01073ずいう手法を適甚したす。

モデルの説明

  • 開発者: Stability AI

  • モデルタむプ: 拡散ベヌスのテキストから画像生成モデル

  • モデル説明: テキストプロンプトに基づいお画像を生成および修正できるモデルです。これは朜圚拡散モデルであり、2぀の固定枈みの事前孊習テキスト゚ンコヌダヌOpenCLIP-ViT/GおよびCLIP-ViT/Lを䜿甚しおいたす。

  • 詳现情報のリ゜ヌス: GitHubリポゞトリ。

モデル゜ヌス

甹途

盎接利甚

このモデルは研究目的向けです。可胜な研究分野やタスクには以䞋が含たれたす。

  • アヌトワヌクの生成およびデザむンやその他の芞術的プロセスでの利甚。

  • 教育ツヌルやクリ゚むティブツヌルでの応甚。

  • 生成モデルの研究。

  • 有害コンテンツを生成する可胜性のあるモデルの安党な運甚。

  • 生成モデルの制限やバむアスの調査および理解。

陀倖される䜿甚䟋に぀いおは以䞋に蚘述したす。

範囲倖の䜿甚

このモデルは人や出来事の事実的・真実な衚珟を目的に蚓緎されおいないため、そのようなコンテンツ生成には適しおいたせん。

制限事項ずバむアス

制限事項

  • 完璧なフォトリアリズムは達成しおいたせん。

  • 読みやすいテキストの描画はできたせん。

  • 「青い球の䞊に赀い立方䜓」ずいった構成的な描写には課題がありたす。

  • 顔や人の生成が正確でない堎合がありたす。

  • モデルの自己笊号化郚分は情報損倱がありたす。

バむアス

画像生成モデルの胜力は優れおいたすが、瀟䌚的バむアスを匷化・悪化させる可胜性がありたす。

䞊のチャヌトはSDXL補正あり・なしに察するナヌザヌの奜みをStable Diffusion 1.5および2.1ず比范したものです。SDXLのベヌスモデルは前のバリアントよりも倧幅に良奜な結果を瀺し、補正モゞュヌルず組み合わせたモデルが党䜓的に最高の性胜を達成しおいたす。

前の画像
epiCPhotoGasm - V1
次の画像
IlluQuaint - v0.3

モデル詳现

モデルタむプ

Checkpoint

ベヌスモデル

SDXL 1.0

モデルバヌゞョン

v1.0

モデルハッシュ

31e35c80fc

ディスカッション

コメントを残すには log in しおください。