Stable Diffusion 3 (SD3) - SD3 Medium
ヒント
Stable Diffusion 3のクイックスタートガイドを https://education.civitai.com/quickstart-guide-to-stable-diffusion-3/ でお読みください
モデルの詳細な情報についてはプレリリース版SD3概要を参照してください:https://education.civitai.com/stable-diffusion-3-pre-release-overview/
技術的な詳細については研究論文をご覧ください:https://stability.ai/news/stable-diffusion-3-research-paper
バージョンのハイライト
2Bパラメータ「Medium」ウェイト。注意:テキストエンコーダは含まれていません!詳細はクイックスタートガイドをお読みください!
クリエイタースポンサー
必ずお読みください SD3の解除:Civitaiにおける今後のコミュニティ決定
必ずお読みください SD3の解除:Civitaiにおける今後のコミュニティ決定
Stable Diffusion 3 (SD3) 2B「Medium」モデルウェイト!
ご注意ください;SD3には多くのファイルが関連しています。アップロードが完了次第、すべてこのモデルカードに表示されます。
モデルに関する情報はSD3プレリリース概要をご覧いただき、作成を開始するにはSD3クイックスタートガイドをご利用ください!

3つの.safetensorsバージョンがあります;
sd3_medium.safetensors
sd3_medium_inc_clips.safetensors
sd3_medium_inc_clips_t5xxlfp8.safetensors
Stable Diffusion 3 Mediumは、画像品質、タイポグラフィ、複雑なプロンプト理解、リソース効率が大幅に向上したマルチモーダルディフュージョントランスフォーマー(MMDiT)テキストから画像へのモデルです。
技術的詳細については、研究論文をご参照ください。
ご注意:このモデルはStability Non-Commercial Research Community Licenseの下でリリースされています。クリエイターライセンスまたはエンタープライズライセンスについては、Stability.aiで商用ライセンスの詳細をご覧ください。
モデル説明
開発者:Stability AI
モデルタイプ:MMDiT テキストから画像への生成モデル
モデル説明:テキストプロンプトに基づいて画像を生成できるモデルです。これはマルチモーダルディフュージョントランスフォーマー(https://arxiv.org/abs/2403.03206)で、3つの固定事前学習済みテキストエンコーダー(OpenCLIP-ViT/G、CLIP-ViT/L、およびT5-xxl) を使用しています。
ライセンス
非商用利用:Stable Diffusion 3 MediumはStability AI非商用研究コミュニティライセンスの下でリリースされています。このモデルは学術研究など非商用目的で無料で使用可能です。
商用利用:このモデルはStabilityの別途の商用ライセンスなしには商用利用できません。プロのアーティスト、デザイナー、クリエイターの方々にはクリエイターライセンスの利用を推奨します。詳しくはhttps://stability.ai/licenseをご覧ください。
SD3のオリジナルHuggingfaceリポジトリはこちらにあります。