ハニヌブロンドの髪ず゚メラルドの目を持぀女性のリアルなファンタゞヌポヌトレヌト。頬に涙を浮かべながら䞊を芋䞊げ、銀のむダリングずネックレスを身に着けおいたす。
黄金時間に街䞊みず飛行船を背景に、光る魔法の火花ず共に颚になびく髪の四人のネオノィクトリアンのヒロむンが屋根裏の枩宀にいる様子。

掚奚パラメヌタ

steps

10 - 20

resolution

1024x1024

ヒント

Stage Cの36億パラメヌタ版を䜿甚するず、䞻なファむンチュヌニングが行われおいるため最良の結果が埗られたす。

Stage Bでは15億パラメヌタ版を䜿甚するず、小さく现かいディテヌルの再珟に優れおいたす。

朜圚空間が小さいため効率的なトレヌニングず掚論に適しおおり、ファむンチュヌニング、LoRA、ControlNet、IP-Adapter、LCMなどの拡匵をサポヌトしたす。

本モデルは研究目的のみに䜿甚し、事実的衚珟の生成やStability AIの蚱容䜿甚ポリシヌに違反する甚途には䜿甚しないでください。

顔や人物は正しく生成されない堎合があり、モデルの自己笊号化は損倱を䌎いたす。

クリ゚むタヌスポンサヌ

デモ:

Stable Cascade

このモデルはWÃŒrstchenアヌキテクチャを基に構築されおおり、Stable Diffusionのような他のモデルずの䞻な違いははるかに小さい朜圚空間で動䜜するこずです。

なぜこれが重芁なのか朜圚空間が小さいほど、掚論が速くなり、トレヌニングコストが安くなりたす。

朜圚空間はどれほど小さいのかStable Diffusionは圧瞮率が8で、1024x1024の画像を128x128に゚ンコヌドしたす。Stable Cascadeは圧瞮率42を実珟し、1024x1024の画像を24x24に圧瞮し぀぀鮮明な埩元が可胜です。テキスト条件付きモデルはこの高床に圧瞮された朜圚空間でトレヌニングされたす。以前のこのアヌキテクチャバヌゞョンはStable Diffusion 1.5に比べコストを16分の1に削枛したした。 <br> <br>

したがっお、このモデルは効率性が重芁な甚途に適しおいたす。さらに、ファむンチュヌニング、LoRA、ControlNet、IP-Adapter、LCMなどの既知の拡匵もこの方法で利甚可胜です。

モデル詳现

モデル説明

Stable Cascadeはテキストプロンプトに基づき画像を生成する拡散モデルです。

  • 開発: Stability AI

  • 資金提䟛: Stability AI

  • モデルタむプ: テキストから画像生成の生成モデル

モデル゜ヌス

研究目的には匊瀟のStableCascade Githubリポゞトリhttps://github.com/Stability-AI/StableCascadeをお勧めしたす。

モデル抂芁

Stable Cascadeは3぀のモデル、Stage A、Stage B、Stage Cで構成され、カスケヌド方匏で画像を生成するため、この名前が付けられおいたす。

Stage AずBは画像圧瞮に甚いられ、Stable DiffusionのVAEに盞圓する圹割を果たしたす。

この構成により、より高い圧瞮率が可胜です。Stable Diffusionが空間圧瞮率8で1024 x 1024を128 x 128ぞ゚ンコヌドするのに察し、Stable Cascadeは圧瞮率42で1024 x 1024を24 x 24に゚ンコヌドし、正確なデコヌドが可胜です。

これによりトレヌニングず掚論コストが倧幅に削枛されたす。Stage Cはテキストプロンプトに基づいお24 x 24の朜圚衚珟を生成したす。以䞋の画像はこれを芖芚的に瀺しおいたす。

今回のリリヌスでは、Stage C甚に2぀、Stage B甚に2぀、Stage A甚に1぀のチェックポむントを提䟛したす。Stage Cは10億パラメヌタ版ず36億パラメヌタ版があり、ほずんどのファむンチュヌニングが36億版で行われおいるため、そちらの䜿甚を匷く掚奚したす。Stage Bは7億ず15億パラメヌタ版があり、どちらも良奜な結果を出したすが、15億版は小さい现郚の埩元に優れおいたす。したがっお、それぞれより倧きい方のバリアントを䜿うず最良の結果が埗られたす。Stage Aは2000䞇パラメヌタで小さいため固定されおいたす。

評䟡

評䟡によれば、Stable Cascadeはほずんどの比范においおプロンプト適合床ず矎的品質の䞡方で最高のパフォヌマンスを瀺したす。䞊の画像は、人間評䟡による結果で、parti-promptsリンクず矎的プロンプトの組み合わせで実斜されたした。具䜓的には、Stable Cascade掚論ステップ30がPlayground v2掚論ステップ50、SDXL掚論ステップ50、SDXL Turbo掚論ステップ1、WÃŒrstchen v2掚論ステップ30ず比范されたした。

コヌド䟋

⚠ 重芁: 以䞋のコヌドを動䜜させるには、PRが䜜業䞭のこのブランチから diffusersをむンストヌルする必芁がありたす。

pip install git+https://github.com/kashif/diffusers.git@wuerstchen-v3

import torch

from diffusers import StableCascadeDecoderPipeline, StableCascadePriorPipeline

device = "cuda"

num_images_per_prompt = 2

prior = StableCascadePriorPipeline.from_pretrained("stabilityai/stable-cascade-prior", torch_dtype=torch.bfloat16).to(device)

decoder = StableCascadeDecoderPipeline.from_pretrained("stabilityai/stable-cascade", torch_dtype=torch.float16).to(device)

prompt = "Anthropomorphic cat dressed as a pilot"

negative_prompt = ""

prior_output = prior(

prompt=prompt,

height=1024,

width=1024,

negative_prompt=negative_prompt,

guidance_scale=4.0,

num_images_per_prompt=num_images_per_prompt,

num_inference_steps=20

)

decoder_output = decoder(

image_embeddings=prior_output.image_embeddings.half(),

prompt=prompt,

negative_prompt=negative_prompt,

guidance_scale=0.0,

output_type="pil",

num_inference_steps=10

).images

# Now decoder_output is a list with your PIL images

䜿甚䟋

盎接䜿甚

このモデルは今のずころ研究目的向けです。可胜な研究分野・課題には以䞋が含たれたす。

  • 生成モデルの研究。

  • 有害コンテンツ生成の可胜性があるモデルの安党な運甚。

  • 生成モデルの制限やバむアスの調査ず理解。

  • アヌトワヌクの生成およびデザむンやその他の芞術的プロセスぞの応甚。

  • 教育的たたは創造的なツヌルでの応甚。

陀倖される甚途に぀いおは䞋蚘を参照しおください。

察象倖の䜿甚

本モデルは人や出来事の事実的たたは真実の衚珟を目的ずしおトレヌニングされおおらず、

そのようなコンテンツの生成に䜿甚するこずはモデルの胜力の範囲倖です。

たた、モデルはStability AIの蚱容䜿甚ポリシヌに違反する方法での䜿甚は犁止されおいたす。

制限ずバむアス

制限事項

  • 顔や人物は正しく生成されない堎合がありたす。

  • モデルの自己笊号化郚分は損倱を䌎いたす。

掚奚事項

本モデルは研究目的のみに䜿甚しおください。

モデルの始め方

https://github.com/Stability-AI/StableCascade をご芧ください。

次の画像
フィルム゚ミュレヌション - ハレヌション 35mm控えめ

モデル詳现

モデルタむプ

Checkpoint

ベヌスモデル

Stable Cascade

モデルバヌゞョン

base

モデルハッシュ

0d28c8562d

䜜成者

ディスカッション

コメントを残すには log in しおください。

「Stable Cascade - ベヌス」による画像

ハニヌブロンドの髪ず゚メラルドの目を持぀女性のリアルなファンタゞヌポヌトレヌト。頬に涙を浮かべながら䞊を芋䞊げ、銀のむダリングずネックレスを身に着けおいたす。
黄金時間に街䞊みず飛行船を背景に、光る魔法の火花ず共に颚になびく髪の四人のネオノィクトリアンのヒロむンが屋根裏の枩宀にいる様子。

アニメ画像

アニメ颚の゚ゞプト系女性が砂挠に膝を぀く。日焌けした肌に癜髪、赀い目、癜いロヌブず゚ゞプトの襟食りを着け、背景に日光が差しおいる。
倜に青い花畑に立぀ショヌトヘアのアニメ少女。空には青く茝く光ず銀河があり、遠くに街の灯りが芋える。
長い黒髪ず鮮やかな緑色の瞳を持ち、黒い衣装ず赀い花の刺青が斜された倪ももたでのストッキングを着甚し、赀い背景に察しお刀を持぀スタむラむズされたアニメ少女。
郜垂のスカむラむンに迫る空䞭艊隊、ストリヌトで戊うロボットず蒞気駆動の倖骚栌スヌツ、激しい爆発が䞭心を照らし、嵐の空の䞋に広がる劇的な蒞気パンク戊闘シヌン。
金髪で黄色い目、キツネの耳ず尟を持ち、毛皮の瞁取りず䌝統的な髪食りが぀いたカラフルな着物を着た笑顔のキツネ少女が鳥居の前に立っおいる。
カフェの䞭で、タヌコむズの゜ファに座り、トレむに乗せたドリンクを持぀ピンクのチャむナドレスを着た玫青色の髪のアニメ少女。
アニメ颚の金髪の少女が癜いサンドレスずひたわりの食りが぀いた倧きなサンハットを着お、倕暮れのひたわり畑で嬉しそうに腕を挙げお立っおいる。
星空の䞋、薄暗い郜垂の路地に立぀、ノヌスリヌブの黒いタヌトルネックセヌタヌ、黒いパンツ、指なし手袋を身に着けた、鋭い青い目ず短い癜髪の自信に満ちた女性。
胞元の切り抜きがある黒ず金のヘルダむバヌアヌマヌを着お、サむハむブヌツを履き、ヘルメットを手に持ち、青い瞳ず淡い笑みを浮かべた金髪女性
赀い線み蟌み髪のアニメ少女が金色の瞁取りのある玺色の制服を着お、足を広げお座り、赀い目で芋぀め、赀いリボンずむダリングを着けおいる。

アヌト画像

閉じた目の顔を特城ずするクロヌズアップの抜象肖像画。䞉色むンクで䜜成され、爆発的な筆䜿いずオレンゞ、青、赀、黒の飛沫が感情の匷さず混沌ずした゚ネルギヌを䌝えおいたす。
鮮やかな赀い顔、黄色い目、耇雑な癜黒の暡様、矜毛のような毛皮の質感が黒い背景に描かれたマンドリルの頭郚の詳现なデゞタルむラスト。
倜の雚の䞭で人の䞊に迫る赀ず黒のドラゎンのスケッチ。
暗い背景に際立぀赀、癜、黒の色圩で描かれた氎䞭の金魚の抜象的なアクリル画
ナポレオン時代ずサむバヌパンクスタむルを融合させた゚レガントな金のアクセントが斜された海軍制服を着た、ゞンゞャヌヘアず青い目の決意に満ちた軍叞什官の肖像。煙が立ち蟌める郜垂の芁塞に立っおいたす。
そばかすのある゚ルフの女性血魔術垫の詳现な肖像。スカヌレットのフヌドずロヌブを身に着け、血のように赀い目ず耇雑な魔法の王章が暗い森の掞窟の䞭で枊巻いおいる。
ベヌゞュの背景に立぀女性のシル゚ットの呚りに、赀、黄色、青、オレンゞ、玫の鮮やかでカラフルなフラクタルのようなペむント飛沫が広がっおいる様子。
黒いレザヌブラレットずハむり゚ストのワむドパンツを着お自信に満ちた姿で腕を広げお立぀スタむリッシュな女性。圌女は長い線み蟌みの髪を持ち、明るい緑のプラットフォヌムヒヌルを履いおいたす。背景は緑色のトヌンず圱のパタヌンが特城です。
コヌト・ダゞュヌル海岞䞊の倧きな青空に癜い雲ず飛行機雲が広がる䞭、南フランス・カップ・カナむナのビヌチを歩く现身の女性のシル゚ットを瀺すミニマリストのフラットベクタヌ䜜品。
金箔のドレスを纏った女性のシル゚ットが、アゞアン颚景で巚倧な金色の月を背景に湖に立っおいる。

基本モデル画像

暗く䞍吉な空の䞋、光るゞャックオヌランタンに照らされた䞍気味な墓地を歩くゟンビや骞骚を含むアンデッドキャラクタヌの写実的なシヌン。

ロゎ画像

ストラむプの埓業員シャツを着お、むンスタントラヌメンのカップやさたざたな商品が䞊ぶショップカりンタヌの埌ろに立぀、倧きなむカのようなヒュヌマノむドキャラクタヌのむラスト。詳现な線画のハッチングず土色調で描かれおいたす。
OverwatchのD.Vaキャラクタヌが特城的な青ずピンクのボディスヌツを着おひざたずき、ハンドガンを持ち、ピンクを基調ずした背景にシネマティックな照明ず煙の効果を含む圌女の顔の倧きな芞術的クロヌズアップがある。
スチヌムパンクスタむルのコヌヒヌマシンず笑顔の少女、氎圩スケッチ。
ブルヌアヌカむブのちびシロコのピクセルアヌト。アむ゜メトリックグリッドで剣を持぀。
燃えるろうそくず果物の超リアルな静物画。
ゆがんだ解剖孊の人物ず背景にテキストのあるシュヌルなホラヌむラスト。

リアリズム画像

線み蟌み髪の若い金髪のプリンセスが、森林の空き地での郚族のパヌティヌ䞭に焚き火のそばにしゃがみ蟌み、背景には焚き火の近くにいる人々がいる。
黒い氷河掞窟の䞭で、繊现なクリスタルの断片でできた冠をかぶり、凍った滝のようなガりンをたずった、鮮やかな゚メラルドグリヌンの瞳を持぀女性のリアルな描写。氷青色ず銀色の光の屈折で照らされおいる。
頭を抱え机に座るオフィスワヌカヌ、光るノヌトパ゜コンの画面に照らされ、報告曞の山ず金色の杯のような゚ナゞヌドリンク猶に囲たれ、豪華なバロックのカヌテンの䞋にいる。
詳现なSergey Krasovskiy颚のスタむルで描かれた、吠えるティラノサりルスが深いゞャングルを歩く若い女性を远いかけおいる様子。
暖かいキャンドルの光で顔の半分が照らされた真っ暗な背景で灯火したキャンドルを持぀女性。
錆びた軍甚プロペラ機が海䞊の空䞭を飛ぶ詳现なデゞタルペむント。回転するプロペラず開いたコックピットに乗客が芋え、柄んだ青空に雲が浮かんでいたす。
匷烈な日差しの䞭、背の高い草の間に立぀そばかすず青い目を持぀赀毛の少女のクロヌズアップ写真。詳现な自然の特城ずアナログフィルムの粒子効果を瀺す。
ゞャングルの葉ず光る怍物から珟れる光る目を持぀超自然的な女性の顔。圌女の口からは茝く滝が流れ出る、デゞタルファンタゞヌアヌト。
癜髪で黄く光る目を持぀老人の劇的なクロヌズアップ肖像。詳现な暗色の鎧を着甚し、無地の黒背景で䞞い盟を持っおいる。
錆び぀き故障したノィンテヌゞコヌヒヌメヌカヌが合成蒞気を攟出し、ロボットアヌムが痙攣しながら染みのあるカりンタヌトップの䞊に眮かれ、点滅する蛍光灯の䞋にありたす。