劇的なスポットラむトの䞋、高さのチャヌトの前に立぀オレンゞのくちばしを持぀䞍機嫌な癜いアヒルが、黒いマグショットの名札を持っおいる。
ボリュヌメトリックラむティングず濡れお光沢のある衚面のある重い雚雲の䞋で雚の草原に立っおいる、怒った衚情の擬人化された䞍機嫌なブロッコリヌキャラクタヌ。
流れるような倚色の髪ず青い目を持ち、黒のレヌスドレスず金の冠を぀けた少女が、鮮やかに咲く花々に囲たれ、ボリュヌメトリックラむティングの宀内にいる。
発光する骞骚の顔を持぀サむボヌグ芞者悪魔が、血たみれの赀い鎧ず黄金のマントを身に着け、謎めいた城の庭で骞骚に囲たれお片膝を぀いおいる姿。
灰色の髪ず片翌を持぀倩䜿が開いた本に寄りかかり、頭䞊には滎る赀い埌光ずマンガスタむルの䞍気味なオヌラが描かれたむラスト。
暗い目を芆う荒れた乱れ髪、血たみれの口をした䞍気味な笑み、トゲ付き銖茪、骚栌が芋える胞郚のディテヌルを線画スタむルで描いた痩せこけた少女のクロヌズアップポヌトレヌト。
短い茶色の髪ずそばかすを持぀アニメ少女のクロヌズアップポヌトレヌトで、緑のドレスず劖粟の翌を着おおり、光の線や粒子が挂う詳现で柔らかく照らされた倜の背景に囲たれおいる。
黄色のパヌカヌずストラむプの靎䞋を着お短いブロンドの髪ず䞞い県鏡をかけた小柄な女の子が、枕ずシダ怍物に囲たれた床に座り、玠朎な窓ず本棚のある居心地の良い寝宀で緑色の本を読んでいる。
発光効果のある察照的な背景を背にした青ずオレンゞのオオカミのシル゚ットを描いた鮮やかな印象掟油絵
ピンクの軍服ず赀いブヌツを履いた金髪のアニメスタむルの少女が、鮮やかな照明ずレトロ未来的なディテヌルがあるハむテク宇宙船の通路内で銃を狙い、ダむナミックな戊闘姿勢にある。
玫色の目を持ち、黒い華やかなカクテルドレスを着た若い女性が、薄暗いクラシックなゞャズクラブのステヌゞで暖かいボリュヌムラむティングの䞭、ノィンテヌゞマむクに情熱的に歌いかけおいる。背景には楜噚が芋える。
アニメ颚の少女、黒いミディアムヘアで黄色い目。青いゞャケット、赀いチェックのスカヌト、青い手袋を着甚し、割れた窓のある郚屋の䞭でAR-15ラむフルを発砲し、珟金の詰たったダッフルバッグを持぀。

ヒント

このモデルはLoRAで埮調敎されたチェックポむントです。

蚓緎では4,000のプロンプトを10゚ポック䜿甚したした。

Step-by-step Preference Optimizationにより各ステップでの现かな芖芚的改善が可胜ずなり、矎的感芚を効果的に向䞊させたす。

Step-by-step Preferenceによる䞀般的な奜みからの矎的ポストトレヌニングDiffusionモデル

Arxiv論文

Githubコヌド

プロゞェクトペヌゞ

抂芁

芖芚的に魅力的な画像の生成は珟代のテキストから画像ぞの生成モデルの基本です。矎的感芚を向䞊させる朜圚的な解決策は盎接的奜み最適化DPOであり、これはプロンプトの敎合性や矎的感芚を含む䞀般的な画像品質を改善するためにDiffusionモデルに適甚されおいたす。䞀般的なDPO手法は、きれいな画像ペアからの奜みラベルを2぀の生成経路のすべおの䞭間ステップに䌝播させたす。しかし、既存のデヌタセットで提䟛される奜みラベルはレむアりトや矎的意芋ず混ざり合っおおり、矎的奜みず矛盟する堎合がありたす。たずえ矎的ラベルが提䟛されおいおもかなりのコストをかけお、2経路手法では異なるステップでの埮劙な芖芚差異を捉えるこずは困難です。

矎的感芚を経枈的に改善するために、本論文では既存の䞀般的な奜みデヌタを䜿甚し、䌝播戊略を廃止しお詳现な画像ディテヌルを評䟡可胜にするStep-by-step Preference OptimizationSPOを導入したす。具䜓的には、各ノむズ陀去ステップで1共有ノむズ朜圚倉数から耇数の候補をサンプリングし、2ステップ察応の奜みモデルを甚いお適切な勝敗ペアを芋぀けおDiffusionモデルの監督を行い、3次のノむズ陀去ステップの初期化に候補プヌルからランダムに1぀遞びたす。この戊略により、Diffusionモデルはレむアりトの偎面ではなく、埮现な芖芚差異に集䞭できたす。これらの改良された小さな差異を積み重ねるこずで矎的感芚は倧きく向䞊したす。

Stable Diffusion v1.5およびSDXLを埮調敎した際、SPOは既存のDPO手法ず比べお矎的感芚を倧幅に改善し、バニラモデルに比べお画像ずテキストの敎合性を損ないたせん。さらに、SPOは现かな芖芚差異のステップごずの敎合によりDPOよりもはるかに速く収束したす。コヌドずモデルはこちらhttps://rockeycoss.github.io/spo.github.io/

モデル説明

このモデルはstable-diffusion-xl-base-1.0から埮調敎されおいたす。4,000のプロンプトで10゚ポックの蚓緎を行っおいたす。このチェックポむントはLoRAチェックポむントです。詳现はこちらをご芧ください。

匕甚

本研究が有甚だず感じたら、スタヌを付けお匕甚しおいただけるず幞いです。

@article{liang2024step,
  title={Step-by-step Preference Optimizationによる䞀般的な奜みからの矎的ポストトレヌニングDiffusionモデル},
  author={Liang, Zhanhao and Yuan, Yuhui and Gu, Shuyang and Chen, Bohan and Hang, Tiankai and Cheng, Mingxi and Li, Ji and Zheng, Liang},
  journal={arXiv preprint arXiv:2406.04314},
  year={2024}
}
前の画像
RealCartoon-XL - V7
次の画像
Artsy Vibe - v1 - FP8

モデル詳现

モデルタむプ

LORA

ベヌスモデル

SDXL 1.0

モデルバヌゞョン

v1.0

モデルハッシュ

b6c2c16f3e

䜜成者

ディスカッション

コメントを残すには log in しおください。

モデルコレクション - SPO-SDXL_4k-p_10ep_LoRA_webui

「SPO-SDXL_4k-p_10ep_LoRA_webui - v1.0」による画像

劇的なスポットラむトの䞋、高さのチャヌトの前に立぀オレンゞのくちばしを持぀䞍機嫌な癜いアヒルが、黒いマグショットの名札を持っおいる。
ボリュヌメトリックラむティングず濡れお光沢のある衚面のある重い雚雲の䞋で雚の草原に立っおいる、怒った衚情の擬人化された䞍機嫌なブロッコリヌキャラクタヌ。
流れるような倚色の髪ず青い目を持ち、黒のレヌスドレスず金の冠を぀けた少女が、鮮やかに咲く花々に囲たれ、ボリュヌメトリックラむティングの宀内にいる。
発光する骞骚の顔を持぀サむボヌグ芞者悪魔が、血たみれの赀い鎧ず黄金のマントを身に着け、謎めいた城の庭で骞骚に囲たれお片膝を぀いおいる姿。
灰色の髪ず片翌を持぀倩䜿が開いた本に寄りかかり、頭䞊には滎る赀い埌光ずマンガスタむルの䞍気味なオヌラが描かれたむラスト。
暗い目を芆う荒れた乱れ髪、血たみれの口をした䞍気味な笑み、トゲ付き銖茪、骚栌が芋える胞郚のディテヌルを線画スタむルで描いた痩せこけた少女のクロヌズアップポヌトレヌト。
短い茶色の髪ずそばかすを持぀アニメ少女のクロヌズアップポヌトレヌトで、緑のドレスず劖粟の翌を着おおり、光の線や粒子が挂う詳现で柔らかく照らされた倜の背景に囲たれおいる。
黄色のパヌカヌずストラむプの靎䞋を着お短いブロンドの髪ず䞞い県鏡をかけた小柄な女の子が、枕ずシダ怍物に囲たれた床に座り、玠朎な窓ず本棚のある居心地の良い寝宀で緑色の本を読んでいる。
発光効果のある察照的な背景を背にした青ずオレンゞのオオカミのシル゚ットを描いた鮮やかな印象掟油絵
ピンクの軍服ず赀いブヌツを履いた金髪のアニメスタむルの少女が、鮮やかな照明ずレトロ未来的なディテヌルがあるハむテク宇宙船の通路内で銃を狙い、ダむナミックな戊闘姿勢にある。
玫色の目を持ち、黒い華やかなカクテルドレスを着た若い女性が、薄暗いクラシックなゞャズクラブのステヌゞで暖かいボリュヌムラむティングの䞭、ノィンテヌゞマむクに情熱的に歌いかけおいる。背景には楜噚が芋える。
アニメ颚の少女、黒いミディアムヘアで黄色い目。青いゞャケット、赀いチェックのスカヌト、青い手袋を着甚し、割れた窓のある郚屋の䞭でAR-15ラむフルを発砲し、珟金の詰たったダッフルバッグを持぀。

基本モデル画像

暗く䞍吉な空の䞋、光るゞャックオヌランタンに照らされた䞍気味な墓地を歩くゟンビや骞骚を含むアンデッドキャラクタヌの写実的なシヌン。