模型/DPO（直接偏好優化）LoRA 用於 XL 和 1.5 - OpenRail++ - SDXL - V1.0

DPO（直接偏好優化）LoRA 用於 XL 和 1.5 - OpenRail++ - SDXL - V1.0

陳嘉欣 (Chan Ka-yan)

|

7/26/2025

|

1:49:57 PM

0

相關關鍵字和標籤

直接偏好優化,dpo,dpo（直接偏好優化）lora 適用於 xl 和 1.5 - openrail++,enfugue,lora,pick-a-pic v2 數據集,sdxl 1.0,sdxl - v1.0,stable diffusion,工具

一名穿著銀色盔甲的女戰士站在森林中，手持發光的劍和帶有紅色紋章的藍色盾牌。

微距拍攝的外星生物，擁有虹彩藍綠羽毛、大而有表情的眼睛，以及發光的生物螢光細節，棲息於紅色外星植物上。

年輕女性剪著金色短髮，坐在紅色扶手椅上，穿著帶紅領帶的校服，背景是有植物和紅色窗簾的客廳場景。

一個詳細的新拜占庭風格圓形馬賽克，特色為紅寶石、藍寶石、紫水晶及金元素，配以複雜的花卉及分形圖案和銀葉。

銳利的山峰輪廓映襯在火紅橙色的夕陽天空，倒映在清澈湖水中，湖底岩石清晰可見。

使用 Stable Diffusion AI 生成的多手臂色彩繽紛可愛機械人角色。

一座被薄霧山峰與寧靜水域包圍的山中寺廟，使用 Stable Diffusion 生成的 AI 圖像。

推薦提示詞

RAW photo, a close-up picture of a cat, a close-up picture of a dog, orange eyes, blue eyes, reflection in it's eyes

推薦參數

samplers

DPM2

steps

25

cfg

5

創作者贊助

Pick-a-Pic v2 數據集 | DPO 論文 | Meihua Dang HuggingFace | DPO SDXL 模型 | DPO SD1.5 模型 | CivitAI 上的 SD1.5 DPO | 原始 SD 1.5 檢查點 | CivitAI 上的 SD XL DPO | 原始 SD XL 檢查點 | HuggingFace 上的 SD DPO 偏移量

什麼是 DPO？

DPO 是 Direct Preference Optimization，意指基於人類選擇的圖像來微調擴散模型的過程。Meihua Dang 等人使用此方法和 Pick-a-Pic v2 數據集訓練了 Stable Diffusion 1.5 和 Stable Diffusion XL，該數據集可在 https://huggingface.co/datasets/yuvalkirstain/pickapic_v2 找到，相關論文刊載於 https://huggingface.co/papers/2311.12908。

它有什麼效果？

訓練後的 DPO 模型被觀察到能產生比未調整模型更高質量的圖像，並且顯著提升了模型對提示詞的遵從度。這些 LoRA 可將此提示詞遵從度改進帶到其他微調過的 Stable Diffusion 模型中。

是誰訓練的？

這些 LoRA 基於 Meihua Dang（https://huggingface.co/mhdang）的研究成果，相關模型位於

https://huggingface.co/mhdang/dpo-sdxl-text2image-v1 及 https://huggingface.co/mhdang/dpo-sd1.5-text2image-v1，採用 OpenRail++ 授權。

這些 LoRA 是如何製作的？

它們使用 Kohya SS，從 CivitAI 和 HuggingFace 上其他 OpenRail++ 授權的檢查點中提取而成。

1.5: https://civitai.com/models/240850/sd15-direct-preference-optimization-dpo，提取自 https://huggingface.co/fp16-guy/Stable-Diffusion-v1-5_fp16_cleaned/blob/main/sd_1.5.safetensors。

XL: https://civitai.com/models/238319/sd-xl-dpo-finetune-direct-preference-optimization，提取自 https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/blob/main/sd_xl_base_1.0_0.9vae.safetensors

這些模型亦在 HuggingFace 上托管，地址為 https://huggingface.co/benjamin-paine/sd-dpo-offsets/

貢獻者

陳嘉欣 (Chan Ka-yan)

大家好，我係陳嘉欣。熱愛影像藝術嘅我，專注將 AI 生成圖像打磨成最亮眼嘅作品，為畫廊注入新活力。

NightVisionXL - NightVisionXL_v9.0.0

CHOo1NE | Shiiro's Styles - v1.0

使用此模型

模型詳情

模型類型

LORA

基礎模型

SDXL 1.0

模型版本

SDXL - V1.0

模型雜湊值

c100ec5708

創作者

討論

請log in以發表評論。

模型合集 - DPO (Direct Preference Optimization) LoRA for XL and 1.5 - OpenRail++

一隻外星生物的微距照片，擁有虹彩藍綠色羽毛，巨大表情豐富的眼睛，發光的生物發光亮點，棲息於紅色外星植物上。

DPO（直接偏好優化）LoRA 用於 XL 和 1.5 - OpenRail++ - SDXL - V1.0

簡短雜湊值:

DPO（直接偏好優化）LoRA 用於 XL 和 1.5 - OpenRail++ - SDXL - V1.0 的圖片

一名穿著銀色盔甲的女戰士站在森林中，手持發光的劍和帶有紅色紋章的藍色盾牌。

微距拍攝的外星生物，擁有虹彩藍綠羽毛、大而有表情的眼睛，以及發光的生物螢光細節，棲息於紅色外星植物上。

年輕女性剪著金色短髮，坐在紅色扶手椅上，穿著帶紅領帶的校服，背景是有植物和紅色窗簾的客廳場景。

一個詳細的新拜占庭風格圓形馬賽克，特色為紅寶石、藍寶石、紫水晶及金元素，配以複雜的花卉及分形圖案和銀葉。

銳利的山峰輪廓映襯在火紅橙色的夕陽天空，倒映在清澈湖水中，湖底岩石清晰可見。

使用 Stable Diffusion AI 生成的多手臂色彩繽紛可愛機械人角色。

一座被薄霧山峰與寧靜水域包圍的山中寺廟，使用 Stable Diffusion 生成的 AI 圖像。

dpo 圖片

一名穿著銀色盔甲的女戰士站在森林中，手持發光的劍和帶有紅色紋章的藍色盾牌。

銳利的山峰輪廓映襯在火紅橙色的夕陽天空，倒映在清澈湖水中，湖底岩石清晰可見。

lora 圖片

一位白髮紅眼的女孩，穿著黑色服裝和金色帶刺護手，手握紅色發光劍，站立於劍墓中翻滾的霧氣中。

一位奇幻男性帶著惡魔翅膀跪在血紅色的池中，位於發光的紅月下，周圍環繞著劍與戲劇化燈光。

黑暗奇幻女性精靈特寫，白髮、黑角、蒼白皮膚，穿著帶骷髏圖案複雜金色盔甲，手持發紅光的劍。

一位逼真的文藝復興風格女精靈，長黑髮，綠色眼睛，尖耳朵，穿著有銀色鈕扣的長黑裙，手持扭曲法杖，站在籠罩著霧氣的墓地中。

使用 stable diffusion 生成的 AI 圖像，展示一位穿藍袍的偉大巫師，身後有神秘身影。

動漫風格綠髮女戰士形象，穿著青綠色服裝配棕色腰帶、紫色披風，以及橙色手套和靴子。此圖像使用 stable diffusion 生成。

一位穿黑色連衣裙、紅髮的復古女子快樂地握著兩個骷髏頭並大笑。此為使用 Stable Diffusion 生成的 AI 圖像。

武士站立於夜晚昏暗巷弄中，由 Stable Diffusion AI 生成。

一個使用 Stable Diffusion 創建的穿制服男子逼真 3D 模型。

動漫少女，長金髮，戴帽子，橙色T恤，白色褲子，紅色運動鞋，坐在都市環境中，使用 Stable Diffusion AI 生成。

stable diffusion 圖片

穿著米色背心和藍色裙子的棕髮女學生，時尚地坐在教室的學校椅上，陽光透過窗戶灑入。

黑紅主題、限定調色板、單色及灰階的紅眼紅髮吸血鬼女子。

穿著連身褲和草帽，帶有淡淡紅暈的棕褐膚色動漫少女，站在向日葵田中，微笑看著觀眾。

藝術風格描繪室內的精靈少女，帶有發光的體積光影及豐滿胸部，面向觀者。

戴眼鏡的穿西裝擬人化狐狸男，手持血跡斑斑的錘子。

一位深綠髮戴眼鏡的哥特龐克老師靠著牆壁，穿著皮革束腹和長裙，站在有植物的小巷中。

WeissSchnee 白髮、身形曲線，穿著細節豐富的藍白服裝，在雪地城市背景中的插畫。

一位科幻戰士女巫，擁有銀色頭髮、發光粉紅眼睛和精緻紋身，穿著審問官束腰外套，置身於高對比戲劇化場景中。

動畫風格的紅眼哥德龐克老師，擁有精靈短髮，站在有蝴蝶和植物的巷子裡。

動漫風格 goth succubus 綠眼戴膠衣連體衣，深藍髮色，在小巷中，有蝴蝶環繞。

工具圖片

一位毛茸茸的人形角色背著背包、拿著斧頭，行走於末世景觀中。此圖像由 Stable Diffusion AI 生成。