模型/DPO(直接偏好優化)LoRA 用於 XL 和 1.5 - OpenRail++ - SDXL - V1.0

DPO(直接偏好優化)LoRA 用於 XL 和 1.5 - OpenRail++ - SDXL - V1.0

|
7/26/2025
|
1:49:57 PM
| Discussion|
0
一名穿著銀色盔甲的女戰士站在森林中,手持發光的劍和帶有紅色紋章的藍色盾牌。
微距拍攝的外星生物,擁有虹彩藍綠羽毛、大而有表情的眼睛,以及發光的生物螢光細節,棲息於紅色外星植物上。
年輕女性剪著金色短髮,坐在紅色扶手椅上,穿著帶紅領帶的校服,背景是有植物和紅色窗簾的客廳場景。
一個詳細的新拜占庭風格圓形馬賽克,特色為紅寶石、藍寶石、紫水晶及金元素,配以複雜的花卉及分形圖案和銀葉。
銳利的山峰輪廓映襯在火紅橙色的夕陽天空,倒映在清澈湖水中,湖底岩石清晰可見。
使用 Stable Diffusion AI 生成的多手臂色彩繽紛可愛機械人角色。
一座被薄霧山峰與寧靜水域包圍的山中寺廟,使用 Stable Diffusion 生成的 AI 圖像。

推薦提示詞

RAW photo, a close-up picture of a cat, a close-up picture of a dog, orange eyes, blue eyes, reflection in it's eyes

推薦參數

samplers

DPM2

steps

25

cfg

5

創作者贊助

什麼是 DPO?

DPO 是 Direct Preference Optimization,意指基於人類選擇的圖像來微調擴散模型的過程。Meihua Dang 等人使用此方法和 Pick-a-Pic v2 數據集訓練了 Stable Diffusion 1.5 和 Stable Diffusion XL,該數據集可在 https://huggingface.co/datasets/yuvalkirstain/pickapic_v2 找到,相關論文刊載於 https://huggingface.co/papers/2311.12908

它有什麼效果?

訓練後的 DPO 模型被觀察到能產生比未調整模型更高質量的圖像,並且顯著提升了模型對提示詞的遵從度。這些 LoRA 可將此提示詞遵從度改進帶到其他微調過的 Stable Diffusion 模型中。

是誰訓練的?

這些 LoRA 基於 Meihua Dang(https://huggingface.co/mhdang)的研究成果,相關模型位於

https://huggingface.co/mhdang/dpo-sdxl-text2image-v1https://huggingface.co/mhdang/dpo-sd1.5-text2image-v1,採用 OpenRail++ 授權。

這些 LoRA 是如何製作的?

它們使用 Kohya SS,從 CivitAI 和 HuggingFace 上其他 OpenRail++ 授權的檢查點中提取而成。

1.5: https://civitai.com/models/240850/sd15-direct-preference-optimization-dpo,提取自 https://huggingface.co/fp16-guy/Stable-Diffusion-v1-5_fp16_cleaned/blob/main/sd_1.5.safetensors

XL: https://civitai.com/models/238319/sd-xl-dpo-finetune-direct-preference-optimization,提取自 https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/blob/main/sd_xl_base_1.0_0.9vae.safetensors

這些模型亦在 HuggingFace 上托管,地址為 https://huggingface.co/benjamin-paine/sd-dpo-offsets/

上一個
NightVisionXL - NightVisionXL_v9.0.0
下一個
CHOo1NE | Shiiro's Styles - v1.0

模型詳情

模型類型

LORA

基礎模型

SDXL 1.0

模型版本

SDXL - V1.0

模型雜湊值

c100ec5708

創作者

討論

log in以發表評論。

模型合集 - DPO (Direct Preference Optimization) LoRA for XL and 1.5 - OpenRail++

DPO(直接偏好優化)LoRA 用於 XL 和 1.5 - OpenRail++ - SDXL - V1.0 的圖片

dpo 圖片

lora 圖片

stable diffusion 圖片

工具 圖片