모델/XL 및 1.5용 DPO (직접 선호 최적화) LoRA - OpenRail++ - SDXL - V1.0

XL 및 1.5용 DPO (직접 선호 최적화) LoRA - OpenRail++ - SDXL - V1.0

|
7/26/2025
|
1:44:43 PM
| Discussion|
0
은색 갑옷을 입은 여성 전사가 빛나는 칼과 빨간 문양이 있는 파란 방패를 들고 숲속에 서 있습니다.
무지갯빛 파란색과 녹색 깃털, 크고 표현력 있는 눈, 빛나는 생물발광 하이라이트를 가진 외계 생물의 매크로 샷, 붉은 외계 식물에 앉아 있음.
거실에서 빨간 넥타이를 매고 교복을 입은 금발 픽시 헤어를 한 젊은 여성이 빨간 안락의자에 앉아 있으며, 식물과 빨간 커튼이 배경에 있습니다.
은색 잎사귀와 복잡한 꽃무늬 및 프랙탈 패턴에 루비, 사파이, 자수정, 금 요소가 포함된 상세한 네오비잔틴 스타일 원형 모자이크.
불타는 주황색 일몰 하늘을 배경으로 실루엣된 뾰족한 산봉우리, 맑은 호수에 반사되어 표면 아래 바위가 보입니다.
Stable Diffusion AI로 생성된 여러 팔을 가진 다채롭고 귀여운 로봇 캐릭터.
안개 낀 산봉우리와 잔잔한 물에 둘러싸인 산속 사원, Stable Diffusion을 사용해 AI가 생성함.

추천 프롬프트

RAW photo, a close-up picture of a cat, a close-up picture of a dog, orange eyes, blue eyes, reflection in it's eyes

추천 매개변수

samplers

DPM2

steps

25

cfg

5

크리에이터 스폰서

DPO란 무엇인가?

DPO는 직접 선호 최적화를 의미하며, 확산 모델이 사람이 선택한 이미지에 기반해 파인튜닝되는 과정을 가리킵니다. Meihua Dang 등은 Pick-a-Pic v2 데이터셋과 이 방법을 사용하여 Stable Diffusion 1.5 및 Stable Diffusion XL을 훈련했으며, 데이터셋은 https://huggingface.co/datasets/yuvalkirstain/pickapic_v2에서 확인할 수 있고, 논문은 https://huggingface.co/papers/2311.12908에서 볼 수 있습니다.

무엇을 하는가?

훈련된 DPO 모델은 미세 조정되지 않은 모델보다 더 높은 품질의 이미지를 생성하며, 특히 프롬프트에 대한 강한 준수가 관찰됩니다. 이 LoRA는 다른 파인튜닝된 Stable Diffusion 모델에도 프롬프트 준수 향상을 가져올 수 있습니다.

누가 훈련했나요?

이 LoRA는 Meihua Dang(https://huggingface.co/mhdang)의 연구를 기반으로 합니다.

https://huggingface.co/mhdang/dpo-sdxl-text2image-v1https://huggingface.co/mhdang/dpo-sd1.5-text2image-v1에서 OpenRail++ 라이선스로 제공됩니다.

이 LoRA는 어떻게 만들어졌나요?

CivitAI와 HuggingFace의 다른 OpenRail++ 라이선스 체크포인트에서 Kohya SS를 사용해 추출하여 제작되었습니다.

1.5: https://civitai.com/models/240850/sd15-direct-preference-optimization-dpohttps://huggingface.co/fp16-guy/Stable-Diffusion-v1-5_fp16_cleaned/blob/main/sd_1.5.safetensors에서 추출되었습니다.

XL: https://civitai.com/models/238319/sd-xl-dpo-finetune-direct-preference-optimizationhttps://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/blob/main/sd_xl_base_1.0_0.9vae.safetensors에서 추출되었습니다.

이들은 또한 https://huggingface.co/benjamin-paine/sd-dpo-offsets/에서 HuggingFace에 호스팅되어 있습니다.

이전
NightVisionXL - NightVisionXL_v9.0.0
다음
CHOo1NE | Shiiro's Styles - v1.0

모델 세부사항

모델 유형

LORA

기본 모델

SDXL 1.0

모델 버전

SDXL - V1.0

모델 해시

c100ec5708

제작자

토론

댓글을 남기려면 log in하세요.

모델 컬렉션 - DPO (Direct Preference Optimization) LoRA for XL and 1.5 - OpenRail++

XL 및 1.5용 DPO (직접 선호 최적화) LoRA - OpenRail++ - SDXL - V1.0 제작 이미지

dpo 이미지

lora 이미지

stable diffusion 이미지

도구 이미지