빽빽한 나무와 우뚝 솟은 산으로 둘러싸인 녹색 계곡 바닥에 자리한 긴 직사각형 오두막의 항공 뷰, 무거운 구름으로 가득 찬 어둡고 비가 내리는 하늘 아래.
밤의 숲에 위치한 현대적인 앞면 경사진 정사각형 캐빈으로, 큰 유리 벽과 실내 검은 소파, 식물, 따뜻한 백열등 조명, 야외 현관 좌석이 특징입니다.
소나무, 안개, 노란 잔디에 둘러싸인 경사진 숲 지형 위 기둥으로 높여진 이층 목조 온실 오두막
콘크리트 기둥 위에 수직으로 쌓인 대형 유리창을 가진 쌍둥이 현대식 콘크리트 오두막으로, 눈 덮인 바위산 비탈과 산악 배경에 위치해 있습니다.
회색 하늘 아래 두 개의 경사진 콘크리트 기둥 위 숲 나무 위에 높이 올라간 유리창과 실내 조명이 있는 직사각형 백색 페인트 현대식 오두막.
어두운 배경에 생생한 불꽃으로 둘러싸인 빛나는 주황색 눈을 가진 단조 탄소 마스크.
어두운 배경에 생생하고 소용돌이치는 다채로운 페인트 붓질로 피부와 머리카락이 흐르는 정교한 얼굴의 떠 있는 여성 측면 모습.
금발 머리, 엘프 귀, 파란 눈을 가진 젤다와 닮은 젊은 여성의 초상화로, 황금 티아라와 금색 장식이 화려한 짙은 보라색 중세 드레스를 입고 있음.
고대 사원의 기둥 사이에서 강렬한 불꽃 속에 앉아있는 빛나는 주황색 눈을 가진 검은 고양이, 불과 연기로 둘러싸여 있습니다.
컵에 담긴 김 나는 커피, 연기가 오르는 촛불, 접시에 놓인 작은 호박, 주전자, 나이 든 수채화 질감의 펼쳐진 책이 있는 어두운 판타지 스타일의 가을 오컬트 제단.
대담한 선과 표현력 있는 다채로운 스케치 스타일, 고대비 조명으로 그려진 사막 같은 풍경에 추락한 대형 SF 우주선 잔해와 그 옆에 서 있는 조난당한 조종사의 수채화 그림.
정교한 폐허 건물들이 늘어선 침수된 도시 거리를 묘사한 수채화로, 역동적인 자세의 두 인물이 따뜻하고 고대비 조명에 의해 밝혀져 있습니다.

추천 네거티브 프롬프트

(deformed iris, deformed pupils), text, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, (extra fingers), (mutated hands), poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, (fused fingers), (too many fingers), long neck, camera

추천 매개변수

samplers

Euler

steps

50

cfg

8

resolution

525x525

이 모델은 예술 작품 생성, 교육 도구, 안전한 배치 등 연구 목적으로 설계되었습니다.

사람이나 사건에 대한 사실적 또는 진실한 묘사를 생성하는 용도가 아닙니다.

제한사항으로 완벽한 사진 현실감 부재, 읽을 수 있는 텍스트 렌더링 불가, 구성적 프롬프트 처리의 어려움, 얼굴 생성 불완전함 등이 있습니다.

모델은 OpenCLIP-ViT/G와 CLIP-ViT/L 두 개의 사전 학습 텍스트 인코더를 사용합니다.

2단계 파이프라인은 기본 잠재 생성 후 SDEdit (img2img)를 이용한 고해상도 세부 조정 단계를 포함합니다.

크리에이터 스폰서

원래 Hugging Face에 게시되었으며 Stability AI의 허가를 받아 여기서 공유되었습니다.

원래 Hugging Face에 게시되었으며 Stability AI의 허가를 받아 여기서 공유되었습니다.

SDXL은 잠재 확산을 위한 2단계 파이프라인으로 구성됩니다: 첫 번째 단계에서는 베이스 모델을 사용해 원하는 출력 크기의 잠재 표현을 생성합니다. 두 번째 단계에서는 특수한 고해상도 모델을 사용하며, SDEdit(https://arxiv.org/abs/2108.01073, "img2img"라고도 함)라는 기법을 이용해 첫 번째 단계에서 생성한 잠재 표현에 동일한 프롬프트로 적용합니다.

모델 설명

  • 개발자: Stability AI

  • 모델 유형: 확산 기반 텍스트-이미지 생성 모델

  • 모델 설명: 이 모델은 텍스트 프롬프트를 기반으로 이미지를 생성하고 수정할 수 있습니다. 이는 두 개의 고정된 사전 학습 텍스트 인코더(OpenCLIP-ViT/GCLIP-ViT/L)를 사용하는 잠재 확산 모델입니다.

  • 추가 정보 자료: GitHub 저장소.

모델 소스

사용 사례

직접 사용

이 모델은 연구 목적으로 설계되었습니다. 가능한 연구 분야 및 작업은 다음과 같습니다

  • 예술 작품 생성 및 디자인과 기타 예술적 과정에 활용.

  • 교육용 또는 창작 도구에의 응용.

  • 생성 모델에 대한 연구.

  • 해로운 콘텐츠를 생성할 가능성이 있는 모델의 안전한 배치.

  • 생성 모델의 한계와 편향을 탐색하고 이해하기.

제외된 사용은 아래에 설명되어 있습니다.

범위 벗어난 사용

이 모델은 사람이나 사건에 대한 사실적 또는 진실한 표현을 위해 훈련되지 않았으므로, 그러한 콘텐츠 생성을 위한 사용은 이 모델의 능력 범위 밖입니다.

제한사항 및 편향

제한사항

  • 모델은 완벽한 사진 현실감을 달성하지 못합니다.

  • 모델은 읽을 수 있는 텍스트를 렌더링할 수 없습니다.

  • “파란 구 위에 빨간 큐브”와 같은 구성적 프롬프트와 같은 어려운 작업에 어려움을 겪습니다.

  • 얼굴 및 사람은 일반적으로 제대로 생성되지 않을 수 있습니다.

  • 모델의 오토인코딩 부분은 손실이 있습니다.

편향

이미지 생성 모델의 성능은 인상적이지만, 사회적 편향을 강화하거나 악화시킬 수 있습니다.

위 차트는 Stable Diffusion 1.5 및 2.1에 비해 SDXL(세부 조정 포함 및 미포함)에 대한 사용자 선호도를 평가한 것입니다. SDXL 베이스 모델은 이전 버전보다 훨씬 뛰어난 성능을 보이며, 세부 조정 모듈과 결합된 모델이 전체적으로 가장 우수한 성능을 달성합니다.

이전
Plant Milk 🌿 - 모델 슈트 - Walnut
다음
FLUX.1 - DEV FP8 - Kijai [11 GB]

모델 세부사항

모델 유형

Checkpoint

기본 모델

SDXL 1.0

모델 버전

v1.0 VAE fix

모델 해시

e6bb9ea85b

토론

댓글을 남기려면 log in하세요.

SD XL - v1.0 VAE 수정 제작 이미지

기본 모델 이미지

공식 이미지

sdxl 이미지

stability ai 이미지