불타는 주황색 깃털을 펼친 날개와 우울한 하늘 배경을 가진 까마귀가 나는 극적인 이미지.
초현실적인 지옥 동굴에서 빛나는 용암 바닥 위에 서 있고 흩어진 주사위로 둘러싸인 주사위 무늬의 로봇 터미네이터.
치아가 보이는 벌어진 여성 입술의 흑백 클로즈업 이미지 위에 추상적인 간섭 무늬가 겹쳐진 모습.
높은 건물이 배경에 있는 안개 낀 도시 환경을 걷는 인물들의 실루엣을 보여주는 흑백 도시 풍경.
광각 렌즈와 필름 그레인 효과 아래, 배경에 산이 있고 외계 식물이 둘러싼 곳에서 크고 반사되는 눈을 가진 호기심 많은 외계인의 클로즈업 뷰, 상세한 외계 피부 질감.
인터스텔라 프로브가 필름 그레인 효과로 촬영한, 외계 풍경이 반사된 커다란 반사 눈을 가진 고도로 세밀한 외계인 얼굴 클로즈업.
흐릿한 불모의 풍경을 배경으로 한 꿈같은 파노라마 속 곱슬머리 적모 젊은 여성의 조각 같은 극사실적 초상화.
주근깨로 둘러싸인 초록색 눈의 하이퍼 리얼리즘 클로즈업 이미지, 빨간 생강 머리와 검게 칠해진 입술.
길고 붉은 머리, 흰 피부에 주근깨, 연두빛 눈, 검은 입술을 가진 여성 초상화로, 하이퍼 리얼리즘 스타일의 정교한 디테일을 보여줍니다.

추천 매개변수

resolution

525x525

이 모델은 예술 작품 생성, 교육 도구, 안전 배포 등 연구 목적을 위해 제작되었습니다.

사람이나 사건의 사실적 또는 진실한 묘사를 생성하는 데에는 적합하지 않습니다.

완벽한 포토리얼리즘 미달, 읽을 수 있는 텍스트 불가, 구성적 프롬프트 처리 어려움, 얼굴 생성 문제 등의 한계가 있습니다.

두 개의 사전 학습된 텍스트 인코더인 OpenCLIP-ViT/G와 CLIP-ViT/L을 사용합니다.

2단계 파이프라인은 베이스 잠재 생성과 SDEdit(img2img)를 이용한 고해상도 정제로 구성됩니다.

크리에이터 스폰서

원본은 Hugging Face에 게시되었으며 Stability AI의 허가를 받아 여기서 공유됩니다.

원본은 Hugging Face에 게시되었으며 Stability AI의 허가를 받아 여기서 공유됩니다.

SDXL은 잠재 확산을 위한 2단계 파이프라인으로 구성됩니다: 첫 번째 단계에서는 원하는 출력 크기의 잠재 변수를 생성하는 베이스 모델을 사용합니다. 두 번째 단계에서는 특수 고해상도 모델을 사용하고 SDEdit(https://arxiv.org/abs/2108.01073, "img2img"라고도 불림) 기법을 첫 단계에서 생성된 잠재 변수에 동일한 프롬프트로 적용합니다.

모델 설명

  • 개발: Stability AI

  • 모델 유형: 확산 기반 텍스트-이미지 생성 모델

  • 모델 설명: 텍스트 프롬프트를 기반으로 이미지를 생성 및 수정하는 데 사용되는 모델입니다. 두 개의 고정된 사전 학습된 텍스트 인코더(OpenCLIP-ViT/GCLIP-ViT/L)를 사용하는 Latent Diffusion Model입니다.

  • 추가 정보 자료: GitHub 저장소.

모델 소스

용도

직접 사용

이 모델은 연구 목적만을 위해 만들어졌습니다. 가능한 연구 분야 및 작업에는 다음이 포함됩니다:

  • 예술 작품 생성 및 디자인 등 예술적 과정에의 활용.

  • 교육용 또는 창작 도구에서의 응용.

  • 생성 모델에 대한 연구.

  • 유해한 콘텐츠 생성을 방지하는 안전한 모델 배포.

  • 생성 모델의 한계 및 편향 분석 및 이해.

제외되는 사용은 아래에 설명되어 있습니다.

범위 외 사용

이 모델은 사람이나 사건에 대한 사실적 또는 진실한 표현을 생성하도록 훈련되지 않았으므로, 해당 내용을 생성하는 것은 모델의 능력 범위를 벗어납니다.

한계 및 편향

한계

  • 모델은 완벽한 포토리얼리즘을 달성하지 못합니다.

  • 모델은 읽을 수 있는 텍스트를 렌더링할 수 없습니다.

  • “파란 구 위에 빨간 큐브”와 같은 구성 관련 복잡한 작업에 어려움을 겪습니다.

  • 얼굴 및 사람은 일반적으로 제대로 생성되지 않을 수 있습니다.

  • 모델의 자동 인코딩 부분은 손실이 발생합니다.

편향

이미지 생성 모델의 능력은 인상적이지만, 사회적 편향을 강화하거나 심화할 수도 있습니다.

위 차트는 Stable Diffusion 1.5 및 2.1 대비 SDXL(정제 포함 및 비포함)에 대한 사용자 선호도를 평가합니다. SDXL 베이스 모델은 이전 버전에 비해 현저히 우수하며, 정제 모듈과 결합된 모델이 전체적으로 최고의 성능을 달성합니다.

이전
epiCPhotoGasm - V1
다음
IlluQuaint - v0.3

모델 세부사항

모델 유형

Checkpoint

기본 모델

SDXL 1.0

모델 버전

v1.0

모델 해시

31e35c80fc

토론

댓글을 남기려면 log in하세요.

SD XL - v1.0 제작 이미지

불타는 주황색 깃털을 펼친 날개와 우울한 하늘 배경을 가진 까마귀가 나는 극적인 이미지.
초현실적인 지옥 동굴에서 빛나는 용암 바닥 위에 서 있고 흩어진 주사위로 둘러싸인 주사위 무늬의 로봇 터미네이터.
치아가 보이는 벌어진 여성 입술의 흑백 클로즈업 이미지 위에 추상적인 간섭 무늬가 겹쳐진 모습.
높은 건물이 배경에 있는 안개 낀 도시 환경을 걷는 인물들의 실루엣을 보여주는 흑백 도시 풍경.
광각 렌즈와 필름 그레인 효과 아래, 배경에 산이 있고 외계 식물이 둘러싼 곳에서 크고 반사되는 눈을 가진 호기심 많은 외계인의 클로즈업 뷰, 상세한 외계 피부 질감.
인터스텔라 프로브가 필름 그레인 효과로 촬영한, 외계 풍경이 반사된 커다란 반사 눈을 가진 고도로 세밀한 외계인 얼굴 클로즈업.
흐릿한 불모의 풍경을 배경으로 한 꿈같은 파노라마 속 곱슬머리 적모 젊은 여성의 조각 같은 극사실적 초상화.
주근깨로 둘러싸인 초록색 눈의 하이퍼 리얼리즘 클로즈업 이미지, 빨간 생강 머리와 검게 칠해진 입술.
길고 붉은 머리, 흰 피부에 주근깨, 연두빛 눈, 검은 입술을 가진 여성 초상화로, 하이퍼 리얼리즘 스타일의 정교한 디테일을 보여줍니다.

기본 모델 이미지

어둡고 불길한 하늘 아래 빛나는 잭오랜턴 조명으로 밝힌 음산한 무덤을 걷는 좀비와 해골을 포함한 언데드 캐릭터들의 사진 같은 장면.

공식 이미지

영화 같은 조명 아래 금빛 갑옷을 입고 빛나는 금색 구체를 들고 있는 어두운 파란색 머리와 최면을 거는 노란 눈을 가진 여성 전사의 초고해상도 초상화.

sdxl 이미지

신체 전체에 금속성 광택과 복잡하게 맥동하는 빨강과 파랑 ais-vesselz 혈관이 덮인 상세한 드래곤.
펄싱하는 붉은 Ais-Vesselz에 감싸이고 얽힌 무너져가는 건물들이 있는 버려진 도시 풍경, 끈적한 붉은 액체로 미끄러진 거리.
도시 스카이라인을 배경으로 저녁 무렵, 파란 갑옷 판금과 천체 반짝임, 날카로운 셀 셰이딩으로 강조된 로봇 용 머리 클로즈업.

stability ai 이미지

흰색 원피스와 해바라기 장식이 달린 큰 선햇을 쓴 애니메이션 스타일 금발 소녀가 해가 지는 해바라기 밭에서 팔을 들고 행복하게 서 있습니다.
긴 검은 머리와 갈색 눈을 가진 Ffixgarnet 캐릭터가 흰색 퍼프 소매와 빨간 장갑이 있는 오렌지 색 크로스 레이스 보디수트를 입고 파란 하늘 배경에서 나무 밧줄 사다리를 오르며, 얼굴이 붉어지고 뒤돌아보는 모습
보라색과 다크 판타지 배경에 날카로운 톱니 모양 바위가 있는 곳에서 역동적인 자세로 쭈그리고 앉아 있는 핫 핑크 머리와 불타는 날개를 가진 애니메이션 캐릭터.
다채로운 몽환적인 보케 조명이 있는 어두운 우주 배경에 떠 있는 여러 질감 있는 검은 구체의 클로즈업 뷰.
매트 블랙 얼굴 없는 헬멧, 긴 검은 머리, 그리고 어두운 분위기에서 희미하게 빨간 빛을 내는 정교한 빨간색과 검은색 갑옷을 입은 사이보그의 클로즈업.
기계 부품과 케이블이 있는 어두운 로봇 공장에서 원형 톱날 창을 휘두르는 녹색 트윈테일 메이드 전사, 바닥에 피가 튀어 있습니다.