Shuttle 3.1 Aesthetic - v1.0
추천 프롬프트
A cat holding a sign that says hello world
추천 매개변수
steps
resolution
팁
효율성을 위해 bfloat16 텐서 타입을 사용하세요.
필요 시 VRAM 절약을 위해 모델 CPU 오프로드를 활성화하세요.
호환 가능한 GPU에서 성능 향상을 위해 torch.compile을 활성화하세요 (로딩 시간이 늘어날 수 있음).
재현 가능한 결과를 위해 수동 시드를 사용하세요.
크리에이터 스폰서
최신 업데이트, 뉴스 등을 받으려면 저희 Discord에 참여하세요.
웹사이트 https://designer.shuttleai.com/에서 모델을 사용해보세요.
ShuttleAI를 통해 API로 Shuttle 3.1 Aesthetic를 사용하고 ShuttleAI 문서도 확인하세요.
# Shuttle 3.1 Aesthetic
최신 업데이트, 뉴스 등을 받으려면 저희 Discord에 참여하세요.
## 모델 변형
다양한 하드웨어 성능과 사용 사례에 최적화된 서로 다른 정밀도 및 형식을 제공하는 모델 변형들입니다.
- bfloat16
- fp8
- GGUF (곧 제공 예정)
Shuttle 3.1 Aesthetic는 텍스트 프롬프트로부터 4~6단계 만에 세밀하고 심미적인 이미지를 생성하도록 설계된 텍스트-이미지 AI 모델입니다. 이미지 품질, 타이포그래피, 복잡한 프롬프트 이해 및 자원 효율성에서 향상된 성능을 제공합니다.

웹사이트 https://designer.shuttleai.com/에서 모델을 사용해볼 수 있습니다.
## API를 통한 모델 사용법
ShuttleAI를 통해 Shuttle 3.1 Aesthetic를 API로 사용할 수 있습니다.
## 🧨 Diffusers를 이용한 모델 사용법
diffusers를 설치하거나 업그레이드하세요.
```shell
pip install -U diffusers
```
그 다음 DiffusionPipeline을 사용하여 모델을 실행할 수 있습니다.
```python
import torch
from diffusers import DiffusionPipeline
# 사전 학습된 모델에서 bfloat16 텐서 타입을 사용해 diffusion 파이프라인 로드
pipe = DiffusionPipeline.from_pretrained(
"shuttleai/shuttle-3.1-aesthetic", torch_dtype=torch.bfloat16
).to("cuda")
# 필요 시 모델을 CPU로 오프로드하여 VRAM 절약 가능
# pipe.enable_model_cpu_offload()
# 호환 가능한 GPU에서 torch.compile을 사용해 성능 향상 가능 (로딩 시간 증가할 수 있음)
# pipe.transformer.to(memory_format=torch.channels_last)
# pipe.transformer = torch.compile(pipe.transformer, mode="max-autotune", fullgraph=True)
# 이미지 생성을 위한 프롬프트 설정
prompt = "A cat holding a sign that says hello world"
# diffusion 파이프라인을 이용해 이미지 생성
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=4,
max_sequence_length=256,
# 재현 가능한 결과를 위해 수동 시드 사용 가능
# generator=torch.Generator("cpu").manual_seed(0)
).images[0]
# 생성된 이미지 저장
image.save("shuttle.png")
```
자세한 내용은 diffusers 문서를 참고하세요.
## ComfyUI로 모델 사용하기
Shuttle 3.1 Aesthetic를 로컬 추론환경에서 [ComfyUI](https://github.com/comfyanonymous/ComfyUI)와 함께 사용하려면 이 safetensors 파일을 사용하세요.
## 훈련 세부 정보
Shuttle 3.1 Aesthetic는 Shuttle 3 Diffusion을 기반으로 합니다. 단 4단계 만에 Flux Dev와 유사한 이미지를 생성할 수 있으며 Apache 2 라이선스를 따릅니다. 훈련 과정에서 모델 일부를 부분적으로 디디스틸링(de-distilled) 하였습니다. Schnell 시리즈 모델의 한계를 극복하기 위해 특별한 훈련 방식을 적용하여 디테일과 색상 표현이 개선되었습니다.















