모델/Shuttle 3.1 Aesthetic - v1.0

Shuttle 3.1 Aesthetic - v1.0

김지훈 (Kim Ji-hoon)

9/8/2025

1:12:59 PM

| Discussion|

팁

효율성을 위해 bfloat16 텐서 타입을 사용하세요.

필요 시 VRAM 절약을 위해 모델 CPU 오프로드를 활성화하세요.

호환 가능한 GPU에서 성능 향상을 위해 torch.compile을 활성화하세요 (로딩 시간이 늘어날 수 있음).

재현 가능한 결과를 위해 수동 시드를 사용하세요.

크리에이터 스폰서

최신 업데이트, 뉴스 등을 받으려면 저희 Discord에 참여하세요.

웹사이트 https://designer.shuttleai.com/에서 모델을 사용해보세요.

ShuttleAI를 통해 API로 Shuttle 3.1 Aesthetic를 사용하고 ShuttleAI 문서도 확인하세요.

# Shuttle 3.1 Aesthetic

최신 업데이트, 뉴스 등을 받으려면 저희 Discord에 참여하세요.

## 모델 변형

다양한 하드웨어 성능과 사용 사례에 최적화된 서로 다른 정밀도 및 형식을 제공하는 모델 변형들입니다.

- bfloat16

- fp8

- GGUF (곧 제공 예정)

Shuttle 3.1 Aesthetic는 텍스트 프롬프트로부터 4~6단계 만에 세밀하고 심미적인 이미지를 생성하도록 설계된 텍스트-이미지 AI 모델입니다. 이미지 품질, 타이포그래피, 복잡한 프롬프트 이해 및 자원 효율성에서 향상된 성능을 제공합니다.

![image/png](https://huggingface.co/shuttleai/shuttle-3.1-aesthetic/resolve/main/demo.png)

웹사이트 https://designer.shuttleai.com/에서 모델을 사용해볼 수 있습니다.

## API를 통한 모델 사용법

ShuttleAI를 통해 Shuttle 3.1 Aesthetic를 API로 사용할 수 있습니다.

- ShuttleAI

- ShuttleAI 문서

## 🧨 Diffusers를 이용한 모델 사용법

diffusers를 설치하거나 업그레이드하세요.

```shell

pip install -U diffusers

```

그 다음 DiffusionPipeline을 사용하여 모델을 실행할 수 있습니다.

```python

import torch

from diffusers import DiffusionPipeline

# 사전 학습된 모델에서 bfloat16 텐서 타입을 사용해 diffusion 파이프라인 로드

pipe = DiffusionPipeline.from_pretrained(

"shuttleai/shuttle-3.1-aesthetic", torch_dtype=torch.bfloat16

).to("cuda")

# 필요 시 모델을 CPU로 오프로드하여 VRAM 절약 가능

# pipe.enable_model_cpu_offload()

# 호환 가능한 GPU에서 torch.compile을 사용해 성능 향상 가능 (로딩 시간 증가할 수 있음)

# pipe.transformer.to(memory_format=torch.channels_last)

# pipe.transformer = torch.compile(pipe.transformer, mode="max-autotune", fullgraph=True)

# 이미지 생성을 위한 프롬프트 설정

prompt = "A cat holding a sign that says hello world"

# diffusion 파이프라인을 이용해 이미지 생성

image = pipe(

prompt,

height=1024,

width=1024,

guidance_scale=3.5,

num_inference_steps=4,

max_sequence_length=256,

# 재현 가능한 결과를 위해 수동 시드 사용 가능

# generator=torch.Generator("cpu").manual_seed(0)

).images[0]

# 생성된 이미지 저장

image.save("shuttle.png")

```

자세한 내용은 diffusers 문서를 참고하세요.

## ComfyUI로 모델 사용하기

Shuttle 3.1 Aesthetic를 로컬 추론환경에서 [ComfyUI](https://github.com/comfyanonymous/ComfyUI)와 함께 사용하려면 이 safetensors 파일을 사용하세요.

## 훈련 세부 정보

Shuttle 3.1 Aesthetic는 Shuttle 3 Diffusion을 기반으로 합니다. 단 4단계 만에 Flux Dev와 유사한 이미지를 생성할 수 있으며 Apache 2 라이선스를 따릅니다. 훈련 과정에서 모델 일부를 부분적으로 디디스틸링(de-distilled) 하였습니다. Schnell 시리즈 모델의 한계를 극복하기 위해 특별한 훈련 방식을 적용하여 디테일과 색상 표현이 개선되었습니다.