모델/Animagine XL V3.1 - v3.1

Animagine XL V3.1 - v3.1

김지훈 (Kim Ji-hoon)

7/21/2025

1:46:23 PM

| Discussion|

팁

구조화된 프롬프트 템플릿 사용: '1girl/1boy, 캐릭터 이름, 어느 시리즈에서 왔는지, 나머지는 어떤 순서로든'.

품질, 등급, 연도 및 미적 특수 태그를 사용해 생성 결과를 더 정확하게 조정하세요.

이 모델은 자연어 프롬프트보다는 Danbooru 스타일 태그에 최적화되어 있습니다.

더 나은 품질을 위해 CFG Scale을 약 5-7로 낮게 유지하고, 샘플링 스텝은 30 이하를 권장합니다.

미적 태그는 애니메이션 데이터로 훈련된 전문 ViT 이미지 분류 모델에서 파생되었습니다.

크리에이터 스폰서

Cagliostro Lab 서버 디스코드에 참여하세요: https://discord.gg/cqh9tZgbGc

후원이나 커피 구입을 원하시면 여기에서 기부할 수 있습니다.

정말 감사합니다 ^_^

Animagine XL 3.1 은 Animagine XL V3 시리즈의 업데이트로, 이전 버전인 Animagine XL 3.0을 개선했습니다. 이 오픈 소스 애니메이션 테마 텍스트-투-이미지 모델은 고품질의 애니메이션 스타일 이미지를 생성하기 위해 향상되었습니다. 잘 알려진 애니메이션 시리즈의 다양한 캐릭터, 최적화된 데이터셋, 그리고 보다 나은 이미지 생성용 새로운 미적 태그를 포함합니다. Stable Diffusion XL 기반으로 제작된 Animagine XL 3.1은 애니메이션 팬, 아티스트, 콘텐츠 크리에이터에게 정확하고 세밀한 애니메이션 캐릭터 표현을 제공하는 귀중한 자원이 되는 것을 목표로 합니다.

모델 세부정보

개발자: Cagliostro Research Lab
협력: SeaArt.ai
모델 유형: 확산 기반 텍스트-투-이미지 생성 모델
모델 설명: Animagine XL 3.1은 텍스트 프롬프트에서 고품질 애니메이션 이미지를 생성합니다. 향상된 손 해부학, 개선된 개념 이해, 그리고 고급 프롬프트 해석 기능을 자랑합니다.
라이선스: Fair AI Public License 1.0-SD
미세 조정 기반: Animagine XL 3.0

사용 지침

태그 순서

최적의 결과를 위해, 다음과 같은 구조화된 프롬프트 템플릿을 따르는 것이 권장됩니다:

1girl/1boy, 캐릭터 이름, 어느 시리즈에서 온 캐릭터인지, 나머지는 어떤 순서로든.

특수 태그

Animagine XL 3.1은 품질, 등급, 생성 연도, 미적 측면을 조정하기 위해 특수 태그를 사용합니다. 이 태그 없이도 이미지를 생성할 수 있지만, 사용 시 더 우수한 결과를 얻을 수 있습니다.

품질 수정자

품질 태그는 이제 점수와 게시물 등급을 모두 고려하여 균형 잡힌 품질 분포를 보장합니다. 'high quality'를 'great quality'로 변경하는 등 레이블을 더 명확하게 다듬었습니다.


품질 수정자	점수 기준
masterpiece	        > 95%
best quality	        > 85% & ≤ 95%
great quality	        > 75% & ≤ 85%
good quality	        > 50% & ≤ 75%
normal quality	        > 25% & ≤ 50%
low quality	        > 10% & ≤ 25%
worst quality	        ≤ 10%

등급 수정자

간단명료함을 위해 등급 태그도 정리했습니다. 전 세계적으로 적용 가능한 규칙 수립을 목표로 하여, 예를 들어 'rating: general'은 'general'로, 'rating: sensitive'는 'sensitive'로 간략화되었습니다.


등급 수정자	    등급 기준
safe	            일반
sensitive	    민감
nsfw	            의심스러움
explicit, nsfw	    노골적

연도 수정자

특정 최신 또는 빈티지 애니메이션 아트 스타일에 더 정확히 접근할 수 있도록 연도 범위를 재정의했습니다. 이 업데이트는 현재와 과거 시대에 관련된 범위 단순화에 중점을 둡니다.


연도 태그	연도 범위
newest	        2021년부터 2024년까지
recent	        2018년부터 2020년까지
mid	        2015년부터 2017년까지
early	        2011년부터 2014년까지
oldest	        2005년부터 2010년까지

미적 태그

시각적 매력에 따른 콘텐츠 분류를 정교화하기 위해 미적 태그 시스템을 강화했습니다. 이 태그들은 애니메이션 데이터로 훈련된 전문 ViT(Vision Transformer) 이미지 분류 모델에서 파생되었습니다. 이를 위해, 훈련 전 콘텐츠의 미적 가치를 평가하는 shadowlilac/aesthetic-shadow-v2 모델을 사용했습니다. 이로써 각 콘텐츠가 관련성과 정확성뿐 아니라 시각적 매력도 갖추도록 보장합니다.


미적 태그	       점수 범위
very aesthetic	       > 0.71
aesthetic	       > 0.45 & < 0.71
displeasing	       > 0.27 & < 0.45
very displeasing       ≤ 0.27

권장 설정

높은 미적 이미지를 생성하도록 모델을 유도하려면 다음과 같은 부정 프롬프트를 사용하세요:

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

더 높은 품질의 결과를 원할 경우, 프롬프트 앞에 다음 내용을 추가하세요:

masterpiece, best quality, very aesthetic, absurdres

CFG Scale은 약 5-7 사이로 낮게 유지하고, 샘플링 스텝은 30 이하로 하며, Euler Ancestral (Euler a) 샘플러를 사용하는 것이 권장됩니다.

다중 비율 해상도

이 모델은 다음 해상도의 이미지 생성을 지원합니다:

해상도	비율
1024 x 1024	1:1 정사각형
1152 x 896	9:7
896 x 1152	7:9
1216 x 832	19:13
832 x 1216	13:19
1344 x 768	7:4 가로
768 x 1344	4:7 세로
1536 x 640	12:5 가로
640 x 1536	5:12 세로

감사의 글

Animagine XL 3.1의 개발 및 출시에는 아래 개인 및 단체의 귀중한 기여와 지원이 없었다면 불가능했습니다:

SeaArt.ai: 협력 파트너이자 후원사.
Shadow Lilac: 미적 분류 모델 aesthetic-shadow-v2 제공.
Derrian Distro: LoRA Easy Training Scripts에서 채택한 맞춤 학습률 스케줄러 제공.
Kohya SS: 종합적인 학습 스크립트 제공.
Cagliostrolab 공동작업자: 모델 훈련, 프로젝트 관리, 데이터 큐레이션에 헌신.
초기 테스터: 귀중한 피드백과 품질 보증 노력 제공.
NovelAI: 미적 태그 접근법에 있어 혁신적인 아이디어로 영감 제공.

여러분의 지원과 전문성 덕분에 애니메이션 스타일 이미지 생성의 한계를 확장할 수 있었습니다. 감사합니다.

제한 사항

Animagine XL 3.1은 애니메이션 스타일 이미지 생성에 있어 중요한 발전을 이루었지만, 다음과 같은 제한 사항을 인지해야 합니다:

애니메이션 전용: 이 모델은 애니메이션 스타일 이미지를 생성하도록 설계되었으며, 현실적인 사진 생성에는 적합하지 않습니다.
프롬프트 복잡성: 짧거나 단순한 프롬프트에서 고품질 결과를 기대하는 사용자에게는 적합하지 않을 수 있습니다. 모델 훈련은 미적 세련보다는 개념 이해에 중점을 두었으므로, 원하는 출력을 얻기 위해 더 상세하고 구체적인 프롬프트가 필요할 수 있습니다.
프롬프트 형식: Animagine XL 3.1은 자연어 프롬프트보다는 Danbooru 스타일 태그를 최적화했습니다. 최상의 결과를 위해 적절한 태그와 구문을 사용해 프롬프트를 작성하는 것이 좋습니다.
해부학 및 손 묘사: 해부학 및 손 묘사 향상이 이루어졌음에도 불구하고, 일부 경우에는 최적보다 떨어지는 결과가 나올 수 있습니다.
데이터셋 크기: Animagine XL 3.1 훈련에 사용된 데이터셋은 약 87만 개의 이미지로 구성됩니다. 이전 버전 데이터셋(120만 개)과 합하면 총 약 210만 개 이미지가 됩니다. 상당한 규모임에도 불구하고, '궁극적인' 애니메이션 모델로서는 범위가 제한적일 수 있습니다.
NSFW 콘텐츠: Animagine XL 3.1은 보다 균형 잡힌 NSFW 콘텐츠 생성을 목표로 하지만, 명시적으로 프롬프트하지 않아도 NSFW 결과가 나올 수 있음을 염두에 두어야 합니다.

이러한 제한 사항을 명확히 함으로써 사용자에게 투명성을 제공하고 현실적인 기대치를 설정하는 것을 목표로 합니다. 제한에도 불구하고 이 모델은 애니메이션 스타일 이미지 생성에서 중요한 진전을 이루었으며, 아티스트, 디자이너, 애호가들에게 강력한 도구를 제공합니다.

라이선스

Animagine XL 3.1은 Animagine XL 3.0을 기반으로 하며, Fair AI Public License 1.0-SD 라이선스 하에 배포됩니다. 이 라이선스는 Stable Diffusion 모델 라이선스와 호환됩니다. 주요 내용:

수정 공유: Animagine XL 3.1을 수정하는 경우, 변경사항과 원본 라이선스를 모두 공유해야 합니다.
소스 코드 접근성: 수정된 버전이 네트워크를 통해 접근 가능할 경우, 다른 이들이 소스 코드를 받을 수 있는 방법(예: 다운로드 링크)을 제공해야 합니다. 이는 파생 모델에도 적용됩니다.
배포 조건: 모든 배포는 본 라이선스 또는 동등한 규칙을 가진 다른 라이선스 하에 이루어져야 합니다.
준수: 비준수 시 30일 내에 문제를 해결해야 하며, 미준수 시 라이선스가 종료될 수 있습니다. 이는 투명성과 오픈 소스 가치 준수를 강조합니다.

이 라이선스 선택은 Animagine XL 3.1을 개방적이고 수정 가능하게 유지하며, 오픈 소스 커뮤니티 정신에 부합합니다. 기여자와 사용자 모두를 보호하고 협력적이고 윤리적인 오픈 소스 커뮤니티를 장려합니다. 이를 통해 모델은 공동체의 기여를 받으며, 오픈 소스 개발 자유도 존중받습니다.

마지막으로 Cagliostro Lab 서버는 공개되어 있습니다 https://discord.gg/cqh9tZgbGc

언제든지 저희 디스코드 서버에 참가하세요.
후원이나 커피 구입을 원하시면 다음에서 기부할 수 있습니다: 여기

정말 감사합니다 ^_^