모델/Vanillaware 스타일 PonyXL - v0.1

Vanillaware 스타일 PonyXL - v0.1

|
10/17/2025
|
1:09:42 AM
| Discussion|
0
긴 붉은 머리를 가진 전신 판타지 마법사, 검은 코르셋과 큰 마녀 모자를 착용하고 밤하늘 아래 목재 지팡이를 든 모습
초록 드레스를 입고 뾰족한 귀와 반투명 초록 날개를 가진 금발 요정이 밤에 빛나는 파란 나비들과 빛 입자들에 둘러싸여 있습니다.
짧은 브라운 헤어와 갈색 눈을 가진 이나바 미유키 초상화, 회색 탱크탑을 입고 흰색 배경 앞에서 이마에 손을 얹은 포즈.
검은 배경에 검은 코르셋과 레이스 칼라를 착용하고 파란 깃털로 장식된 차분한 흰 머리 갈색 눈의 여성 초상화.
검은 배경 앞에서 빛나는 파란 깃털과 빛 입자로 둘러싸인 흰 머리의 땋은 머리 스타일의 코르셋을 입고 가슴골이 드러난 흑색 코르셋을 착용한 포토리얼리스틱 초상화.

추천 프롬프트

score_9, score_8_up, score_7_up, <lora:vanillawareStyle:1>, 1girl, solo, looking at viewer, full body, light particles

추천 네거티브 프롬프트

thumbnail,3d

3d, bad anatomy, watermark

추천 매개변수

samplers

Euler a

steps

20

cfg

7

clip skip

2

resolution

768x1344

vae

sdxl_vae.safetensors

other models

vanillawareStyle (272b477439ee), ponyDiffusionFor_v10 (7ad8ce957e)

추천 고해상도 매개변수

upscaler

4xUltrasharp_4xUltrasharpV10

upscale

1.2 - 2

denoising strength

0.2

프롬프트는 [캐릭터 특성] + [스타일] + [표현] + [의상] + [카메라 및 행동] + [배경] 순서로 작성하며 필요에 따라 수정하세요.

이미지가 흐릿하면 부정 프롬프트에 "thumbnail"을 추가하고 가중치를 높여 선명도를 개선하세요.

부정 프롬프트에 '3d'를 추가하면 결과가 향상될 수 있습니다.

'realistic' 또는 'realism' 같은 태그를 추가하면 인물 특성이 강화됩니다.

추천 가중치는 1.0에서 0.6 사이로 조정하여 원하는 캐릭터 외형을 만드세요.

데이터셋 품질을 개선하고 신중한 태깅으로 더 나은 학습 효과를 얻으세요.

품질이 낮은 이미지 태그는 부정 프롬프트에 넣어 생성 시 영향을 줄이세요.

이 모델의 학습과 생성된 이미지는 오로지 학습 목적을 위한 것입니다.

저는 아무것도 하지 않았습니다, 단지 포터일 뿐입니다.

이 모델은 캐릭터 팩에 더 가깝고, 부수적으로 스타일을 제공합니다.

30시간 이상 반복 시도했으며 거의 포기할 뻔했으나 결국 더 균형 잡힌 효과를 달성했습니다. 가장 중요하게도 제 학습 가설이 검증되었습니다. 앞으로 이 경험을 글로 정리할 수도 있습니다.

그러나 손 품질 문제는 여전히 존재합니다.

트리거 단어: vanillastyle

위 이미지에서 예시 프롬프트를 찾을 수 있습니다.

이전 버전 모델의 프롬프트도 대부분 잘 작동했습니다.

제 프롬프트는 기본적으로 [캐릭터 특성] + [스타일] + [표현] + [의상] + [카메라 및 행동] + [배경] 순서로 구성되며 필요에 따라 삭제하거나 수정할 수 있습니다.

특히 흐릿한 상황에서는 부정 프롬프트에 "thumbnail"을 추가하고 가중치를 높여 이미지가 명확해질 때까지 조정해 보세요.

부정 프롬프트에 '3d'를 추가하면 더 나은 결과를 얻을 수 있으며, 'realistic', 'realism' 같은 태그를 추가하면 인물의 특성을 향상시킬 수 있습니다.

추천 가중치: 1.0~0.6, 캐릭터 외형이 원하는 수준에 맞을 때까지 조정하세요.

업스케일 값 추천은 약 1.2~2.0, 노이즈 제거 강도는 0.2입니다.

데이터셋은 주로 George Kamitani의 작품에 중점을 두었습니다.

20240907v0.2

이번 버전에서는 더 많은 이미지를 태그했고, 나머지 이미지는 태그를 제거하고 트리거 단어만 남겨 신중하게 태그된 것들과의 충돌을 방지했습니다. (이 방법이 틀렸을 수도 있습니다.)

학습 과정에서 데이터셋 이미지가 프롬프트로 정확히 표현되지 못한 경우가 많았습니다. 다양한 태그를 바꿔가며 재학습했지만 결과는 같았습니다. 데이터셋 내 해당 이미지들의 반복성이 높지 않아 연속성이 부족했습니다.

마지막으로, 특정 캐릭터의 학습 반복 횟수를 늘려 모델이 충분히 학습하지 못하는 문제를 방지하라는 기사를 읽었습니다.

그래서 데이터셋 내 단일 존재 이미지들을 서브폴더에 넣고 학습 반복 횟수를 2로 설정했으며, 이미 충분히 학습된 이미지는 그대로 두었습니다.

하지만 이러한 불연속 이미지들의 품질 문제가 꽤 있고, 아직 수리하지 않아 학습 반복 횟수를 늘리는 것이 전체 스타일에 영향을 미쳤습니다.

다음 버전 개선을 위해 가장 근본적인 방법은 데이터셋 품질을 향상시키고 캡셔닝 기술을 잘 활용하며, 약간 품질이 낮은 이미지에 동일 태그를 추가하고 모델 실행 시 부정 프롬프트에 모두 넣는 것입니다.

20240715v0.1

이 모델은 v0.1로 간주할 수 있으며, 정상적으로 사용하기는 쉽지 않아 데이터셋 내 이미지를 더 자세히 태그하여 더 좋은 결과를 얻는 것이 최선이라고 생각합니다. 앞으로 천천히 모델 학습을 완성할 계획입니다.

이번 버전 성능은 좋지 않으며, 생성하는 이미지가 종종 혼란스러울 수 있습니다.

100장이 넘는 이미지를 데이터셋으로 모았지만, 수작업 태그가 너무 많아 처음에는 wd1.4로 모두 태그했으나 태그 품질은 좋지 않았습니다 (제 사용법이 부족할 수도 있으며, 의견 환영합니다).

빠른 결과 확인을 위해 데이터셋에서 개인 취향에 맞는 일부 이미지만 수작업 태그를 하였기에, 해당 이미지에 대해 모델 출력 효과가 더 좋습니다.

이전
Breakdancing PONY XL (Concept) - v1.0
다음
Goose Ambush - Illustrious - v1.0

모델 세부사항

모델 유형

LORA

기본 모델

Pony

모델 버전

v0.1

모델 해시

33ee0b8061

제작자

토론

댓글을 남기려면 log in하세요.

Vanillaware 스타일 PonyXL - v0.1 제작 이미지

스타일 이미지

vanillaware 이미지