Vanillaware 스타일 PonyXL - v0.1
추천 프롬프트
score_9, score_8_up, score_7_up, <lora:vanillawareStyle:1>, 1girl, solo, looking at viewer, full body, light particles
추천 네거티브 프롬프트
thumbnail,3d
3d, bad anatomy, watermark
추천 매개변수
samplers
steps
cfg
clip skip
resolution
vae
other models
추천 고해상도 매개변수
upscaler
upscale
denoising strength
팁
프롬프트는 [캐릭터 특성] + [스타일] + [표현] + [의상] + [카메라 및 행동] + [배경] 순서로 작성하며 필요에 따라 수정하세요.
이미지가 흐릿하면 부정 프롬프트에 "thumbnail"을 추가하고 가중치를 높여 선명도를 개선하세요.
부정 프롬프트에 '3d'를 추가하면 결과가 향상될 수 있습니다.
'realistic' 또는 'realism' 같은 태그를 추가하면 인물 특성이 강화됩니다.
추천 가중치는 1.0에서 0.6 사이로 조정하여 원하는 캐릭터 외형을 만드세요.
데이터셋 품질을 개선하고 신중한 태깅으로 더 나은 학습 효과를 얻으세요.
품질이 낮은 이미지 태그는 부정 프롬프트에 넣어 생성 시 영향을 줄이세요.
이 모델의 학습과 생성된 이미지는 오로지 학습 목적을 위한 것입니다.
저는 아무것도 하지 않았습니다, 단지 포터일 뿐입니다.
이 모델은 캐릭터 팩에 더 가깝고, 부수적으로 스타일을 제공합니다.
30시간 이상 반복 시도했으며 거의 포기할 뻔했으나 결국 더 균형 잡힌 효과를 달성했습니다. 가장 중요하게도 제 학습 가설이 검증되었습니다. 앞으로 이 경험을 글로 정리할 수도 있습니다.
그러나 손 품질 문제는 여전히 존재합니다.
트리거 단어: vanillastyle
위 이미지에서 예시 프롬프트를 찾을 수 있습니다.
이전 버전 모델의 프롬프트도 대부분 잘 작동했습니다.
제 프롬프트는 기본적으로 [캐릭터 특성] + [스타일] + [표현] + [의상] + [카메라 및 행동] + [배경] 순서로 구성되며 필요에 따라 삭제하거나 수정할 수 있습니다.
특히 흐릿한 상황에서는 부정 프롬프트에 "thumbnail"을 추가하고 가중치를 높여 이미지가 명확해질 때까지 조정해 보세요.
부정 프롬프트에 '3d'를 추가하면 더 나은 결과를 얻을 수 있으며, 'realistic', 'realism' 같은 태그를 추가하면 인물의 특성을 향상시킬 수 있습니다.
추천 가중치: 1.0~0.6, 캐릭터 외형이 원하는 수준에 맞을 때까지 조정하세요.
업스케일 값 추천은 약 1.2~2.0, 노이즈 제거 강도는 0.2입니다.
데이터셋은 주로 George Kamitani의 작품에 중점을 두었습니다.
20240907v0.2
이번 버전에서는 더 많은 이미지를 태그했고, 나머지 이미지는 태그를 제거하고 트리거 단어만 남겨 신중하게 태그된 것들과의 충돌을 방지했습니다. (이 방법이 틀렸을 수도 있습니다.)
학습 과정에서 데이터셋 이미지가 프롬프트로 정확히 표현되지 못한 경우가 많았습니다. 다양한 태그를 바꿔가며 재학습했지만 결과는 같았습니다. 데이터셋 내 해당 이미지들의 반복성이 높지 않아 연속성이 부족했습니다.
마지막으로, 특정 캐릭터의 학습 반복 횟수를 늘려 모델이 충분히 학습하지 못하는 문제를 방지하라는 기사를 읽었습니다.
그래서 데이터셋 내 단일 존재 이미지들을 서브폴더에 넣고 학습 반복 횟수를 2로 설정했으며, 이미 충분히 학습된 이미지는 그대로 두었습니다.
하지만 이러한 불연속 이미지들의 품질 문제가 꽤 있고, 아직 수리하지 않아 학습 반복 횟수를 늘리는 것이 전체 스타일에 영향을 미쳤습니다.
다음 버전 개선을 위해 가장 근본적인 방법은 데이터셋 품질을 향상시키고 캡셔닝 기술을 잘 활용하며, 약간 품질이 낮은 이미지에 동일 태그를 추가하고 모델 실행 시 부정 프롬프트에 모두 넣는 것입니다.
20240715v0.1
이 모델은 v0.1로 간주할 수 있으며, 정상적으로 사용하기는 쉽지 않아 데이터셋 내 이미지를 더 자세히 태그하여 더 좋은 결과를 얻는 것이 최선이라고 생각합니다. 앞으로 천천히 모델 학습을 완성할 계획입니다.
이번 버전 성능은 좋지 않으며, 생성하는 이미지가 종종 혼란스러울 수 있습니다.
100장이 넘는 이미지를 데이터셋으로 모았지만, 수작업 태그가 너무 많아 처음에는 wd1.4로 모두 태그했으나 태그 품질은 좋지 않았습니다 (제 사용법이 부족할 수도 있으며, 의견 환영합니다).
빠른 결과 확인을 위해 데이터셋에서 개인 취향에 맞는 일부 이미지만 수작업 태그를 하였기에, 해당 이미지에 대해 모델 출력 효과가 더 좋습니다.






