추천 프롬프트

score_9,score_8_up,score_7_up

score_8_up,score_7_up,1girl,solo

추천 네거티브 프롬프트

score_4,score_3,score_2,worst quality, bad hands, bad feet

score_4,score_3,score_2,score_1,ugly,bad feet

추천 매개변수

samplers

Euler a

steps

25 - 30

cfg

7

clip skip

2

resolution

776x1072, 848x1072, 952x1192, 696x1272, 960x1248, 792x1248

other models

T-ponynai3-v5 (61cc7615e2), ponynai3-v5-000175 (8dcbf7b584), pony-Tonade (7033f6d4f6)

추천 고해상도 매개변수

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.6 - 2

steps

10

denoising strength

0.3

최고의 결과를 위해 중간 해상도에서 고해상도 수정을 사용하세요.

눈 디테일 향상을 위해 style_3 또는 4를 시도해 보세요.

버전 하이라이트

이번 버전은 학습 자료가 줄었고, v4 실패 경험 후 작은 VRAM 사용 관점에서 아이디어를 시험하기 위해 T-ponynai3에 적합한 네 가지 서로 다른 화풍 Lora를 학습했습니다. 물론 원본 모델도 civitai에 업로드했습니다. 적합성 테스트 후, 이 네 가지 화풍을 첨가제로 T-ponynai3-v5에 학습시켰습니다. 놀랍게도 v5의 선 질감이 크게 개선되어 섬세한 자료를 학습한 결과로 보입니다. 네 가지 화풍 태그는 style_1부터 style_4까지를 사용했으나, 이유는 알 수 없으나 개별 분리되지 않고 미미한 효과로 원본 화풍에 잘 융합되었습니다. 다중 화풍 지원 목표에는 미치지 못했지만 원본 nai3 화풍 질감을 크게 끌어올린 상태입니다. 다음 버전에서는 더 나아질 수도 있을 것 같습니다. (저는 게임을 매우 좋아하는데, 학습할 때마다 게임을 못하는 것이 너무 어렵습니다)

The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it's too difficult for me to play computer games every time I train.)

크리에이터 스폰서

[미인증] Tonade가 T-ponynai3 모델을 창작 중이며, c사이트 ID는 Tonade입니다 | 사랑의 발전 (afdian.net)

여기는 사랑의 발전(afdian) 후원 경로입니다. 모델이 유용하다고 느끼시고 여력이 되신다면 지원 부탁드립니다! 억지로 하지 마시고 여러분의 모든 지원에 감사드립니다. 모델 퀄리티 향상을 계속 탐구하겠습니다!

929721518 본인의 qq 소그룹 번호입니다. tpony 관련해서 모르는 점 있으면 들어와서 물어보세요. 꼭 c사이트 명기해주세요

모델에 이미 vae가 내장되어 있어 추가 vae가 필요 없습니다

The model already has included vae, there is no need to add additional vae

최적의 이미지 생성 전략은 중간 해상도에서 고해상도 수정을 켜는 것이며, 높은 해상도를 바로 사용하는 것이 아닙니다

The best generate strategy is to use high-fix at a moderate resolution, rather than directly using high-resolution direct output

[미인증] Tonade가 T-ponynai3 모델을 창작 중이며, c사이트 ID는 Tonade입니다 | 사랑의 발전 (afdian.net)

여기는 사랑의 발전(afdian) 후원 경로입니다. 모델이 유용하다고 느끼시고 여력이 되신다면 지원 부탁드립니다! 억지로 하지 마시고 여러분의 모든 지원에 감사드립니다. 모델 퀄리티 향상을 계속 탐구하겠습니다!

(모델이 tusi와 tensor 모두에 동시에 존재해야 하므로 tusi에서 사용하는 것이 더 좋습니다. 사용 중 문제가 있으면 저에게 더 알려주세요)

v5 버전에서는 4가지 style이 새로 추가되어 style_1부터 style_4까지를 통해 이미지 세부 조정을 할 수 있습니다 (이론상 그렇지만 실제 효과는 다소 신비롭거나 낮을 수 있습니다)

V5 version has added 4 new styles, which can be used to fine tune the details of the image through style_1 to style_4 (theoretically, this is the case, but the actual effect is more mystical or lower)

본 모델은 ponyv6를 기반으로 학습된 Lora를 완벽 지원하며, ani3, sdxl1.0의 Lora도 어느 정도 호환 가능합니다

This model perfectly supports lora trained with ponyv6 as the base model, and the Lora of ani3 and sdxl1.0 can also be adapted to some extent.

v4.1 기반 이미지 인페인트 테스트 (이 부분은 이전 버전에서 간과되었던 부분입니다)

Image inpaint testing based on v4.1 (this is a previously overlooked part)

pony는 신이며 호환성이 매우 뛰어납니다. 본 모델은 ani, pony의 Lora를 지원합니다

필수 선행 효과 단어는 ponydiffusion과 동일합니다

positive:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)

또는 (score_9,score_8_up,score_7_up)

부정 단어 추가 가능:

negative: (score_4,score_3,score_2,score_1),

일반적인 nai 계열 부정 단어도 추가할 수 있습니다 예:

negative: worst quality, bad hands, bad feet

마음에 드시길 바랍니다 ᕕ(◠ڼ◠)ᕗ nai3와 ponyv6 기반

학습 안내: v1은 94장, v2는 119장, v3는 348장, v3.5는 474장을 사용하였으며, nai3가 생성한 이미지로 Lora를 학습하여 베이스 모델을 미세 조정했습니다. ponyv6가 지원하는 작가 태그를 모두 지원하며, 2개 이상의 작가 태그 사용 시 배경 붕괴가 발생할 수 있습니다. 현재 원신 캐릭터 생성이 가능하며, 기타는 미확인 상태입니다. 본 모델에 대한 테스트는 많지 않으며, nai3 화풍 재현에 감탄했습니다. 베이스 모델은 T-anime-xl, ponyv6, ani3의 융합 모델로 아직 공개되지 않았습니다.

사용한 학습 그래픽 카드는 개인 소유 3090이며, v1부터 v3.5까지 각각 7시간, 12시간, 35시간, 47시간 학습에 사용했습니다.

Training Instructions:nai3가 생성한 94장(v1), 119장(v2), 348장(v3), 474장(v3.5) 사진을 Lora 학습에 활용하여 베이스 모델을 미세 조정하였습니다. ponyv6가 가지고 있는 모든 작가 태그를 지원하지만 nai3에서 추가된 작가 태그는 없습니다. 두 가지 이상의 작가 태그를 사용하면 배경 붕괴가 발생할 수 있습니다. 현재 원신 캐릭터 생성이 가능하나 기타는 미확인 상태이며, 본 모델에 대한 테스트는 많지 않습니다. nai3 화풍 재현에 감탄했습니다. 베이스 모델은 T-anime-xl, ponyv6, ani3 융합 모델로 아직 공개되지 않았습니다.

사용한 훈련 그래픽 카드는 개인 3090이며, v1부터 v3.5까지 차례대로 7시간, 12시간, 35시간, 47시간 학습했습니다.

v1

재미있는 시도

An interesting attempt

v2

v1을 기반으로 학습 집합을 약간 늘리고 약 30시간의 파라미터 시행착오를 거쳤지만, 과적합된 부분이 여전히 있어 더블 배꼽 눈과 흐트러진 머리카락 같은 현상이 있습니다

On the basis of v1, the training set was slightly increased and went through about 30 hours of trial and error, but the trained art style still had some overfitting, such as double navel eyes and messy hair

v3

v3는 v2보다 사지 표현이 좋고 footfocus 이해도가 높아 시각적 임팩트가 큰 발과 어려운 투시 시각을 생성할 수 있습니다. v3의 머리카락 ai 느낌은 v2보다 약하며, v2는 학습 데이터가 너무 적어 머리카락이 약간 과적합 되고 종종 나타나던 쌍 배꼽 눈도 사라졌습니다. 총체적으로 v2보다 세 배 큰 학습 데이터와 더 큰 dim 파라미터 덕분에 화풍이 더욱 자연스럽게 적합되고 긴 프롬프트에서 표현력이 훨씬 강해졌습니다.

The limbs of v3 are better than those of v2. In terms of understanding footfocus, v3 can generate feet with greater visual impact and higher difficulty perspective. The AI feeling of v3's hair is also weaker than that of v2, because v2 has too little training set, so the hair part may be slightly overfitting, and the occasional double navel eyes that appear in v2 are also gone. Overall, three times the size of the v2 training set and a larger dim parameter make the art style fit more natural, and the performance is much stronger than v2 under long prompts.

v3.5

이번 버전에서는 품질 단어에 대한 요구가 엄격하지 않아 pony의 미학 점수 품질 단어를 전혀 사용하지 않고도 이미지를 생성할 수 있습니다. 테스트 중 때때로 무의미한 색 블록이 생성될 수 있으나, 미학 점수 품질 단어를 1.5 버전에서 자주 사용하는 품질 단어(예: score_1, score_2를 worst quality로 대체)로 바꾸면 해결됩니다.이번 버전에는 약 150장의 학습 세트를 추가하여 화풍을 균형있게 충실하게 만들었고 학습 곡선 초기 기울기를 줄여 과적합을 줄였으며, 더 많은 lora와 참신한 프롬프트에 적응할 수 있습니다. 전체적으로 이번 버전은 v3보다 자유로운 버전이며 특히 남성 묘사에서 v3보다 훨씬 우수하고 특정 프롬프트 하에서 색감과 화풍이 지나치게 선명하거나 번들거리지 않습니다.

In this version, the requirements for quality words are not so strict, you can completely not to use the quality words of pony's aesthetic score to plot the picture, and occasionally there will be a situation where the picture generates meaningless color blocks in the test, you only need to replace the quality words of the aesthetic score with 1.5 commonly used quality words, such as score_1, score_2 replace it with worst quality. In this version, I added about 150 more training sets to balance and enrich the art style, and reduced the initial slope of the learning curve, which makes this model less overfitted and can be adapted to more lora and whimsical prompts. Overall, this version is a freer version than the v3 version, and this version is much stronger than the v3 version, and the colors and style of painting under some hints are not so bright and greasy.

v4

이번 버전은 798장의 이미지를 학습 자료로 사용했으며 3090 그래픽 카드로 90시간 학습했습니다. v3.5에 비해 일부 프롬프트에서 구도와 특정 부위 묘사가 더 정확해져 손가락 잔상 및 일부 신체 부위 중첩 문제가 개선되었습니다. 프롬프트는 중간 길이와 약간 짧은 길이를 주로 학습 목표로 삼았으며, 긴 프롬프트를 써야만 좋은 이미지를 생성하는 것을 피하려 했습니다. pony 미학 점수 품질 프롬프트를 제거한 결과, 이미지 품질이 v3.5보다 크게 향상되어 출력 품질이 입체적이기보다 평면적이고 고전적인 애니메이션 화풍에 더 가깝습니다. ponyv6 미세조정에 사용된 이미지 수 테스트가 거의 끝나가며, 다음 단계는 프롬프트 학습 라벨을 시작으로 pony 제한된 단일 학습 자료 내에 더 조정 가능한 프롬프트(예: 미학 점수 추가)를 넣어보는 것입니다. 앞으로 장면 학습 자료 및 더 많은 발 관련 학습 자료도 계속 추가할 예정입니다(현재 v4의 발 학습 자료가 다소 부족한 편임).

This version used 798 images as training materials and trained for 90 hours using a 3090 graphics card. This version has a more accurate composition and depiction of certain parts in certain prompts compared to v3.5, such as ghosting of fingers and overlapping of some body parts. In terms of prompts, my main training goal is to use medium and slightly shorter prompts, as nobody likes to write a long string of prompts to generate high-quality images, right? After removing the quality prompt of Pony's aesthetic score, the image quality has been significantly improved compared to v3.5, and the resulting quality tends to be more flat rather than three-dimensional, closer to the classic anime style. The testing of the fine-tuning effect of Ponyv6 on the number of images is nearing completion. The next step is to start with the training labels of prompts and try to add more adjustable prompts to Pony's limited number of single training materials (such as adding aesthetic scores, the current training logic still uses mainstream quality words to cover Pony's aesthetic score quality words), and continue to add suitable new training materials, such as scene training materials and more foot training materials (v4's foot training materials seem to be a bit scarce).

v4.1

사용자 여러분께 짧은 시간 내에 새로운 버전을 출시해 죄송합니다. 이로 인해 컴퓨터 메모리와 네트워크 속도가 크게 요구됩니다. O_O

Firstly, I would like to apologize to all users for the release of a new version in such a short period of time, which greatly tests the computer's memory and network speed. O_O

이번 버전은 v4의 사지 조정 버전으로, v4의 사지 효과가 통제하기 어렵고 손 완성도도 테스트 결과 기대에 미치지 못해, 친구 무묘묘묘와 함께 v4를 일부 조정 및 개선하여 v4.1의 사지가 기대에 부합하도록 만들었습니다. 동일한 파라미터에서 v4.1이 v4보다 더 개선된 결과를 명확히 보여주기 위해 여러 xy 그래프를 공개할 예정입니다.

This new version is based on the limb debugging version of v4. Due to the difficulty in controlling the limb effects of v4, the perfection rate of the hands did not meet my testing expectations in the past few days. So my friend 木猫猫猫 and I made some adjustments and improvements to v4, which ultimately made the limbs of v4.1 meet my expectations. I will release several xy graphs to clearly show the improvement of v4.1 compared to v4 under the same parameters.

v5

이번 버전은 학습 자료가 줄었고, v4 실패 경험 후 작은 VRAM 사용 관점에서 아이디어를 시험하기 위해 T-ponynai3에 적합한 네 가지 서로 다른 화풍 Lora를 학습했습니다. 물론 원본 모델도 civitai에 업로드했습니다. 적합성 테스트 후, 이 네 가지 화풍을 첨가제로 T-ponynai3-v5에 학습시켰습니다. 놀랍게도 v5의 선 질감이 크게 개선되어 섬세한 자료를 학습한 결과로 보입니다. 네 가지 화풍 태그는 style_1부터 style_4까지를 사용했으나, 이유는 알 수 없으나 개별 분리되지 않고 미미한 효과로 원본 화풍에 잘 융합되었습니다. 다중 화풍 지원 목표에는 미치지 못했지만 원본 nai3 화풍 질감을 크게 끌어올린 상태입니다. 다음 버전에서는 더 나아질 수도 있을 것 같습니다. (저는 게임을 매우 좋아하는데, 학습할 때마다 게임을 못하는 것이 너무 어렵습니다)

The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it's too difficult for me to play computer games every time I train.)

v5 버전과 관련된 몇 가지 문제를 요약합니다.

1. lora 호환성, 사지 및 흐린 눈 문제. lora 호환성은 이번 훈련에서 최종 가중치가 다소 너무 높게 설정되어 과적합 발생 가능성이 있습니다. 이 최적화 버전은 가중치를 낮춘 버전으로, 사지 붕괴율과 일부 lora 호환성이 개선되었습니다. 이를 참고하기 위해 v4.1으로 학습된 화풍 lora 비교 이미지를 몇 장 제공했습니다. 눈이 흐린 문제는 style_1을 학습한 결과로, 원본 자료의 눈이 흐릿했으며 style_3 또는 4를 사용하여 개선할 수 있습니다.

2. 체적광 노출 문제. 테스트 중 발생하지 않았고, noise offset 훈련 파라미터 사용으로 인해 빛 관련 프롬프트 단어에 대한 모델 민감도가 증가하여 동일 가중치 빛 프롬프트 단어 사용 시 결과가 더 밝게 출력된 것으로 보입니다. 괄호와 숫자로 가중치를 올리지 않는 것을 추천하며, sdxl의 프롬프트 민감도 때문에 동일 프롬프트 단어를 반복해 사용하는 것이 극단적 결과를 방지할 수 있습니다. 이 파라미터는 소수의 프롬프트 단어에서 노란색 결과 생성 문제를 해결하기 위한 것으로, 이를 참고한 비교 이미지를 제공했습니다.

3. 모델 복잡도 감소 문제. 이론과 실험 양쪽 모두에서의 결과로 v5는 이전 버전보다 더 깔끔하고 다변화된 모델이며, 특정 프롬프트 구현 시 보다 정확한 표현력을 가질 것으로 기대됩니다. 비교용 이미지도 함께 제공했습니다. 이번 학습 집합은 지나치게 복잡한 자료를 사용하지 않았으며, 지나치게 복잡한 이미지는 과적합으로 이어져 세부 묘사 손실을 초래한다고 판단했습니다.

목적: 이전 버전과 상당히 차별화된 모델을 얻고자 했으며, 거의 동일한 모델을 다시 출시하는 것을 피하고 싶었습니다. 이번 피드백은 좋은 시행착오 기회이며 혼자 시도하는 데 드는 비용이 크기 때문입니다. 다음 버전에서는 다른 화풍의 자료량을 늘려 서로 다른 화풍이 잘 융합 및 분리되고, 특정 프롬프트로 화풍 전환이 가능하도록 새로운 훈련 기법을 시도해 볼 예정입니다. 모든 피드백에 감사드립니다!

Summarize some issues regarding the v5 version.

1, Lora compatibility and issues with limbs and blurred eyes. Lora compatibility is that I used too much final weight for this training, and in some cases, overfitting may occur. This optimized version is the one that reduces the corresponding weight, and the limb collapse rate and compatibility with some Loras should be better. I have run several comparison charts of Loras trained with v4.1 for reference. The problem of blurred eyes should be the reason why I trained style_1. The eyes in the original material used are blurry, and can be improved by using style_3 or 4.

2. Exposure issues with volume light. I did not encounter this issue during testing, and the reason for it should be that I used the noise offset training parameter to increase the sensitivity of the model to light related prompt words, resulting in brighter results when the same weight of light prompt words were used. I suggest trying not to use parentheses and numbers to increase the weight. Due to the sensitivity of sdxl to prompt words, you can try repeating the same prompt words multiple times to avoid extreme results. At the same time, using this parameter is to fix the problem of generating yellow results under a small number of prompt words. I have run several comparison graphs for reference.

3. The problem of reduced model complexity. In theory and in practice. V5 should be a cleaner and more diverse model than the previous version, and with the help of some prompts, it should be able to achieve more accurate performance. Similarly, I ran several comparison charts for comparison. This training set did not use overly complex materials because I believe that overly complex images tend to overfit the results, which inevitably leads to a certain degree of detail loss.

Purpose: I hope to obtain a model that is significantly different from the previous version, rather than releasing a model that is almost identical to the previous version. This feedback from everyone is a great opportunity for trial and error, and I really don't have any trial and error costs on my own. In the next version, I will try to increase the amount of materials for different art styles, so that the art styles of different materials can be well integrated and separated. Using specific prompts to switch art styles may require some new training techniques. Thank you for your feedback!

이전
Tponynai3 - v51weight 최적화
다음
CyberRealistic Pony - v40

모델 세부사항

모델 유형

Checkpoint

기본 모델

Pony

모델 버전

v5

모델 해시

61cc7615e2

제작자

토론

댓글을 남기려면 log in하세요.