모델/Tponynai3 - v51weight 최적화

Tponynai3 - v51weight 최적화

추천 프롬프트

score_9,score_8_up,score_7_up

score_8_up,score_7_up,1girl

추천 네거티브 프롬프트

score_4,score_3,score_2,worst quality, bad hands, bad feet

score_3,score_2,ugly

추천 매개변수

samplers

Euler a

steps

25

cfg

7

clip skip

2

resolution

776x1072, 848x1072, 864x1192, 616x936, 696x1272, 712x1064

other models

T-ponynai3-v5.1 (ac17f32d24), T-ponynai3-v4.1 (0b3046dd73), T-ponynai3-v5 (61cc7615e2), tpony-style-v2 (e9eed2af18)

추천 고해상도 매개변수

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.5 - 2

steps

10

denoising strength

0.3

최적의 결과를 위해 중간 해상도에서 고정 사용을 권장합니다.

눈 디테일 개선을 위해 style_3 또는 4 사용을 시도해 보세요.

버전 하이라이트

v5 버전 관련 몇 가지 문제 요약입니다.

1. Lora 호환성과 사지 및 흐릿한 눈 문제. 이 훈련에서 최종 가중치를 너무 높게 사용하여 일부 경우 과적합이 발생할 수 있습니다. 이 최적화 버전은 해당 가중치를 낮춘 버전으로, 사지 붕괴율과 일부 Lora와의 호환성이 개선되었습니다. 참고용으로 v4.1 기반 화풍 Lora 비교 이미지를 몇 장 만들었습니다. 흐릿한 눈 문제는 style_1 훈련 때문으로, 원본 소재의 눈이 흐릿하여 style_3 또는 4를 사용해 개선할 수 있습니다.

2. 체적광(볼륨 라이트) 노출 문제. 테스트 중 문제를 경험하지 못했으며, noise offset 훈련 파라미터를 사용해 모델의 빛 관련 프롬프트 민감도를 높였기 때문일 가능성이 큽니다. 동일 가중치 빛 프롬프트가 더 밝은 결과를 내므로, 괄호나 숫자로 가중치 상승을 시도하지 말고 동일 프롬프트 단어를 여러 번 반복하는 것을 권장합니다. 이 파라미터 사용은 적은 프롬프트 단어에서 생기는 노란색 왜곡 문제를 해결하기 위함이며, 비교 이미지도 준비했습니다.

3. 모델 복잡도 감소 문제. 이론과 실험 모두 v5는 이전 버전보다 더 깨끗하고 다변화된 모델이며, 일부 프롬프트 활용 시 더 정확한 표현력을 기대할 수 있습니다. 비교 이미지도 준비했습니다. 이번 훈련셋은 너무 복잡한 소재를 배제했는데, 이는 과적합 경향을 줄여 세부 표현 손실을 막기 위함입니다.

목적: 전에 비해 충분히 다른 모델을 얻고자 하며, 거의 동일한 모델을 내놓지 않으려 합니다. 여러분의 피드백은 훌륭한 시행착오 기회이며, 혼자서는 시행착오 비용이 큽니다. 다음 버전에서는 다양한 화풍 소재 양을 늘려 여러 화풍을 잘 융합하고 분리하며, 특정 프롬프트로 화풍을 전환할 수 있게 새로운 훈련 기술을 시도할 것입니다. 응원에 감사합니다!

Summarize some issues regarding the v5 version.

1, Lora compatibility and issues with limbs and blurred eyes. Lora compatibility is that I used too much final weight for this training, and in some cases, overfitting may occur. This optimized version is the one that reduces the corresponding weight, and the limb collapse rate and compatibility with some Loras should be better. I have run several comparison charts of Loras trained with v4.1 for reference. The problem of blurred eyes should be the reason why I trained style_1. The eyes in the original material used are blurry, and can be improved by using style_3 or 4.

2. Exposure issues with volume light. I did not encounter this issue during testing, and the reason for it should be that I used the noise offset training parameter to increase the sensitivity of the model to light related prompt words, resulting in brighter results when the same weight of light prompt words were used. I suggest trying not to use parentheses and numbers to increase the weight. Due to the sensitivity of sdxl to prompt words, you can try repeating the same prompt words multiple times to avoid extreme results. At the same time, using this parameter is to fix the problem of generating yellow results under a small number of prompt words. I have run several comparison graphs for reference.

3. The problem of reduced model complexity. In theory and in practice. V5 should be a cleaner and more diverse model than the previous version, and with the help of some prompts, it should be able to achieve more accurate performance. Similarly, I ran several comparison charts for comparison. This training set did not use overly complex materials because I believe that overly complex images tend to overfit the results, which inevitably leads to a certain degree of detail loss.

Purpose: I hope to obtain a model that is significantly different from the previous version, rather than releasing a model that is almost identical to the previous version. This feedback from everyone is a great opportunity for trial and error, and I really don't have any trial and error costs on my own. In the next version, I will try to increase the amount of materials for different art styles, so that the art styles of different materials can be well integrated and separated. Using specific prompts to switch art styles may require some new training techniques. Thank you for your feedback!

크리에이터 스폰서

[인증 전] Tonade는 T-ponynai3 모델 작가이며, C 사이트 아이디는 Tonade입니다. | 爱发电 (afdian.net)

여기는 爱发电 후원 채널입니다. 모델이 유용하고 여유가 있다면 지원해 주세요! 억지로 하지 마시고, 여러분의 모든 지원에 감사드리며 계속 모델을 개선해 나가겠습니다!

929721518 본인의 qq 소규모 그룹 번호, tpony 관련 문제는 여기에 와서 물어보세요. C 사이트라고 메모하는 것을 잊지 마세요

모델에 이미 vae가 내장되어 있어 추가 vae가 필요 없습니다

The model already has included vae, there is no need to add additional vae

최적의 이미지 생성 전략은 중간 해상도에서 고화질 복구를 켜는 것이며, 고해상도를 직접 사용하는 것이 아닙니다

The best generate strategy is to use high-fix at a moderate resolution, rather than directly using high-resolution direct output

[인증 전] Tonade는 T-ponynai3 모델 작가이며, C 사이트 아이디는 Tonade입니다. | 爱发电 (afdian.net)

여기는 爱发电 후원 채널입니다. 모델이 유용하고 여유가 있다면 지원해 주세요! 억지로 하지 마시고, 여러분의 모든 지원에 감사드리며 계속 모델을 개선해 나가겠습니다!

(이 모델은 Tusi와 Tensor에 동시에 존재해야 하므로, Tusi에서 사용하는 것이 더 좋습니다. 사용에 문제점이 있다면 더 많이 알려 주세요)

v5 버전에 4개의 새로운 스타일이 추가되었으며, style_1부터 style_4까지를 통해 이미지 세부 조정을 할 수 있습니다(이론상 그렇지만 실제 효과는 다소 신비롭거나 낮을 수 있습니다)

V5 version has added 4 new styles, which can be used to fine tune the details of the image through style_1 to style_4 (theoretically, this is the case, but the actual effect is more mystical or lower)

이 모델은 ponyv6를 기본 모델로 훈련된 Lora를 완벽히 지원하며, ani3와 sdxl1.0의 Lora도 어느 정도 호환됩니다

This model perfectly supports lora trained with ponyv6 as the base model, and the Lora of ani3 and sdxl1.0 can also be adapted to some extent.

v4.1 기반 이미지 인페인트 테스트 (이전 버전에서 간과된 부분)

Image inpaint testing based on v4.1 (this is a previously overlooked part)

pony는 신이며 호환성 만점입니다. 이 모델은 ani와 pony의 Lora를 지원합니다

필수 전제 효과 단어는 ponydiffusion과 동일합니다

positive:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)

또는 (score_9,score_8_up,score_7_up)

부정어 추가 가능:

negative: (score_4,score_3,score_2,score_1),

일반적인 nai 계열 부정어도 추가 가능합니다. 예:

negative: worst quality, bad hands, bad feet

마음에 드셨으면 좋겠습니다 ᕕ(◠ڼ◠)ᕗ nai3 및 ponyv6 기반

훈련 안내: v1 94장의 이미지, v2는 119장, v3는 348장, v3.5는 474장의 nai3 생성 이미지와 함께 Lora를 기본 모델에 병합하여 미세 조정을 수행했습니다. pony가 지원하는 아티스트 태그는 모두 지원하며, 2개 이상의 아티스트 태그를 사용하면 배경이 붕괴될 수 있습니다. 현재 원신 캐릭터 생성은 가능하나 그 외는 미확인입니다. 이 모델에 대한 테스트는 많지 않으며, nai3의 화풍 복제에 놀랐습니다. 기본 모델은 T-anime-xl, ponyv6, ani3의 융합 모델로 아직 공개되지 않았습니다.

훈련에 사용된 그래픽 카드는 본인의 3090이며 v1부터 v3까지 각각 7시간, 12시간, 35시간, 47시간 동안 훈련했습니다

훈련 안내: v1에는 94장의 이미지, v2에는 119장, v3에는 348장, v3.5에는 474장이 사용되었으며, NAI3가 생성한 이미지입니다. Lora는 ponyv6가 가진 아티스트 태그는 모두 지원하지만 nai3에서 추가된 아티스트 태그는 없습니다. 2개 이상의 아티스트 태그 사용은 배경 붕괴를 일으킬 수 있습니다. 현재 원신 캐릭터 생성이 확인되었으나 그 외는 미검증이며, 이 모델에 대한 테스트도 적습니다. NAI3 화풍 재현에 감탄합니다. 기본 모델은 공개되지 않은 T-anime-xl, ponyv6, ani3의 융합 모델입니다.

사용된 그래픽 카드는 본인의 3090이며 v1부터 v3.5까지 각각 7시간, 12시간, 35시간, 47시간 동안 훈련했습니다.

v1

재미있는 도전

An interesting attempt

v2

v1에 비해 훈련 데이터가 약간 증가했고 약 30시간의 파라미터 시행착오를 거쳤으나, 훈련된 화풍은 과적합이 일부 남아있어, 예를 들면 두 개의 배꼽과 뒤죽박죽인 머리카락 등이 나타납니다.

On the basis of v1, the training set was slightly increased and went through about 30 hours of trial and error, but the trained art style still had some overfitting, such as double navel eyes and messy hair

v3

v3의 사지는 v2보다 더 좋으며, footfocus의 이해도가 향상되어 더욱 시각적으로 임팩트 있는 발과 난이도 높은 원근 투시를 생성할 수 있습니다. v3의 머리카락 AI 느낌도 v2보다 덜하며, 이는 v2의 훈련셋이 너무 적어 머리카락 부분에 과적합이 있었고, 가끔 나타나던 이중 배꼽도 사라졌기 때문입니다. 전체적으로 v2 훈련셋의 3배 크기와 더 큰 dim 파라미터가 화풍을 더욱 자연스럽게 맞추게 하며, 긴 프롬프트에서 v2보다 훨씬 뛰어난 표현력을 갖습니다.

The limbs of v3 are better than those of v2. In terms of understanding footfocus, v3 can generate feet with greater visual impact and higher difficulty perspective. The AI feeling of v3's hair is also weaker than that of v2, because v2 has too little training set, so the hair part may be slightly overfitting, and the occasional double navel eyes that appear in v2 are also gone. Overall, three times the size of the v2 training set and a larger dim parameter make the art style fit more natural, and the performance is much stronger than v2 under long prompts.

v3.5

이 버전에서는 품질 단어에 대한 요구가 그리 엄격하지 않아, pony의 미학 평가 품질 단어를 전혀 사용하지 않고도 이미지를 생성할 수 있습니다. 테스트 중 무의미한 색 블록이 생성될 때가 있어, 이 경우 미학 평가 품질 단어를 일반적으로 쓰이는 1.5 품질 단어로 바꾸면 됩니다. 예를 들어 score_1, score_2를 worst quality로 바꾸는 식입니다. 이 버전에서는 약 150장의 훈련셋을 추가하여 화풍을 균형 있게 풍부하게 만들었고, 학습 곡선 초기 기울기를 줄였습니다. 이로 인해 모델의 과적합이 줄고 더 많은 Lora와 독창적인 프롬프트에 적응할 수 있습니다. 전반적으로 v3보다 더 자유로운 버전이며, 남성 묘사력이 v3보다 훨씬 뛰어납니다. 일부 프롬프트에서 색상과 화풍이 지나치게 선명하거나 기름지지 않습니다.

In this version, the requirements for quality words are not so strict, you can completely not to use the quality words of pony's aesthetic score to plot the picture, and occasionally there will be a situation where the picture generates meaningless color blocks in the test, you only need to replace the quality words of the aesthetic score with 1.5 commonly used quality words, such as score_1, score_2 replace it with worst quality. In this version, I added about 150 more training sets to balance and enrich the art style, and reduced the initial slope of the learning curve, which makes this model less overfitted and can be adapted to more lora and whimsical prompts. Overall, this version is a freer version than the v3 version, and this version is much stronger than the v3 version, and the colors and style of painting under some hints are not so bright and greasy.

v4

이 버전은 798장의 이미지로 훈련되었으며 3090 그래픽카드로 90시간 동안 훈련되었습니다. v3.5에 비해 특정 프롬프트에서 구성과 일부 신체 부위 묘사가 더 정확합니다. 예를 들어 손가락 잔상과 일부 신체 부위 겹침이 개선되었습니다. 프롬프트는 중간 길이와 다소 짧은 길이를 주요 훈련 목표로 설정했습니다. 긴 프롬프트를 써야만 고품질 이미지를 생성하는 것을 좋아하는 사람은 없으니까요. pony의 미학 점수 품질 프롬프트를 제거한 후, 이미지 품질은 v3.5보다 크게 향상되었고 결과물은 더 평면적이며 고전 애니메이션 스타일에 가깝습니다. ponyv6 미세 조정 효과 테스트가 거의 완료 단계이며, 다음 단계는 프롬프트 훈련 레이블에 착수하여 제한된 단일 훈련 재료 내에서 더 많은 조절 가능한 프롬프트를 추가하는 것입니다(예: 미학 점수 포함, 현재 훈련 로직은 주류 품질 단어가 pony 미학 점수를 덮고 있음). 또한 적절한 신규 훈련 재료(예: 장면 소재 및 더 많은 발 관련 훈련 재료)를 계속 추가할 예정입니다(현재 v4 발 훈련 재료는 다소 부족해 보임).

This version used 798 images as training materials and trained for 90 hours using a 3090 graphics card. This version has a more accurate composition and depiction of certain parts in certain prompts compared to v3.5, such as ghosting of fingers and overlapping of some body parts. In terms of prompts, my main training goal is to use medium and slightly shorter prompts, as nobody likes to write a long string of prompts to generate high-quality images, right? After removing the quality prompt of Pony's aesthetic score, the image quality has been significantly improved compared to v3.5, and the resulting quality tends to be more flat rather than three-dimensional, closer to the classic anime style. The testing of the fine-tuning effect of Ponyv6 on the number of images is nearing completion. The next step is to start with the training labels of prompts and try to add more adjustable prompts to Pony's limited number of single training materials (such as adding aesthetic scores, the current training logic still uses mainstream quality words to cover Pony's aesthetic score quality words), and continue to add suitable new training materials, such as scene training materials and more foot training materials (v4's foot training materials seem to be a bit scarce).

v4.1

이렇게 짧은 시간에 새 버전을 출시해 사용자의 메모리와 네트워크 속도를 상당히 시험하게 된 점 사과드립니다. O_O

Firstly, I would like to apologize to all users for the release of a new version in such a short period of time, which greatly tests the computer's memory and network speed. O_O

이 새 버전은 v4의 사지 조정 버전입니다. v4의 사지 효과가 제어가 어려웠고 손의 완성도도 저의 테스트 기대에 미치지 못해, 친구 木猫猫猫와 함께 일부 조정 및 개선을 했고, 최종적으로 v4.1의 사지가 제 기대에 부합하도록 만들었습니다. 동일 파라미터 하에서 v4에 비해 v4.1이 개선된 정도를 명확히 보여주기 위해 여러 xy 그래프를 공개할 예정입니다.

This new version is based on the limb debugging version of v4. Due to the difficulty in controlling the limb effects of v4, the perfection rate of the hands did not meet my testing expectations in the past few days. So my friend 木猫猫猫 and I made some adjustments and improvements to v4, which ultimately made the limbs of v4.1 meet my expectations. I will release several xy graphs to clearly show the improvement of v4.1 compared to v4 under the same parameters.

v5

이 버전의 훈련 소재는 감소했습니다. v4의 실패 때문에, 낮은 VRAM 사용을 관점으로 제 아이디어를 테스트하기 위해 T-ponynai3에 적합한 네 가지 다른 화풍의 Lora를 훈련하는 별도의 프로젝트를 시작했습니다. 물론 원래 모델도 civitai에 업로드했습니다. 적합성 테스트 후, 이 네 가지 화풍을 첨가제로 T-ponynai3-v5에 훈련하기 시작했습니다. 놀랍게도 v5의 선질감이 크게 향상되었는데, 이는 매우 섬세한 소재를 훈련한 결과인 것 같습니다. 네 가지 화풍을 표시하기 위해 style_1부터 style_4까지 프롬프트 단어를 사용했으나, 이 네 화풍은 따로 분리되지 않거나 효과가 미미했으며, 오히려 원래 화풍에 잘 융합되었습니다. 다중 화풍 지원에는 미치지 못했으나, 원래 nai3 화풍의 질감을 크게 향상시켰습니다. 다음 버전에서는 한 걸음 더 나아갈 수 있길 바랍니다. (저는 게임을 좋아해서 훈련 중 컴퓨터 게임을 못 하는 것이 너무 힘듭니다)

The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it's too difficult for me to play computer games every time I train.)

v5 버전 관련 몇 가지 문제 요약입니다.

1. Lora 호환성과 사지 및 흐릿한 눈 문제. 이 훈련에서 최종 가중치를 너무 높게 사용하여 일부 경우 과적합이 발생할 수 있습니다. 이 최적화 버전은 해당 가중치를 낮춘 버전으로, 사지 붕괴율과 일부 Lora와의 호환성이 개선되었습니다. 참고용으로 v4.1 기반 화풍 Lora 비교 이미지를 몇 장 만들었습니다. 흐릿한 눈 문제는 style_1 훈련 때문으로, 원본 소재의 눈이 흐릿하여 style_3 또는 4를 사용해 개선할 수 있습니다.

2. 체적광(볼륨 라이트) 노출 문제. 테스트 중 문제를 경험하지 못했으며, noise offset 훈련 파라미터를 사용해 모델의 빛 관련 프롬프트 민감도를 높였기 때문일 가능성이 큽니다. 동일 가중치 빛 프롬프트가 더 밝은 결과를 내므로, 괄호나 숫자로 가중치 상승을 시도하지 말고 동일 프롬프트 단어를 여러 번 반복하는 것을 권장합니다. 이 파라미터 사용은 적은 프롬프트 단어에서 생기는 노란색 왜곡 문제를 해결하기 위함이며, 비교 이미지도 준비했습니다.

3. 모델 복잡도 감소 문제. 이론과 실험 모두 v5는 이전 버전보다 더 깨끗하고 다변화된 모델이며, 일부 프롬프트 활용 시 더 정확한 표현력을 기대할 수 있습니다. 비교 이미지도 준비했습니다. 이번 훈련셋은 너무 복잡한 소재를 배제했는데, 이는 과적합 경향을 줄여 세부 표현 손실을 막기 위함입니다.

목적: 전에 비해 충분히 다른 모델을 얻고자 하며, 거의 동일한 모델을 내놓지 않으려 합니다. 여러분의 피드백은 훌륭한 시행착오 기회이며, 혼자서는 시행착오 비용이 큽니다. 다음 버전에서는 다양한 화풍 소재 양을 늘려 여러 화풍을 잘 융합하고 분리하며, 특정 프롬프트로 화풍을 전환할 수 있게 새로운 훈련 기술을 시도할 것입니다. 응원에 감사합니다!

Summarize some issues regarding the v5 version.

1, Lora compatibility and issues with limbs and blurred eyes. Lora compatibility is that I used too much final weight for this training, and in some cases, overfitting may occur. This optimized version is the one that reduces the corresponding weight, and the limb collapse rate and compatibility with some Loras should be better. I have run several comparison charts of Loras trained with v4.1 for reference. The problem of blurred eyes should be the reason why I trained style_1. The eyes in the original material used are blurry, and can be improved by using style_3 or 4.

2. Exposure issues with volume light. I did not encounter this issue during testing, and the reason for it should be that I used the noise offset training parameter to increase the sensitivity of the model to light related prompt words, resulting in brighter results when the same weight of light prompt words were used. I suggest trying not to use parentheses and numbers to increase the weight. Due to the sensitivity of sdxl to prompt words, you can try repeating the same prompt words multiple times to avoid extreme results. At the same time, using this parameter is to fix the problem of generating yellow results under a small number of prompt words. I have run several comparison graphs for reference.

3. The problem of reduced model complexity. In theory and in practice. V5 should be a cleaner and more diverse model than the previous version, and with the help of some prompts, it should be able to achieve more accurate performance. Similarly, I ran several comparison charts for comparison. This training set did not use overly complex materials because I believe that overly complex images tend to overfit the results, which inevitably leads to a certain degree of detail loss.

Purpose: I hope to obtain a model that is significantly different from the previous version, rather than releasing a model that is almost identical to the previous version. This feedback from everyone is a great opportunity for trial and error, and I really don't have any trial and error costs on my own. In the next version, I will try to increase the amount of materials for different art styles, so that the art styles of different materials can be well integrated and separated. Using specific prompts to switch art styles may require some new training techniques. Thank you for your feedback!

이전
Tponynai3 - v55
다음
Tponynai3 - v5

모델 세부사항

모델 유형

Checkpoint

기본 모델

Pony

모델 버전

v5.1(weight optimized)

모델 해시

ac17f32d24

제작자

토론

댓글을 남기려면 log in하세요.