modelos/Tponynai3 - v5

Tponynai3 - v5

João Silva

5/23/2025

1:45:02 AM

| Discussion

Palavras-chave e Tags Relacionadas

anime,modelo base,checkpoint,pony

Imagem gerada por IA, criada com stable diffusion, de um casal de anime romântico em seu casamento, com a noiva em um vestido branco e o noivo em um terno preto, compartilhando um momento íntimo.

Casal de anime romântico de mãos dadas durante seu casamento com pássaros brancos voando ao redor em uma imagem gerada por IA usando stable diffusion.

Garota estilo anime com cabelo rosa em uma cidade futurista sombria com uma criatura morcego, gerada por IA usando Stable Diffusion.

Garota anime com cabelo rosa e óculos, vestida com fantasia de demônio embaixo da lua cheia, gerada por AI usando Stable Diffusion.

Isabelle de Animal Crossing, encostada em uma mesa de escritório, gerada por IA usando Stable Diffusion.

Prompts Recomendados

score_9,score_8_up,score_7_up

score_8_up,score_7_up,1girl,solo

Prompts Negativos Recomendados

score_4,score_3,score_2,worst quality, bad hands, bad feet

score_4,score_3,score_2,score_1,ugly,bad feet

Parâmetros Recomendados

samplers

Euler a

steps

25 - 30

cfg

clip skip

resolution

776x1072, 848x1072, 952x1192, 696x1272, 960x1248, 792x1248

other models

T-ponynai3-v5 (61cc7615e2), ponynai3-v5-000175 (8dcbf7b584), pony-Tonade (7033f6d4f6)

Parâmetros Recomendados para Alta Resolução

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.6 - 2

steps

denoising strength

0.3

Dicas

Use alta correção em resolução moderada para melhores resultados.

Tente style_3 ou 4 para melhorar detalhes nos olhos.

Destaques da Versão

O material de treino desta versão foi reduzido. Devido ao fracasso do v4, iniciei outro projeto para testar minha ideia de baixo uso de memória, treinando quatro estilos artísticos diferentes de lora adaptados ao T-ponynai3. O modelo original também foi carregado no civitai. Após testes de adaptabilidade, comecei a treinar esses quatro estilos como aditivos no T-ponynai3-v5. Surpreendentemente, a textura das linhas do v5 melhorou muito, provavelmente por usar material delicado no treino. Para marcar esses quatro estilos usei prompts style_1 a style_4, mas infelizmente esses estilos não se separaram ou o efeito foi fraco, integrando bem ao estilo original. Embora não tenha conseguido suportar múltiplos estilos, elevou a textura do estilo original de nai3. Talvez a próxima versão avance mais. (Gosto muito de jogar, é difícil não poder jogar enquanto treino.)

The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it's too difficult for me to play computer games every time I train.)

Patrocinadores do Criador

[Não verificado] Tonade é o criador do modelo T-ponynai3, ID no Civitai: Tonade, | Aifadian (afdian.net )

Este é o canal de patrocínio do Aifadian, se você acha o modelo útil e tem condições, pode apoiar! Sem pressão, agradecemos cada apoio e continuaremos explorando como melhorar o modelo!

929721518 é o número do grupo QQ do autor, se tiver dúvidas sobre tpony, pode entrar para perguntar. Lembre-se de mencionar c站 (Civitai)

O modelo já inclui VAE, não é necessário adicionar VAE adicional

The model already has included vae, there is no need to add additional vae

A melhor estratégia de geração é usar resolução moderada com alta correção, ao invés de usar diretamente alta resolução

The best generate strategy is to use high-fix at a moderate resolution, rather than directly using high-resolution direct output

[Não verificado] Tonade é o criador do modelo T-ponynai3, ID no Civitai: Tonade, | Aifadian (afdian.net )

Este é o canal de patrocínio do Aifadian, se você acha o modelo útil e tem condições, pode apoiar! Sem pressão, agradecemos cada apoio e continuaremos explorando como melhorar o modelo!

(33) T-ponynai3-v5 - (Versão modificada do peso) | Stable Diffusion Checkpoint | Tusi tusi.cn (tusiart.com) tusiart (versão China tensor) link de geração online

(Como o modelo só pode existir simultaneamente em Tusi e Tensor, é melhor usá-lo no Tusi. Se houver problemas no uso, por favor, me avise)

A versão v5 adicionou 4 novos estilos, que podem ser usados para ajustar detalhes da imagem através de style_1 até style_4 (teoricamente é assim, mas o efeito real é meio misterioso)

A versão v5 adicionou 4 novos estilos, que podem ser usados para ajustar os detalhes da imagem através de style_1 até style_4 (teoricamente é assim, mas o efeito real é mais místico ou mais fraco)

Este modelo suporta perfeitamente loras treinadas com ponyv6 como modelo base, e as loras de ani3 e sdxl1.0 também podem ser adaptadas em certa medida.

This model perfectly supports lora trained with ponyv6 as the base model, and the Lora of ani3 and sdxl1.0 can also be adapted to some extent.

Teste de imagem inpaint baseado no v4.1 (esta parte foi negligenciada em versões anteriores)

Image inpaint testing based on v4.1 (this is a previously overlooked part)

Pony é divino, compatibilidade perfeita. Este modelo suporta loras de ani e pony

Palavras positivas essenciais iguais às do ponydiffusion

positivo:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)

OU (score_9,score_8_up,score_7_up)

Negativo pode adicionar:

negativo: (score_4,score_3,score_2,score_1),

Também pode adicionar palavras negativas normais do tipo nai, por exemplo:

negativo: worst quality, bad hands, bad feet

Espero que goste ᕕ(◠ڼ◠)ᕗ baseado em nai3 e ponyv6

Instruções de treinamento: v1 Usou 94 imagens, v2 usou 119, v3 usou 348, v3.5 usou 474 imagens geradas pelo nai3. As loras foram treinadas integradas no modelo base para ajuste fino. O modelo suporta tags de artistas que o ponyv6 suporta, porém o uso de mais de duas tags pode causar falhas no fundo. Atualmente foi identificado que pode gerar personagens de Genshin Impact, outros ainda não testados. Estou impressionado com a recriação do estilo de pintura do nai3. O modelo base é uma fusão de T-anime-xl, ponyv6 e ani3 não lançado.

A placa de vídeo usada para treinamento foi minha 3090, gasto de 7, 12, 35 e 47 horas respectivamente das versões v1 até v3.5

Instruções de treinamento: Foram usadas 94 imagens para v1, 119 para v2, 348 para v3, 474 para v3.5 geradas pelo NAI3 para treinar no modelo base e fazer ajuste fino. Pony suporta todas as tags de artistas que ponyv6 já tem, mas não há tags adicionais do nai3. Usar mais de duas tags pode causar falhas no fundo. Atualmente descoberto que pode gerar personagens de Genshin Impact. Ainda não testei muito esse modelo. Impressionado pela reprodução do estilo de pintura do NAI3. O modelo base é uma fusão de T-anime-xl, ponyv6 e ani3, que não foi lançado.

A placa de vídeo usada foi minha 3090, usada por 7, 12, 35 e 47 horas de v1 a v3.5 respectivamente.

v1

Uma tentativa interessante

An interesting attempt

v2

Baseado em v1, aumentou ligeiramente o conjunto de treino e passou por cerca de 30 horas de tentativa e erro, mas o estilo treinado ainda mostra algum overfitting, como umbigos duplos e cabelos bagunçados

On the basis of v1, the training set was slightly increased and went through about 30 hours of trial and error, but the trained art style still had some overfitting, such as double navel eyes and messy hair

v3

Os membros em v3 são melhores que em v2; em relação ao footfocus, v3 gera pés com impacto visual maior e perspectiva mais difícil. O aspecto artificial do cabelo em v3 é menor que em v2, porque v2 teve conjunto de treino pequeno, causando overfitting no cabelo, e os umbigos duplos em v2 desapareceram. No geral, o triplo do tamanho do conjunto de treino e o parâmetro dim maior fizeram o estilo mais natural e com melhor desempenho em prompts longos comparado ao v2.

The limbs of v3 are better than those of v2. In terms of understanding footfocus, v3 can generate feet with greater visual impact and higher difficulty perspective. The AI feeling of v3's hair is also weaker than that of v2, because v2 has too little training set, so the hair part may be slightly overfitting, and the occasional double navel eyes that appear in v2 are also gone. Overall, three times the size of the v2 training set and a larger dim parameter make the art style fit more natural, and the performance is much stronger than v2 under long prompts.

v3.5

Neste versão, as exigências para palavras de qualidade não são tão rigorosas; pode-se não usar as palavras da avaliação estética do pony para gerar imagens. Em testes, ocasionalmente apareciam blocos de cor sem sentido, bastando substituir as palavras da avaliação estética por palavras comuns 1.5, como trocar score_1, score_2 por worst quality. Adicionei cerca de 150 imagens para equilibrar e enriquecer o estilo, e reduzi a inclinação inicial da curva de aprendizagem, tornando o modelo menos propenso ao overfitting; pode adaptar mais loras e prompts criativos. Em geral, essa versão é mais livre que a v3, e a representação masculina é muito melhor, com cores e estilo menos vibrantes e oleosos em certos prompts.

In this version, the requirements for quality words are not so strict, you can completely not to use the quality words of pony's aesthetic score to plot the picture, and occasionally there will be a situation where the picture generates meaningless color blocks in the test, you only need to replace the quality words of the aesthetic score with 1.5 commonly used quality words, such as score_1, score_2 replace it with worst quality. In this version, I added about 150 more training sets to balance and enrich the art style, and reduced the initial slope of the learning curve, which makes this model less overfitted and can be adapted to more lora and whimsical prompts. Overall, this version is a freer version than the v3 version, and this version is much stronger than the v3 version, and the colors and style of painting under some hints are not so bright and greasy.

v4

Esta versão usou 798 imagens como material de treino e foi treinada por 90 horas numa 3090. Comparado com v3.5, tem composição e detalhamento melhor para certos prompts, como fantasmas em dedos e sobreposição de partes do corpo. Meu foco foi usar prompts de comprimento médio e ligeiramente curtos, já que ninguém gosta de prompts longos para gerar imagens boas. Após remover prompts de qualidade da avaliação estética do pony, a qualidade melhorou bastante, com imagens tendendo a ser mais planas e estilo anime clássico. Testes sobre o número de imagens para ajuste fino do ponyv6 estão quase concluídos. Próximo passo é usar etiquetas de treinamento para adicionar prompts ajustáveis ao número limitado de materiais de treino de pony, como incluir avaliação estética. Continuarei adicionando novos materiais, como cenas e mais treino para pés (parece que tem pouco material para pés em v4).

This version used 798 images as training materials and trained for 90 hours using a 3090 graphics card. This version has a more accurate composition and depiction of certain parts in certain prompts compared to v3.5, such as ghosting of fingers and overlapping of some body parts. In terms of prompts, my main training goal is to use medium and slightly shorter prompts, as nobody likes to write a long string of prompts to generate high-quality images, right? After removing the quality prompt of Pony's aesthetic score, the image quality has been significantly improved compared to v3.5, and the resulting quality tends to be more flat rather than three-dimensional, closer to the classic anime style. The testing of the fine-tuning effect of Ponyv6 on the number of images is nearing completion. The next step is to start with the training labels of prompts and try to add more adjustable prompts to Pony's limited number of single training materials (such as adding aesthetic scores, the current training logic still uses mainstream quality words to cover Pony's aesthetic score quality words), and continue to add suitable new training materials, such as scene training materials and more foot training materials (v4's foot training materials seem to be a bit scarce).

v4.1

Peço desculpas por lançar uma nova versão em tão pouco tempo, isso realmente testa a memória e a velocidade da rede do computador. O_O

Firstly, I would like to apologize to all users for the release of a new version in such a short period of time, which greatly tests the computer's memory and network speed. O_O

Esta nova versão é baseada na depuração dos membros do v4. Como os resultados do v4 em membros são difíceis de controlar e a taxa de perfeição das mãos não atendeu às minhas expectativas, meu amigo 木猫猫猫 e eu fizemos ajustes que produziram a v4.1 que alcançou minhas expectativas. Publicarei alguns gráficos xy para mostrar claramente a melhoria da v4.1 em comparação com v4 sob os mesmos parâmetros.

This new version is based on the limb debugging version of v4. Due to the difficulty in controlling the limb effects of v4, the perfection rate of the hands did not meet my testing expectations in the past few days. So my friend 木猫猫猫 and I made some adjustments and improvements to v4, which ultimately made the limbs of v4.1 meet my expectations. I will release several xy graphs to clearly show the improvement of v4.1 compared to v4 under the same parameters.

v5

Alguns pontos sobre problemas na versão v5.

1. Compatibilidade lora e problemas com membros e olhos borrados. Usei peso final muito alto nesta versão, gerando overfitting em alguns casos. Esta versão otimizada reduz o peso, melhorando taxa de falhas nos membros e compatibilidade com algumas loras; incluí comparações com loras treinadas no v4.1. Olhos borrados devem ser por estilo_1, pois os olhos no material original são borrados, pode melhorar usando style_3 ou style_4.

2. Problemas de exposição com luz volumétrica. Não encontrei no teste, mas deve ser por usar parâmetro noise offset, aumentando sensibilidade a prompts de luz e gerando imagens mais claras. Sugiro evitar usar parênteses e números para aumentar peso; por sensibilidade do sdxl, tente repetir prompts iguais várias vezes para evitar resultados extremos. Este parâmetro também corrige problema de tonalidade amarela em poucos prompts, com comparações disponíveis.

3. Complexidade reduzida do modelo. Teoricamente e na prática, v5 é mais limpo e diverso, e com certos prompts tem mais precisão. Fiz comparações. O conjunto de treino evitou material muito complexo para não gerar overfitting que perde detalhes.

Objetivo: Quero um modelo bem diferente dos anteriores, não um quase idêntico. O feedback é valioso para tentar e errar, pois sozinho o custo seria alto. Na próxima versão aumentarei material de cada estilo para melhor fusão e separação de estilos, usando prompts específicos para troca de estilo, o que pode exigir técnicas novas de treino. Obrigado pelo feedback!

Summarize some issues regarding the v5 version.

1, Lora compatibility and issues with limbs and blurred eyes. Lora compatibility is that I used too much final weight for this training, and in some cases, overfitting may occur. This optimized version is the one that reduces the corresponding weight, and the limb collapse rate and compatibility with some Loras should be better. I have run several comparison charts of Loras trained with v4.1 for reference. The problem of blurred eyes should be the reason why I trained style_1. The eyes in the original material used are blurry, and can be improved by using style_3 or 4.

2. Exposure issues with volume light. I did not encounter this issue during testing, and the reason for it should be that I used the noise offset training parameter to increase the sensitivity of the model to light related prompt words, resulting in brighter results when the same weight of light prompt words were used. I suggest trying not to use parentheses and numbers to increase the weight. Due to the sensitivity of sdxl to prompt words, you can try repeating the same prompt words multiple times to avoid extreme results. At the same time, using this parameter is to fix the problem of generating yellow results under a small number of prompt words. I have run several comparison graphs for reference.

3. The problem of reduced model complexity. In theory and in practice. V5 should be a cleaner and more diverse model than the previous version, and with the help of some prompts, it should be able to achieve more accurate performance. Similarly, I ran several comparison charts for comparison. This training set did not use overly complex materials because I believe that overly complex images tend to overfit the results, which inevitably leads to a certain degree of detail loss.

Purpose: I hope to obtain a model that is significantly different from the previous version, rather than releasing a model that is almost identical to the previous version. This feedback from everyone is a great opportunity for trial and error, and I really don't have any trial and error costs on my own. In the next version, I will try to increase the amount of materials for different art styles, so that the art styles of different materials can be well integrated and separated. Using specific prompts to switch art styles may require some new training techniques. Thank you for your feedback!

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

Tponynai3 - v51weight otimizado

CyberRealistic Pony - v40

Usar este modelo