Tponynai3 - v55
Palavras-chave e Tags Relacionadas
Imagens em destaque
Prompts Recomendados
score_9,score_8_up,score_7_up
score_9,score_8_up
Prompts Negativos Recomendados
score_4,score_3,score_2,worst quality, bad hands, bad feet
score_3,score_2,ugly,bad feet
Parâmetros Recomendados
samplers
steps
cfg
clip skip
resolution
other models
Parâmetros Recomendados para Alta Resolução
upscaler
upscale
steps
denoising strength
Dicas
Use high-fix em resolução moderada para melhores resultados.
Tente style_3 ou 4 para melhorar detalhes dos olhos.
Destaques da Versão
Esta versão é uma otimização do 5.1, melhorando detalhes dos olhos, racionalidade dos pés, sensibilidade aos prompts e racionalidade na sobreposição dos membros. Porém, o tratamento de luz e sombra ainda não atingiu minhas expectativas; nos testes o uso do style_4 deixa a imagem mais escura, talvez uma solução temporária. Usei treinamento extra pois o treinamento direto não foi eficaz, o que me fez perder tempo. Se houver mais dúvidas, por favor avise nos comentários!
This version is an optimization to 5.1, optimizing the details of the eyes, the rationality of the feet, the sensitivity to cues, and the rationality of limb overlap. In my tests, the use of style_4 made the picture darker, perhaps a short-term solution, and I used some additional training, because the direct training did not work so well, so I wasted some time. If you have more questions, please be sure to let me know in the comments section!
Patrocinadores do Criador
[Não certificado] Tonade está criando o modelo T-ponynai3, ID c站: Tonade, | 爱发电 (afdian.net)
Este é o canal de patrocínio 爱发电, se achar o modelo útil e estiver com condições, pode apoiar! Não se force, agradeço todo apoio, continuarei explorando como melhorar o modelo!
Número do grupo QQ pequeno do próprio 929721518, se tiver alguma dúvida sobre tpony pode entrar aqui para perguntar. Lembre-se de marcar como c站
O modelo já possui vae embutido, não é necessário adicionar vae adicional
The model already has included vae, there is no need to add additional vae
A melhor estratégia para gerar imagens é usar resolução moderada com alta correção em vez de usar diretamente alta resolução
The best generate strategy is to use high-fix at a moderate resolution, rather than directly using high-resolution direct output
[Não certificado] Tonade está criando o modelo T-ponynai3, ID c站: Tonade, | 爱发电 (afdian.net)
Este é o canal de patrocínio 爱发电, se achar o modelo útil e estiver com condições, pode apoiar! Não se force, agradeço todo apoio, continuarei explorando como melhorar o modelo!
(33) T-ponynai3-v5 - (versão com pesos modificados) | Stable Diffusion Checkpoint | 吐司 tusi.cn (tusiart.com) link online da versão tensor china tusiart
(Como o modelo só pode existir simultaneamente em Tusi e Tensor, é melhor usá-lo no Tusi. Se houver problemas de uso, por favor me informe mais)
A versão v5 adicionou 4 novos estilos, que podem ser usados para ajustar detalhes da imagem via style_1 a style_4 (teoricamente, mas o efeito real é mais místico)
A versão V5 adicionou 4 novos estilos, que podem ser usados para ajustar os detalhes da imagem através de style_1 a style_4 (teoricamente é assim, mas o efeito real é mais místico ou reduzido)
Este modelo suporta perfeitamente lora treinados com ponyv6 como modelo base, e o Lora do ani3 e sdxl1.0 também pode ser adaptado a certo ponto
This model perfectly supports lora trained with ponyv6 as the base model, and the Lora of ani3 and sdxl1.0 can also be adapted to some extent.
Teste de img para img baseado no v4.1 (esta parte foi ignorada em versões anteriores)
Image inpaint testing based on v4.1 (this is a previously overlooked part)
Pony é divino, compatibilidade perfeita. Este modelo suporta lora ani e pony
Palavras de efeito essenciais, iguais ao ponydiffusion
positive:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)
OU (score_9,score_8_up,score_7_up)
Palavras negativas podem ser adicionadas:
negative: (score_4,score_3,score_2,score_1),
Também pode-se adicionar palavras negativas normais do tipo nai, por exemplo:
negative: worst quality, bad hands, bad feet
Espero que goste ᕕ(◠ڼ◠)ᕗ baseado em nai3 e ponyv6
Instruções de treinamento: v1 usou 94 imagens, v2 119, v3 348, v3.5 474 geradas por nai3, treinando lora incorporado ao modelo base para fine-tuning, tags de artistas suportadas por ponyv6 também suportadas, usar mais de dois tags pode causar falhas no fundo, detectou-se geração de personagens de Genshin Impact, outros desconhecidos, testes limitados, surpreende pela reprodução do estilo de pintura do nai3. Modelo base é fusão de T-anime-xl, ponyv6 e ani3, não lançado.
Placa de vídeo usada para treinamento foi minha 3090, v1 a v3 usaram 7, 12, 35 e 47 horas respectivamente
Instruções de Treinamento: A fusão do Lora usou 94 imagens para v1, 119 para v2, 348 para v3, 474 para v3.5, geradas por NAI3 para treinar no modelo base para ajuste fino. Pony suporta todas as tags de artistas que ponyv6 já possui, sem adição de tags do nai3. Usar mais de duas tags pode causar falhas no fundo. Atualmente, foi descoberto que gera personagens de Genshin Impact. Outros são desconhecidos. Testes limitados para este modelo. Admirado pela reprodução do estilo de pintura do NAI3. O modelo base é fusão do T-anime-xl, ponyv6 e animage3, ainda não lançado.
A placa de vídeo usada para treinamento foi minha 3090, usada por 7, 12, 35 e 47 horas do v1 ao v3.5 respectivamente.
v1
Uma tentativa interessante
An interesting attempt
v2
Baseado no v1, aumentou um pouco o conjunto de treino passando por cerca de 30 horas de tentativa e erro, mas o estilo treinado ainda apresenta algum overfitting, como um umbigo duplo e cabelo bagunçado
On the basis of v1, the training set was slightly increased and went through about 30 hours of trial and error, but the trained art style still had some overfitting, such as double navel eyes and messy hair
v3
Os membros do v3 são melhores que no v2, no entendimento de footfocus, v3 gera pés com maior impacto visual e perspectiva mais difícil, e o AI hair do v3 é menos evidente, pois v2 tem muito pouco conjunto de treino, causando overfitting no cabelo, e também desapareceu o umbigo duplo ocasional do v2. No geral, o tamanho do conjunto é três vezes maior e com parâmetros dim maiores, o que torna estilo natural, e desempenho muito melhor sob prompts longos.
The limbs of v3 are better than those of v2. In terms of understanding footfocus, v3 can generate feet with greater visual impact and higher difficulty perspective. The AI feeling of v3's hair is also weaker than that of v2, because v2 has too little training set, so the hair part may be slightly overfitting, and the occasional double navel eyes that appear in v2 are also gone. Overall, three times the size of the v2 training set and a larger dim parameter make the art style fit more natural, and the performance is much stronger than v2 under long prompts.
v3.5
Nesta versão, os requisitos para palavras de qualidade são menos rigorosos, pode-se não usar as palavras de qualidade da estética pony para imagens, testes mostraram que podem surgir blocos de cor sem sentido, bastando trocar as palavras da estética por palavras comuns da versão 1.5, por exemplo, score_1, score_2 por worst quality. Adicionei cerca de 150 imagens ao conjunto para equilibrar e enriquecer o estilo, reduzindo a inclinação inicial da curva de aprendizado, tornando o modelo menos sobreajustado, adaptável a mais loras e prompts criativos. Em geral, esta versão é mais livre que a v3 e melhor na representação masculina, com cores e estilo menos vibrantes e oleosos em alguns prompts.
In this version, the requirements for quality words are not so strict, you can completely not to use the quality words of pony's aesthetic score to plot the picture, and occasionally there will be a situation where the picture generates meaningless color blocks in the test, you only need to replace the quality words of the aesthetic score with 1.5 commonly used quality words, such as score_1, score_2 replace it with worst quality. In this version, I added about 150 more training sets to balance and enrich the art style, and reduced the initial slope of the learning curve, which makes this model less overfitted and can be adapted to more lora and whimsical prompts. Overall, this version is a freer version than the v3 version, and this version is much stronger than the v3 version, and the colors and style of painting under some hints are not so bright and greasy.
v4
Esta versão usou 798 imagens para treinamento, com placa 3090 por 90 horas. Comparado ao v3.5, a composição e descrição de partes como dedos e sobreposição corporal estão melhores. Optei por prompts de comprimento médio e curto, pois ninguém gosta de prompts longos para boa qualidade, certo? Após remover as palavras de qualidade da estética pony, a qualidade aumentou em relação ao v3.5, com imagens mais planas e próximas ao estilo anime clássico. Testes da adaptação ponyv6 estão quase completos, próxima etapa é ajustar prompts para adicionar mais prompts ajustáveis ao número limitado de materiais de treinamento do pony, como incluir avaliação estética, e continuar adicionando novos materiais, como cenas e mais pés (que estão meio escassos no v4).
This version used 798 images as training materials and trained for 90 hours using a 3090 graphics card. This version has a more accurate composition and depiction of certain parts in certain prompts compared to v3.5, such as ghosting of fingers and overlapping of some body parts. In terms of prompts, my main training goal is to use medium and slightly shorter prompts, as nobody likes to write a long string of prompts to generate high-quality images, right? After removing the quality prompt of Pony's aesthetic score, the image quality has been significantly improved compared to v3.5, and the resulting quality tends to be more flat rather than three-dimensional, closer to the classic anime style. The testing of the fine-tuning effect of Ponyv6 on the number of images is nearing completion. The next step is to start with the training labels of prompts and try to add more adjustable prompts to Pony's limited number of single training materials (such as adding aesthetic scores, the current training logic still uses mainstream quality words to cover Pony's aesthetic score quality words), and continue to add suitable new training materials, such as scene training materials and more foot training materials (v4's foot training materials seem to be a bit scarce).
v4.1
Peço desculpas aos usuários pelo lançamento rápido desta nova versão, que exige bastante da memória e da velocidade da rede do computador. O_O
Firstly, I would like to apologize to all users for the release of a new version in such a short period of time, which greatly tests the computer's memory and network speed. O_O
Esta nova versão é uma depuração de membros baseada no v4. Como o controle dos membros no v4 estava difícil, a taxa de perfeição das mãos não atingiu minhas expectativas nos testes recentes. Então, eu e meu amigo 木猫猫猫 fizemos ajustes e melhorias no v4, que resultaram nos membros do v4.1 atingindo minhas expectativas. Vou mostrar vários gráficos xy para evidenciar a melhora do v4.1 comparado ao v4 com os mesmos parâmetros.
This new version is based on the limb debugging version of v4. Due to the difficulty in controlling the limb effects of v4, the perfection rate of the hands did not meet my testing expectations in the past few days. So my friend 木猫猫猫 and I made some adjustments and improvements to v4, which ultimately made the limbs of v4.1 meet my expectations. I will release several xy graphs to clearly show the improvement of v4.1 compared to v4 under the same parameters.
v5
Este lançamento tem menos materiais. Devido ao fracasso do v4, comecei outro projeto para testar minha ideia considerando baixo uso de VRAM, treinando quatro estilos diferentes de lora para adaptar ao T-ponynai3; o modelo original também está no civitai. Após testarem-se as adaptações, esses quatro estilos foram adicionados como aditivos no T-ponynai3-v5. Surpreendentemente, a textura das linhas do v5 melhorou muito, provavelmente por causa dos materiais delicados. Para marcar estes quatro estilos, usei prompt style_1 a style_4. Infelizmente, os quatro estilos não se separaram ou tiveram efeito fraco, mas se fundiram bem com o estilo original. Apesar disso, elevou a textura do estilo nai3 original. Talvez na próxima versão avance mais. (Adoro jogos e é difícil ficar sem jogar enquanto treino)
The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it's too difficult for me to play computer games every time I train.)
Resumo de problemas do v5:
1. Compatibilidade lora, membros e olhos borrados. Usei peso final alto demais, causando possível overfitting. A versão otimizada reduz esse peso; corrupção dos membros e compatibilidade com certas loras devem melhorar. Rodei gráficos comparativos com loras treinadas no v4.1 para referência. Olhos borrados causados por estilo_1, pois os originais têm olhos desfocados; pode melhorar com style_3 ou 4.
2. Problemas de exposição da luz volumétrica. Não encontrei no teste; pode ser causado pelo parâmetro noise offset, que aumenta sensibilidade do modelo a prompt de luz, deixando imagens mais claras com mesmos pesos. Sugiro evitar parênteses e números para aumentar peso, e repetir palavra várias vezes para evitar extremos, devido à sensibilidade do sdxl. O parâmetro visa corrigir amarelamento em poucos prompts, com gráficos comparativos.
3. Complexidade do modelo diminuída. Teoricamente e na prática, v5 é mais limpo e diverso que versões anteriores, podendo expressar melhor com certos prompts. Rodei gráficos comparativos. O conjunto não contém materiais muito complexos para evitar overfitting, que causam perda de detalhes.
Objetivo: Quero um modelo diferente suficiente do anterior, não um quase idêntico. Feedbacks são bons para teste; sozinho não teria custo para erro. Próxima versão tentarei aumentar materiais dos estilos para fundir e separar estilos, possibilitando troca por prompts, talvez com novas técnicas. Obrigado pelo feedback!
Summarize some issues regarding the v5 version.
1, Lora compatibility and issues with limbs and blurred eyes. Lora compatibility is that I used too much final weight for this training, and in some cases, overfitting may occur. This optimized version is the one that reduces the corresponding weight, and the limb collapse rate and compatibility with some Loras should be better. I have run several comparison charts of Loras trained with v4.1 for reference. The problem of blurred eyes should be the reason why I trained style_1. The eyes in the original material used are blurry, and can be improved by using style_3 or 4.
2. Exposure issues with volume light. I did not encounter this issue during testing, and the reason for it should be that I used the noise offset training parameter to increase the sensitivity of the model to light related prompt words, resulting in brighter results when the same weight of light prompt words were used. I suggest trying not to use parentheses and numbers to increase the weight. Due to the sensitivity of sdxl to prompt words, you can try repeating the same prompt words multiple times to avoid extreme results. At the same time, using this parameter is to fix the problem of generating yellow results under a small number of prompt words. I have run several comparison graphs for reference.
3. The problem of reduced model complexity. In theory and in practice. V5 should be a cleaner and more diverse model than the previous version, and with the help of some prompts, it should be able to achieve more accurate performance. Similarly, I ran several comparison charts for comparison. This training set did not use overly complex materials because I believe that overly complex images tend to overfit the results, which inevitably leads to a certain degree of detail loss.
Purpose: I hope to obtain a model that is significantly different from the previous version, rather than releasing a model that is almost identical to the previous version. This feedback from everyone is a great opportunity for trial and error, and I really don't have any trial and error costs on my own. In the next version, I will try to increase the amount of materials for different art styles, so that the art styles of different materials can be well integrated and separated. Using specific prompts to switch art styles may require some new training techniques. Thank you for your feedback!
Detalhes do Modelo
Discussão
Por favor, faça log in para deixar um comentário.