modelos/Tponynai3 - v51weight otimizado

Tponynai3 - v51weight otimizado

João Silva

5/23/2025

1:45:16 AM

| Discussion

Palavras-chave e Tags Relacionadas

61cc7615e2,89e7c7518c,ac17f32d24,anime,modelo base,checkpoint,nai,nai3,pony,tonade,tponynai3

Garota escolar de anime com cabelo preto curto, uniforme marinheiro com laço vermelho, de pé em uma sala de aula com um braço levantado. Gerado por IA Stable Diffusion.

Imagem gerada por IA de uma colegial de anime com cabelo curto e escuro, vestindo uniforme marinheiro, dançando entusiasticamente em um palco com cortinas vermelhas usando Stable Diffusion.

Uma imagem gerada por AI usando Stable Diffusion de uma garota de anime em uniforme escolar, fazendo sinal de paz.

Imagem gerada por IA de uma garota de anime em um traje de garota mágica rosa usando stable diffusion.

Uma guerreira coelho robótica com uma espada em uma cena pós-apocalíptica. Imagem gerada por AI usando Stable Diffusion.

Imagem no estilo anime de uma garota fofa com cabelo branco e asas de anjo sentada no balcão de um bar. Ela está usando um vestido branco e tem um halo brilhante acima da cabeça. Imagem gerada por AI usando stable diffusion.

Um ângulo dinâmico de uma garota anime com cabelo preto e verde, vestindo um vestido turquesa e segurando um par de óculos de sol. Esta é uma imagem gerada por IA usando stable diffusion.

Uma bruxa de anime com tema sombrio em pé sobre um círculo mágico brilhante com energia mística irradiando de suas mãos. Gerado usando stable diffusion.

Uma imagem gerada por AI de uma bruxa estilo anime com chapéu azul e cabelo castanho lendo um livro mágico em um quarto iluminado por velas, criada usando Stable Diffusion.

Bruxa de anime com chapéu e vestido preto, correndo alegremente em um quarto mágico iluminado por velas. Imagem gerada por AI usando Stable Diffusion.

Design de personagem de anime gerado por AI com cabelo curto prateado, olhos dourados, detalhes amarelos e uma roupa detalhada.

Uma garota anime estilosa de cabelo loiro fazendo sinal de paz, gerada por IA usando Stable Diffusion.

Prompts Recomendados

score_9,score_8_up,score_7_up

score_8_up,score_7_up,1girl

Prompts Negativos Recomendados

score_4,score_3,score_2,worst quality, bad hands, bad feet

score_3,score_2,ugly

Parâmetros Recomendados

samplers

Euler a

steps

cfg

clip skip

resolution

776x1072, 848x1072, 864x1192, 616x936, 696x1272, 712x1064

other models

T-ponynai3-v5.1 (ac17f32d24), T-ponynai3-v4.1 (0b3046dd73), T-ponynai3-v5 (61cc7615e2), tpony-style-v2 (e9eed2af18)

Parâmetros Recomendados para Alta Resolução

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.5 - 2

steps

denoising strength

0.3

Dicas

Use high-fix em resolução moderada para melhores resultados.

Experimente style_3 ou 4 para melhorar detalhes dos olhos.

Destaques da Versão

Farei um resumo das questões da versão v5.

1. Compatibilidade lora, membros e olhos borrados. Usei peso final alto demais neste treino, causando overfitting em alguns casos. Esta versão otimizada reduz o peso, melhorando taxa de falha dos membros e compatibilidade com alguns loras. Fiz comparações com loras treinadas no v4.1 para referência. Olhos borrados são causados por treinar style_1, pois o material original tem olhos borrados; usar style_3 ou style_4 melhora isso.

2. Exposição da luz volumétrica. Não tive esse problema em testes; acho que é por usar parâmetro noise offset, que aumenta sensibilidade a palavras de prompt relacionadas a luz, tornando a luz mais brilhante para o mesmo peso. Sugiro não usar parênteses e números para aumentar peso; devido à sensibilidade do sdxl a palavras de prompt, tente repetir palavras idênticas múltiplas vezes para evitar extremos. Este parâmetro corrige o problema de geração amarelada com poucos prompts; tenho comparações para referência.

3. Redução da complexidade do modelo. Em teoria e prática, v5 é modelo mais limpo e diversificado que anteriores, e com alguns prompts deve render com mais precisão. Também fiz comparações. Este conjunto de treino não usa materiais muito complexos para evitar overfitting, o que causa perda de detalhes.

Objetivo: Quero um modelo com diferenças grandes em relação às versões anteriores, e não um quase igual. O feedback de vocês é ótima chance de testar, pois sozinho não teria custo ou coragem para isso. Na próxima versão, tentarei aumentar materiais para diferentes estilos, para que se integrem e se separem bem; usar prompts específicos para alternar estilos pode exigir novas técnicas. Obrigado pelo feedback!

Resumo de algumas questões da v5.

1. Compatibilidade Lora, membros e olhos borrados. Usei peso final muito alto, causando overfitting. Esta versão otimizada reduz peso e melhora taxa de falhas e compatibilidade. Fiz comparações com loras treinados no v4.1 para referência. Problemas de olhos borrados vêm do style_1 usado, olhos do material original são borrados; usar style_3 ou 4 melhora.

2. Problemas de exposição da luz volumétrica. Não experimentei, mas deve haver efeito do parâmetro noise offset aumentando sensibilidade a palavras relacionadas a luz, causando imagens mais brilhantes. Recomendo evitar parênteses e números para aumentar peso; sdxl é sensível a prompts, repetir a palavra várias vezes evita extremos. Parâmetro foi para corrigir amarelecimento com poucos prompts. Possuo comparações para referência.

3. Redução da complexidade do modelo. Teoricamente e na prática, v5 é modelo mais limpo e diverso; com alguns prompts, deve obter performance mais precisa. Fiz algumas comparações. Não usei materiais complexos para evitar overfitting que causa perda de detalhes.

Objetivo: produzi um modelo com diferenças grandes, não quase igual às versões anteriores. Feedback é ótima oportunidade para testes, sozinho não teria esse custo. Na próxima versão tentarei aumentar materiais para diferentes estilos, para que se integrem bem e sejam separáveis; trocar estilos via prompts pode exigir técnicas novas. Obrigado pelo feedback!

Patrocinadores do Criador

[Não verificado] Tonade está criando o modelo T-ponynai3, ID c no site: Tonade, | Aifadian (afdian.net )

Este é o canal de apoio no Aifadian, se achar o modelo útil e tiver condições, pode apoiar! Não se force, agradecemos cada apoio e continuaremos explorando como aprimorar o modelo!

929721518 número do grupo qq pessoal, se tiver dúvidas sobre tpony pode entrar para perguntar. Lembre-se de mencionar o site c

O modelo já tem vae embutido, não é necessário adicionar vae adicional

O modelo já inclui vae, não há necessidade de adicionar vae extra

A melhor estratégia para gerar imagens é usar resolução moderada com correção de alta definição, em vez de usar diretamente uma alta resolução para saída direta

A melhor estratégia para geração é usar high-fix em resolução moderada, em vez de saída direta em alta resolução

[Não verificado] Tonade é o autor do modelo T-ponynai3, ID c no site: Tonade, | Aifadian (afdian.net )

Este é o canal de apoio no Aifadian, se achar o modelo útil e tiver condições, pode apoiar! Não se force, agradecemos cada apoio e continuaremos explorando como aprimorar o modelo!

(33) T-ponynai3-v5 - (versão com peso modificado) | Stable Diffusion Checkpoint | Tusi tusi.cn (tusiart.com) tusiart (versão China tensor) link para geração online

(Como o modelo só pode existir simultaneamente em Tusi e Tensor, é melhor usá-lo no Tusi. Se houver problemas no uso, por favor me informe mais）

Versão v5 adicionou 4 estilos novos, que podem ser usados para ajustar finamente detalhes da imagem através de style_1 até style_4 (teoricamente, mas o efeito real é mais místico)

Versão V5 adicionou 4 novos estilos, utilizáveis para afinar detalhes da imagem via style_1 a style_4 (teoricamente assim, mas o efeito real é mais místico ou mais fraco)

Este modelo suporta perfeitamente modelos treinados com ponyv6 como base, loras de ani3 e sdxl1.0 também podem ser adaptados até certo ponto

Este modelo suporta perfeitamente lora treinado com ponyv6 como base, e o Lora de ani3 e sdxl1.0 também pode ser adaptado em certa medida.

Teste de pintura baseado em v4.1 (esta parte foi negligenciada nas versões anteriores)

Teste de pintura do tipo image inpaint baseado em v4.1 (esta parte foi negligenciada anteriormente)

Pony é divino, compatibilidade perfeita. Este modelo suporta lora de ani e pony

Termos essenciais usados são os mesmos do ponydiffusion

positivo:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)

OU (score_9,score_8_up,score_7_up)

Negativos que podem ser adicionados:

negativo: (score_4,score_3,score_2,score_1),

Também é possível adicionar palavras negativas normais da série nai, por exemplo:

negativo: pior qualidade, mãos ruins, pés ruins

Espero que gostem ᕕ(◠ڼ◠)ᕗ baseado em nai3 e ponyv6

Instruções de treino: v1 usou 94 imagens, v2 usou 119, v3 usou 348, v3.5 usou 474, imagens geradas por nai3, lora treinada incorporada ao modelo base para ajuste fino, o modelo suporta as tags de artista do ponyv6, uso de mais de duas tags de artista pode causar falha no fundo. Descobri que pode gerar personagens de Genshin Impact, outros não sei. Testei pouco este modelo, me surpreendo com a reprodução do estilo de pintura do nai3. O modelo base é uma fusão de T-anime-xl, ponyv6 e ani3, ainda não lançado.

A placa gráfica usada no treinamento foi meu próprio 3090, duração do treino foi 7, 12, 35 e 47 horas do v1 ao v3.5 respectivamente.

Instruções de treinamento: Merge Lora usou 94 imagens para v1, 119 para v2, 348 para v3 e 474 para v3.5, geradas por NAI3 para treinar o modelo base para ajuste fino, Pony suporta todas as tags de artista que ponyv6 possui, mas não há tags adicionais do nai3. Uso de mais de duas tags de artista pode causar falhas no fundo. Atualmente descobriu-se que gera personagens de Genshin Impact. Não sei dos outros. Testei pouco este modelo. Admirado pela reprodução do estilo de pintura do NAI3. O modelo base é uma fusão de T-anime-xl, ponyv6 e ani3, ainda não lançado.

A placa gráfica usada no treinamento foi minha 3090, usada por 7, 12, 35 e 47 horas do v1 ao v3.5 respectivamente.

v1

Uma tentativa interessante

v2

Baseado no v1, com o conjunto de treinamento ligeiramente aumentado, passando por 30 horas de tentativa e erro, mas o estilo treinado ainda apresenta algum excesso de ajuste, por exemplo, umbigo duplo e cabelo bagunçado

Baseado no v1, o conjunto de treino foi ligeiramente aumentado e passou por cerca de 30 horas de tentativa e erro, mas o estilo treinado ainda tem algum overfitting, como umbigo duplo e cabelo bagunçado

v3

Os membros do v3 são melhores que os do v2. No entendimento de footfocus, v3 pode gerar pés com maior impacto visual e perspectiva mais difícil. O sentimento de IA no cabelo do v3 também é mais fraco que no v2, porque v2 tem pouco conjunto de dados; o cabelo pode estar um pouco overfitted, e o umbigo duplo ocasional de v2 desapareceu. Em geral, o conjunto de treinamento três vezes maior que v2 e o maior parâmetro dim fazem o estilo se encaixar mais naturalmente, além do desempenho muito melhor sob prompts longos.

Os membros do v3 são melhores que os v2. Em termos de footfocus, v3 pode gerar pés com maior impacto visual e perspectiva mais difícil. O efeito de IA do cabelo do v3 é mais fraco que o v2, pois o v2 tem pouco conjunto de treino, resultando em overfitting no cabelo e o umbigo duplo ocasional sumiu. Em geral, o conjunto de treino três vezes maior e o parâmetro dim maior fazem o estilo mais natural, e o desempenho sob prompts longos é bem melhor que o v2.

v3.5

Neste versão, as exigências sobre as palavras de qualidade não são tão rigorosas, pode-se não usar as palavras de qualidade do score estético do pony, podendo ocasionalmente aparecer blocos de cor sem sentido nas imagens geradas durante testes, basta substituir as palavras de qualidade do score estético por palavras de qualidade comuns como score_1 e score_2 por pior qualidade. Nesta versão, adicionei cerca de 150 imagens ao conjunto de treino para equilibrar e enriquecer o estilo, e reduzi a inclinação inicial da curva de aprendizagem, tornando o modelo menos overfitted, podendo adaptar mais loras e prompts criativos. Em geral, esta versão é mais livre que a v3, e retrata melhor personagens masculinos, com cores e estilo menos exagerados e gordurosos em alguns prompts.

Nesta versão, os requisitos para as palavras de qualidade não são tão rigorosos, podendo não usar as palavras de qualidade do score estético do pony para gerar imagens, ocasionalmente gerando blocos de cor sem sentido em testes, basta substituir as palavras de qualidade do score estético por palavras comuns como score_1, score_2 por pior qualidade. Esta versão adicionou cerca de 150 imagens de treinamento para equilibrar e enriquecer o estilo, e reduziu a inclinação inicial da curva de aprendizado, tornando o modelo menos superajustado, podendo adaptar a mais lora e prompts criativos. No geral, esta versão é mais livre que a v3 e retrata melhor os homens, com cores e estilo menos vividos e gordurosos em certos prompts.

v4

Esta versão usou 798 imagens para treinamento e uma placa 3090 para 90 horas. Comparado com v3.5, apresenta composição mais correta e detalhes em certas partes, como fantasmas nos dedos e sobreposições de partes do corpo. O foco foi usar prompts de comprimento médio ou curto, pois ninguém gosta de escrever longos prompts para gerar boa qualidade. Após remover o prompt de qualidade com score estético do Pony, a qualidade da imagem melhorou muito em relação a v3.5, com resultados mais planos e estilo mais próximo do anime clássico. Testes sobre o efeito do fine-tuning da Ponyv6 com quantidade de imagens estão quase concluídos; o próximo passo será incluir mais prompts ajustáveis e novas imagens como cenas e mais imagens focadas em pés (parece que o v4 tem poucas imagens de treinamento para pés).

Esta versão usou 798 imagens como material de treino, usando uma 3090 por 90 horas. Comparado com o v3.5, a composição e a representação de certas partes em alguns prompts está melhor, como fantasmas nos dedos e sobreposição de partes do corpo. O treino focou em prompts médios e curtos, pois ninguém gosta de escrever um longo prompt para imagens de boa qualidade, certo? Após remover o prompt de qualidade baseado no score estético do Pony, a qualidade da imagem melhorou muito em relação ao v3.5, com imagens mais planas e estilo mais próximo do anime clássico. O teste do efeito do fine-tune da Ponyv6 quanto à quantidade de imagens está quase finalizado; o próximo passo é treinar com mais prompts ajustáveis e adicionar novos materiais de treino, como cenas e mais imagens de pés (parece que o v4 tem poucos materiais de treino para pés).

v4.1

Peço desculpas aos usuários por lançar uma nova versão em tão pouco tempo, isso realmente testa a memória do computador e a velocidade da rede. O_O

Primeiramente, peço desculpas a todos os usuários pelo lançamento de uma nova versão em tão curto período, o que testa muito a memória do computador e a velocidade da rede. O_O

Esta nova versão é baseada na depuração dos membros do v4. Como o efeito dos membros no v4 era difícil de controlar, a taxa de perfeição das mãos não atingiu as expectativas dos últimos testes. Então eu e meu amigo 木猫猫猫 fizemos alguns ajustes e melhorias no v4, levando a que os membros do v4.1 atingissem minhas expectativas. Irei liberar alguns gráficos xy para mostrar claramente a melhora do v4.1 na geração de imagens comparado ao v4 sob os mesmos parâmetros.

Esta versão nova é baseada na versão de depuração dos membros do v4. Devido à dificuldade de controlar o efeito dos membros no v4, a taxa de perfeição das mãos testada não atingiu minha expectativa. Então, eu e meu amigo 木猫猫猫 fizemos ajustes e melhorias no v4, e finalmente os membros do v4.1 alcançaram minhas expectativas. Irei publicar gráficos xy para mostrar claramente as melhorias do v4.1 em comparação ao v4 sob os mesmos parâmetros.

v5

Esta versão reduziu o material de treinamento. Após o insucesso do v4, iniciei outro projeto para testar minha ideia de usar pouco espaço de memória, treinando quatro estilos de arte diferentes para o lora adaptado ao T-ponynai3. O modelo original também foi carregado no civitai. Após testar a adaptabilidade, comecei a treinar esses quatro estilos de arte como aditivos no T-ponynai3-v5. Surpreendentemente, a textura das linhas do v5 melhorou muito, provavelmente por treinamento com material muito delicado. Para marcar estes quatro estilos, usei prompts style_1 a style_4. Infelizmente, por algum motivo, esses quatro estilos não foram separados ou tiveram efeito fraco, mas se integraram bem ao estilo original. Apesar de não atingir suporte a múltiplos estilos, elevou a textura do estilo original nai3 a outro nível. Talvez na próxima versão isso seja aprimorado. (Eu gosto muito de jogar, é difícil não poder jogar durante o treino.)

O material de treinamento foi reduzido. Devido ao fracasso da v4, comecei um novo projeto para testar minha ideia de baixo uso de memória, treinando quatro diferentes estilos de arte para lora adaptado ao T-ponynai3. O modelo original foi carregado também no civitai. Após testar a adaptação, comecei a treinar esses quatro estilos como aditivos no T-ponynai3-v5. Surpreendentemente, a textura das linhas do v5 melhorou muito, provavelmente pois treinei um material muito detalhado. Para marcar estes quatro estilos, usei os prompts style_1 a style_4. Infelizmente, por algum motivo, os quatro estilos não se separaram ou tiveram efeito fraco, se integrando bem ao estilo original. Apesar de não alcançar o suporte a múltiplos estilos, elevou a textura do estilo original nai3. Talvez a próxima versão avance mais. (Eu gosto muito de jogar, é difícil não poder jogar durante o treinamento.)

Farei um resumo das questões da versão v5.

Resumo de algumas questões da v5.

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

Tponynai3 - v55

Tponynai3 - v5

Usar este modelo