Vanillaware Style PonyXL - v0.1
Palavras-chave e Tags Relacionadas
Prompts Recomendados
score_9, score_8_up, score_7_up, <lora:vanillawareStyle:1>, 1girl, solo, looking at viewer, full body, light particles
Prompts Negativos Recomendados
thumbnail,3d
3d, bad anatomy, watermark
Parâmetros Recomendados
samplers
steps
cfg
clip skip
resolution
vae
other models
Parâmetros Recomendados para Alta Resolução
upscaler
upscale
denoising strength
Dicas
Compose prompts na ordem: [traços do personagem] + [estilo] + [expressão] + [roupa] + [câmera e ação] + [fundo], modificando conforme necessário.
Se a imagem estiver borrada, adicione "thumbnail" ao prompt negativo e aumente seu peso para melhorar a clareza.
Adicionar '3d' ao prompt negativo pode melhorar os resultados.
Adicionar tags como 'realistic' ou 'realism' pode realçar as características da figura.
Ajuste o peso recomendado entre 1.0 e 0.6 para a aparência desejada do personagem.
Melhore a qualidade do conjunto de dados e use etiquetas cuidadosas para melhor treinamento.
Coloque as tags das imagens de qualidade inferior nos prompts negativos para reduzir sua influência durante a geração.
O treinamento deste modelo e as imagens que ele gera são apenas para fins de aprendizado.
Eu não fiz nada, sou apenas um transportador.
Este modelo é mais parecido com um pacote de personagens, e seu efeito colateral é o estilo que ele traz.
Foram mais de 30 horas de tentativas repetidas, durante as quais quase desisti, mas no final consegui um efeito mais equilibrado. O mais importante é que minha hipótese de treinamento foi verificada. No futuro, posso organizar essas experiências em um artigo.
Mas problemas com mãos ruins ainda existem.
Palavra de ativação: vanillastyle
Você pode encontrar exemplos de prompts nas imagens acima.
O prompt da versão anterior do modelo também funcionava na maioria das vezes.
Meus prompts são basicamente compostos na ordem de [traços do personagem] + [estilo] + [expressão] + [roupa] + [câmera e ação] + [fundo], e você pode deletar ou modificar conforme necessário.
Se houver uma situação especialmente borrada, considere adicionar "thumbnail" ao prompt negativo e aumentar o peso até que a imagem fique clara.
Adicionar '3d' ao prompt negativo pode trazer um resultado melhor, enquanto adicionar tags como 'realistic' ou 'realism' pode realçar as características da figura.
Peso recomendado: 1.0~0.6, ajuste conforme necessário até que a aparência do personagem atenda às suas exigências.
Recomendação para valor de upscale por volta de 1.2~2.0, força de denoise 0.2
O conjunto de dados focou principalmente nas obras de George Kamitani.
20240907v0.2
Nesta versão, etiquetei mais imagens, e para o restante, removi suas tags, deixando apenas as palavras de ativação para evitar conflitos com as tags cuidadosamente feitas. (Este método pode estar incorreto.)
Durante o processo de treinamento, houve muitos casos em que as imagens do conjunto de dados não foram representadas com precisão através do prompt. Tentei mudar várias tags e retreinar, com o mesmo resultado. A repetitividade dessas imagens no conjunto de dados também não é alta, faltando continuidade.
Por fim, li um artigo que mencionava aumentar o número de repetições de treinamento para certos personagens para evitar que o modelo não aprenda suficientemente essas imagens.
Portanto, coloquei todas as imagens únicas no conjunto de dados em uma subpasta, defini as repetições de treinamento para 2, e deixei as imagens já bem aprendidas inalteradas.
No entanto, como há vários problemas de qualidade com essas imagens descontínuas, e ainda não as reparei, aumentar suas repetições de treinamento teve certo impacto no estilo geral.
Para a próxima versão melhorar, a abordagem mais fundamental é melhorar a qualidade do conjunto de dados, e também fazer bom uso das técnicas de legendagem, adicionando a mesma tag nas imagens de qualidade um pouco inferior, e então colocando todas elas no prompt negativo ao rodar o modelo.
20240715v0.1
Este modelo só pode ser considerado como v0.1, não é muito fácil de usar normalmente, e eu acho que o melhor é etiquetar mais imagens do conjunto de dados em detalhes para melhores resultados. No futuro, posso completar lentamente o treinamento deste modelo.
O desempenho desta versão não é muito bom, as imagens geradas podem frequentemente parecer caóticas.
Recolhi mais de 100 imagens como conjunto de dados, mas o número ainda é muito grande para etiquetagem manual. Inicialmente usei wd1.4 para etiquetar todas as imagens, mas a qualidade das etiquetas ainda não foi boa, (talvez meu uso não tenha sido correto, e eu recebo sugestões de todos).
Como quero ver os resultados rapidamente, para este conjunto de dados, só etiquetei manualmente algumas imagens que atendiam às minhas preferências pessoais, então o efeito da saída do modelo será melhor para essas imagens.
Detalhes do Modelo
Discussão
Por favor, faça log in para deixar um comentário.






