Animagine XL V3.1 - v3.1
Prompts Recomendados
masterpiece, best quality, very aesthetic, absurdres
outdoors, masterpiece, very aesthetic, best quality, absurdres
Prompts Negativos Recomendados
nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]
nsfw, worst quality, low quality
Parâmetros Recomendados
samplers
steps
cfg
resolution
other models
Parâmetros Recomendados para Alta Resolução
upscaler
upscale
steps
denoising strength
Dicas
Use o template de prompt estruturado: '1girl/1boy, nome do personagem, de qual série, todo o resto em qualquer ordem.'
Use tags especiais para qualidade, avaliação, ano e estética para direcionar os resultados da geração com mais precisão.
O modelo é otimizado para tags estilo Danbooru em vez de prompts em linguagem natural.
Use escala de CFG mais baixa, entre 5-7, e passos de amostragem abaixo de 30 para melhor qualidade.
As tags estéticas são derivadas de um modelo especializado ViT de classificação de imagem treinado com dados de anime.
Patrocinadores do Criador
Participe do Discord do Cagliostro Lab Server: https://discord.gg/cqh9tZgbGc
Se quiser doar ou comprar um café para nós, você pode doar Aqui
Muito obrigado ^_^
Animagine XL 3.1 é uma atualização da série Animagine XL V3, aprimorando a versão anterior, Animagine XL 3.0. Este modelo open-source de texto-para-imagem com tema anime foi melhorado para gerar imagens no estilo anime com qualidade superior. Inclui uma variedade maior de personagens de séries de anime conhecidas, um conjunto de dados otimizado e novas tags estéticas para melhor criação de imagem. Construído sobre Stable Diffusion XL, o Animagine XL 3.1 visa ser um recurso valioso para fãs de anime, artistas e criadores de conteúdo, produzindo representações precisas e detalhadas de personagens de anime.
Detalhes do Modelo
Desenvolvido por: Cagliostro Research Lab
Em colaboração com: SeaArt.ai
Tipo de modelo: Modelo generativo de texto-para-imagem baseado em Diffusion
Descrição do modelo: Animagine XL 3.1 gera imagens de anime de alta qualidade a partir de prompts textuais. Apresenta melhorias na anatomia das mãos, melhor compreensão de conceitos e interpretação avançada de prompts.
Licença: Fair AI Public License 1.0-SD
Fine-tuned a partir de: Animagine XL 3.0
Diretrizes de Uso
Ordenação das Tags
Para melhores resultados, recomenda-se seguir o template de prompt estruturado, pois o modelo foi treinado dessa forma:
1girl/1boy, nome do personagem, de qual série, todo o resto em qualquer ordem.
Tags Especiais
O Animagine XL 3.1 utiliza tags especiais para direcionar o resultado em qualidade, avaliação, data de criação e estética. Embora o modelo possa gerar imagens sem essas tags, usá-las ajuda a alcançar resultados melhores.
Modificadores de Qualidade
As tags de qualidade agora consideram tanto as pontuações quanto as avaliações das postagens para garantir uma distribuição equilibrada de qualidade. Refinamos os rótulos para maior clareza, como mudar “high quality” para “great quality”.
Modificador de Qualidade Critério de Pontuação
masterpiece > 95%
best quality > 85% & ≤ 95%
great quality > 75% & ≤ 85%
good quality > 50% & ≤ 75%
normal quality > 25% & ≤ 50%
low quality > 10% & ≤ 25%
worst quality ≤ 10%Modificadores de Avaliação
Também simplificamos nossas tags de avaliação para maior simplicidade e clareza, estabelecendo regras globais aplicáveis a diferentes modelos. Por exemplo, a tag “rating: general” é agora apenas “general”, e “rating: sensitive” foi condensada para “sensitive”.
Modificador de Avaliação Critério de Avaliação
safe Geral
sensitive Sensível
nsfw Questionável
explicit, nsfw ExplícitoModificador de Ano
Redefinimos o intervalo de anos para direcionar os resultados com maior precisão para estilos de arte de anime modernos ou vintage. Essa atualização simplifica os intervalos, focando na relevância para eras atuais e passadas.
Tag de Ano Intervalo de Ano
newest 2021 a 2024
recent 2018 a 2020
mid 2015 a 2017
early 2011 a 2014
oldest 2005 a 2010Tags Estéticas
Melhoramos nosso sistema de tags com tags estéticas para refinar a categorização de conteúdo baseada no apelo visual. Essas tags são derivadas de avaliações feitas por um modelo ViT (Vision Transformer) especializado em classificação de imagens, treinado especificamente com dados de anime. Para isso, utilizamos o modelo shadowlilac/aesthetic-shadow-v2, que avalia o valor estético do conteúdo antes do treinamento. Isso garante que cada conteúdo seja não só relevante e preciso, mas também visualmente atraente.
Tag Estética Intervalo de Pontuação
very aesthetic > 0.71
aesthetic > 0.45 & < 0.71
displeasing > 0.27 & < 0.45
very displeasing ≤ 0.27Configurações Recomendadas
Para guiar o modelo na geração de imagens com alta estética, use prompts negativos como:
nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]
Para resultados de maior qualidade, prefixe os prompts com:
masterpiece, best quality, very aesthetic, absurdres
Recomenda-se usar uma escala mais baixa de guia livre por classificador (CFG Scale) entre 5-7, passos de amostragem abaixo de 30 e usar Euler Ancestral (Euler a) como sampler.
Resolução Multi Aspecto
Este modelo suporta gerar imagens nas seguintes dimensões:
Dimensões Proporção
1024 x 1024 1:1 Quadrado
1152 x 896 9:7
896 x 1152 7:9
1216 x 832 19:13
832 x 1216 13:19
1344 x 768 7:4 Horizontal
768 x 1344 4:7 Vertical
1536 x 640 12:5 Horizontal
640 x 1536 5:12 VerticalAgradecimentos
O desenvolvimento e lançamento do Animagine XL 3.1 não teria sido possível sem as valiosas contribuições e suporte dos seguintes indivíduos e organizações:
SeaArt.ai: Nosso parceiro de colaboração e patrocinador.
Shadow Lilac: Pela disponibilização do modelo de classificação estética, aesthetic-shadow-v2.
Derrian Distro: Pelo scheduler personalizado de taxa de aprendizado, adaptado dos LoRA Easy Training Scripts.
Kohya SS: Pelos scripts de treinamento abrangentes.
Colaboradores do Cagliostrolab: Pela dedicação ao treinamento do modelo, gestão de projeto e curadoria de dados.
Testadores Iniciais: Pelos valiosos feedbacks e esforços na garantia de qualidade.
NovelAI: Pela abordagem inovadora à marcação estética, que serviu de inspiração para nossa implementação.
Agradecemos a todos pelo suporte e expertise na expansão dos limites da geração de imagens no estilo anime.
Limitações
Embora o Animagine XL 3.1 represente um avanço significativo na geração de imagens no estilo anime, é importante reconhecer suas limitações:
Focado em Anime: Este modelo foi projetado especificamente para gerar imagens no estilo anime e não é adequado para criar fotos realistas.
Complexidade do Prompt: Este modelo pode não ser adequado para usuários que esperam resultados de alta qualidade a partir de prompts curtos ou simples. O foco do treinamento foi na compreensão de conceitos em vez do refinamento estético, o que pode exigir prompts mais detalhados e específicos para alcançar a saída desejada.
Formato do Prompt: O Animagine XL 3.1 é otimizado para tags no estilo Danbooru e não para prompts em linguagem natural. Para melhores resultados, recomenda-se formatar os prompts usando as tags e sintaxe adequadas.
Anatomia e Renderização das Mãos: Apesar dos aprimoramentos feitos na anatomia e renderização das mãos, pode haver casos em que o modelo produza resultados subótimos nessas áreas.
Tamanho do Dataset: O conjunto de dados usado para treinar o Animagine XL 3.1 consiste em cerca de 870.000 imagens. Quando combinado com o dataset da iteração anterior (1,2 milhão), o total de dados de treinamento é em torno de 2,1 milhões de imagens. Embora seja substancial, este tamanho de dataset pode ainda ser considerado limitado para um modelo "definitivo" de anime.
Conteúdo NSFW: O Animagine XL 3.1 foi projetado para gerar conteúdo NSFW mais equilibrado. No entanto, é importante notar que o modelo ainda pode produzir resultados NSFW, mesmo sem ser explicitamente solicitado.
Ao reconhecer essas limitações, buscamos fornecer transparência e estabelecer expectativas realistas para os usuários do Animagine XL 3.1. Apesar dessas restrições, acreditamos que o modelo representa um avanço significativo na geração de imagens no estilo anime e oferece uma ferramenta poderosa para artistas, designers e entusiastas.
Licença
Baseado no Animagine XL 3.0, o Animagine XL 3.1 está sob a licença Fair AI Public License 1.0-SD, compatível com a licença dos modelos Stable Diffusion. Pontos principais:
Compartilhamento de Modificações: Se você modificar o Animagine XL 3.1, deve compartilhar tanto suas alterações quanto a licença original.
Acessibilidade do Código Fonte: Se sua versão modificada estiver acessível em rede, forneça um meio (como link para download) para que outros obtenham o código-fonte. Isso também se aplica a modelos derivados.
Termos de Distribuição: Qualquer distribuição deve ser sob esta licença ou outra com regras similares.
Conformidade: O não cumprimento deve ser corrigido em até 30 dias para evitar rescisão da licença, enfatizando transparência e adesão aos valores open-source.
A escolha desta licença visa manter o Animagine XL 3.1 aberto e modificável, alinhado ao espírito da comunidade open source. Protege contribuintes e usuários, incentivando uma comunidade colaborativa e ética open-source. Isso assegura que o modelo não só beneficie da contribuição coletiva, mas também respeite as liberdades do desenvolvimento open-source.
Finalmente, o servidor Cagliostro Lab aberto ao público https://discord.gg/cqh9tZgbGc
Sinta-se à vontade para entrar em nosso servidor discord.
Se você quiser doar ou comprar um café para nós, pode doar Aqui
Muito obrigado ^_^
Detalhes do Modelo
Tipo de modelo
Modelo base
Versão do modelo
Hash do modelo
Criador
Discussão
Por favor, faça log in para deixar um comentário.
