Retrato de uma mulher com cabelo vermelho flamejante e olhos vermelhos brilhantes cercados por chamas ondulantes, parte superior do corpo visível com ombros nus.
Vista em corpo inteiro de um estudante masculino vestido com uniforme gakuran preto e camisa verde, em pé ao ar livre em um passeio coberto de folhas de outono, olhando para cima, segurando uma bolsa, acompanhado por um gato preto.
Uma mulher loira madura com cabelo multicolorido e olhos ardentes brilhantes, usando óculos sem armação e um terno de negócios preto com camisa e gravata vermelhas, cercada por chamas e brasas giratórias.
Asuka Langley, uma personagem de anime, está confiante em um plugsuit vermelho brilhante com cabelo castanho longo, sorrindo entre prédios arruinados sob um céu azul.
Retrato em close de uma garota anime com orelhas de lobo, cabelo preto e laranja esvoaçante, olhos vermelhos, vestindo um vestido preto de ombro caído, parada em uma rua urbana chuvosa.
Um cavaleiro necromante de fantasia sombria em armadura ensanguentada segurando uma grande espada em posição de parry em um campo de batalha medieval encharcado pela chuva com uma grande lua vermelha cheia e estruturas em chamas ao fundo.
Um esboço vermelho e preto de um dragão ameaçando uma pessoa na chuva à noite.
Garota cyberpunk colorida com cabelo azul e laranja vestindo um bodysuit vibrante, retratada em estilo dinâmico de quadrinho com fundo abstrato.
Uma bela visão geral da paisagem com céu azul, planalto montanhoso com campos verdes, rodeado por nuvens e um vale distante.
Belo doodle pintado à mão em tinta e aquarela de uma menina de cabelo grisalho com twintails segurando uma galinha fofa, com fundo de chuva e nuvens gotejantes.
Guerreira futurista feminina com traje exoesqueleto no tema miko usando máscara de gás e empunhando uma lâmina vermelha brilhante, iluminada por luz cinematográfica em uma paisagem urbana escura.
Uma paisagem futurista iluminada por neon inspirada em anime cyberpunk dos anos 1990, apresentando uma figura solitária observando grandes prédios cobertos de neon entre colinas ao anoitecer no Texas.

Prompts Recomendados

masterpiece, best quality, very aesthetic, absurdres

outdoors, masterpiece, very aesthetic, best quality, absurdres

Prompts Negativos Recomendados

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

nsfw, worst quality, low quality

Parâmetros Recomendados

samplers

Euler Ancestral (Euler a), Euler a

steps

28 - 30

cfg

5 - 7

resolution

1024x1024, 1152x896, 896x1152, 1216x832, 832x1216, 1344x768, 768x1344, 1536x640, 640x1536, 896x1152, 1216x832

other models

animagine-xl-3.1 (9f86289b6a)

Parâmetros Recomendados para Alta Resolução

upscaler

Latent (nearest-exact), R-ESRGAN 4x+ Anime6B

upscale

1.5

steps

15 - 30

denoising strength

0.4 - 0.55

Dicas

Use o template de prompt estruturado: '1girl/1boy, nome do personagem, de qual série, todo o resto em qualquer ordem.'

Use tags especiais para qualidade, avaliação, ano e estética para direcionar os resultados da geração com mais precisão.

O modelo é otimizado para tags estilo Danbooru em vez de prompts em linguagem natural.

Use escala de CFG mais baixa, entre 5-7, e passos de amostragem abaixo de 30 para melhor qualidade.

As tags estéticas são derivadas de um modelo especializado ViT de classificação de imagem treinado com dados de anime.

Patrocinadores do Criador

Participe do Discord do Cagliostro Lab Server: https://discord.gg/cqh9tZgbGc

Se quiser doar ou comprar um café para nós, você pode doar Aqui

Muito obrigado ^_^

Animagine XL 3.1 é uma atualização da série Animagine XL V3, aprimorando a versão anterior, Animagine XL 3.0. Este modelo open-source de texto-para-imagem com tema anime foi melhorado para gerar imagens no estilo anime com qualidade superior. Inclui uma variedade maior de personagens de séries de anime conhecidas, um conjunto de dados otimizado e novas tags estéticas para melhor criação de imagem. Construído sobre Stable Diffusion XL, o Animagine XL 3.1 visa ser um recurso valioso para fãs de anime, artistas e criadores de conteúdo, produzindo representações precisas e detalhadas de personagens de anime.

Detalhes do Modelo

  • Desenvolvido por: Cagliostro Research Lab

  • Em colaboração com: SeaArt.ai

  • Tipo de modelo: Modelo generativo de texto-para-imagem baseado em Diffusion

  • Descrição do modelo: Animagine XL 3.1 gera imagens de anime de alta qualidade a partir de prompts textuais. Apresenta melhorias na anatomia das mãos, melhor compreensão de conceitos e interpretação avançada de prompts.

  • Licença: Fair AI Public License 1.0-SD

  • Fine-tuned a partir de: Animagine XL 3.0

Diretrizes de Uso

Ordenação das Tags

Para melhores resultados, recomenda-se seguir o template de prompt estruturado, pois o modelo foi treinado dessa forma:

1girl/1boy, nome do personagem, de qual série, todo o resto em qualquer ordem.

Tags Especiais

O Animagine XL 3.1 utiliza tags especiais para direcionar o resultado em qualidade, avaliação, data de criação e estética. Embora o modelo possa gerar imagens sem essas tags, usá-las ajuda a alcançar resultados melhores.

Modificadores de Qualidade

As tags de qualidade agora consideram tanto as pontuações quanto as avaliações das postagens para garantir uma distribuição equilibrada de qualidade. Refinamos os rótulos para maior clareza, como mudar “high quality” para “great quality”.


Modificador de Qualidade	Critério de Pontuação
masterpiece	        > 95%
best quality	        > 85% & ≤ 95%
great quality	        > 75% & ≤ 85%
good quality	        > 50% & ≤ 75%
normal quality	        > 25% & ≤ 50%
low quality	        > 10% & ≤ 25%
worst quality	        ≤ 10%

Modificadores de Avaliação

Também simplificamos nossas tags de avaliação para maior simplicidade e clareza, estabelecendo regras globais aplicáveis a diferentes modelos. Por exemplo, a tag “rating: general” é agora apenas “general”, e “rating: sensitive” foi condensada para “sensitive”.


Modificador de Avaliação	Critério de Avaliação
safe	            Geral
sensitive	    Sensível
nsfw	            Questionável
explicit, nsfw	    Explícito

Modificador de Ano

Redefinimos o intervalo de anos para direcionar os resultados com maior precisão para estilos de arte de anime modernos ou vintage. Essa atualização simplifica os intervalos, focando na relevância para eras atuais e passadas.


Tag de Ano	Intervalo de Ano
newest	        2021 a 2024
recent	        2018 a 2020
mid	        2015 a 2017
early	        2011 a 2014
oldest	        2005 a 2010

Tags Estéticas

Melhoramos nosso sistema de tags com tags estéticas para refinar a categorização de conteúdo baseada no apelo visual. Essas tags são derivadas de avaliações feitas por um modelo ViT (Vision Transformer) especializado em classificação de imagens, treinado especificamente com dados de anime. Para isso, utilizamos o modelo shadowlilac/aesthetic-shadow-v2, que avalia o valor estético do conteúdo antes do treinamento. Isso garante que cada conteúdo seja não só relevante e preciso, mas também visualmente atraente.


Tag Estética	       Intervalo de Pontuação
very aesthetic	       > 0.71
aesthetic	       > 0.45 & < 0.71
displeasing	       > 0.27 & < 0.45
very displeasing       ≤ 0.27

Configurações Recomendadas

Para guiar o modelo na geração de imagens com alta estética, use prompts negativos como:

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

Para resultados de maior qualidade, prefixe os prompts com:

masterpiece, best quality, very aesthetic, absurdres

Recomenda-se usar uma escala mais baixa de guia livre por classificador (CFG Scale) entre 5-7, passos de amostragem abaixo de 30 e usar Euler Ancestral (Euler a) como sampler.

Resolução Multi Aspecto

Este modelo suporta gerar imagens nas seguintes dimensões:

Dimensões	Proporção
1024 x 1024	1:1 Quadrado
1152 x 896	9:7
896 x 1152	7:9
1216 x 832	19:13
832 x 1216	13:19
1344 x 768	7:4 Horizontal
768 x 1344	4:7 Vertical
1536 x 640	12:5 Horizontal
640 x 1536	5:12 Vertical

Agradecimentos

O desenvolvimento e lançamento do Animagine XL 3.1 não teria sido possível sem as valiosas contribuições e suporte dos seguintes indivíduos e organizações:

  • SeaArt.ai: Nosso parceiro de colaboração e patrocinador.

  • Shadow Lilac: Pela disponibilização do modelo de classificação estética, aesthetic-shadow-v2.

  • Derrian Distro: Pelo scheduler personalizado de taxa de aprendizado, adaptado dos LoRA Easy Training Scripts.

  • Kohya SS: Pelos scripts de treinamento abrangentes.

  • Colaboradores do Cagliostrolab: Pela dedicação ao treinamento do modelo, gestão de projeto e curadoria de dados.

  • Testadores Iniciais: Pelos valiosos feedbacks e esforços na garantia de qualidade.

  • NovelAI: Pela abordagem inovadora à marcação estética, que serviu de inspiração para nossa implementação.

Agradecemos a todos pelo suporte e expertise na expansão dos limites da geração de imagens no estilo anime.

Limitações

Embora o Animagine XL 3.1 represente um avanço significativo na geração de imagens no estilo anime, é importante reconhecer suas limitações:

  1. Focado em Anime: Este modelo foi projetado especificamente para gerar imagens no estilo anime e não é adequado para criar fotos realistas.

  2. Complexidade do Prompt: Este modelo pode não ser adequado para usuários que esperam resultados de alta qualidade a partir de prompts curtos ou simples. O foco do treinamento foi na compreensão de conceitos em vez do refinamento estético, o que pode exigir prompts mais detalhados e específicos para alcançar a saída desejada.

  3. Formato do Prompt: O Animagine XL 3.1 é otimizado para tags no estilo Danbooru e não para prompts em linguagem natural. Para melhores resultados, recomenda-se formatar os prompts usando as tags e sintaxe adequadas.

  4. Anatomia e Renderização das Mãos: Apesar dos aprimoramentos feitos na anatomia e renderização das mãos, pode haver casos em que o modelo produza resultados subótimos nessas áreas.

  5. Tamanho do Dataset: O conjunto de dados usado para treinar o Animagine XL 3.1 consiste em cerca de 870.000 imagens. Quando combinado com o dataset da iteração anterior (1,2 milhão), o total de dados de treinamento é em torno de 2,1 milhões de imagens. Embora seja substancial, este tamanho de dataset pode ainda ser considerado limitado para um modelo "definitivo" de anime.

  6. Conteúdo NSFW: O Animagine XL 3.1 foi projetado para gerar conteúdo NSFW mais equilibrado. No entanto, é importante notar que o modelo ainda pode produzir resultados NSFW, mesmo sem ser explicitamente solicitado.

Ao reconhecer essas limitações, buscamos fornecer transparência e estabelecer expectativas realistas para os usuários do Animagine XL 3.1. Apesar dessas restrições, acreditamos que o modelo representa um avanço significativo na geração de imagens no estilo anime e oferece uma ferramenta poderosa para artistas, designers e entusiastas.

Licença

Baseado no Animagine XL 3.0, o Animagine XL 3.1 está sob a licença Fair AI Public License 1.0-SD, compatível com a licença dos modelos Stable Diffusion. Pontos principais:

  1. Compartilhamento de Modificações: Se você modificar o Animagine XL 3.1, deve compartilhar tanto suas alterações quanto a licença original.

  2. Acessibilidade do Código Fonte: Se sua versão modificada estiver acessível em rede, forneça um meio (como link para download) para que outros obtenham o código-fonte. Isso também se aplica a modelos derivados.

  3. Termos de Distribuição: Qualquer distribuição deve ser sob esta licença ou outra com regras similares.

  4. Conformidade: O não cumprimento deve ser corrigido em até 30 dias para evitar rescisão da licença, enfatizando transparência e adesão aos valores open-source.

A escolha desta licença visa manter o Animagine XL 3.1 aberto e modificável, alinhado ao espírito da comunidade open source. Protege contribuintes e usuários, incentivando uma comunidade colaborativa e ética open-source. Isso assegura que o modelo não só beneficie da contribuição coletiva, mas também respeite as liberdades do desenvolvimento open-source.

Finalmente, o servidor Cagliostro Lab aberto ao público https://discord.gg/cqh9tZgbGc

Sinta-se à vontade para entrar em nosso servidor discord.
Se você quiser doar ou comprar um café para nós, pode doar Aqui

Muito obrigado ^_^

Anterior
Robôs Cibernéticos - v1.0
Próximo
✨ Lazy Embeddings para TODOS os modelos illustrious NoobAI Pony SDXL LazyPositive LazyNegative (Positivo e Negativo e mais!) - lazyhand

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

SDXL 1.0

Versão do modelo

v3.1

Hash do modelo

e3c47aedb0

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por Animagine XL V3.1 - v3.1

Imagens com anime

Imagens com modelo base