Empregada confusa usando óculos, vestido escuro com avental branco e touca de empregada, em pé contra um fundo psicodélico colorido vibrante com espirais e pontos de interrogação.
Um retrato digital detalhado de Luke Sullivan de Street Fighter 6 com traços marcantes, olhos verdes expressivos, cabelo estilizado e uma jaqueta estilizada com padrões laranja e azul.
Imagem de corpo inteiro de uma garota no estilo vibrante pop art vestindo roupas coloridas e em pé em um quarto simples e colorido brilhante.
Retrato elegante de Lara Croft em pé diante de um pôr do sol vibrante, representada em estilo de arte em tinta detalhado com tons fortes de vermelho e laranja.
Interior aconchegante de loja vintage apresentando uma papelaria e livraria japonesa retrô com sofá vintage, prateleiras de madeira cheias de livros e colecionáveis, plantas em vasos e iluminação quente de meados do século.

Prompts Recomendados

1girl, firefly (honkai: star rail), honkai (series), honkai: star rail, safe, casual, solo, looking at viewer, outdoors, smile, reaching towards viewer, night, masterpiece, high score, great score, absurdres

masterpiece, high score, great score, absurdres

1girl, sensitive, looking at viewer, solo, masterpiece, high score, great score, absurdres

Prompts Negativos Recomendados

lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry

lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry

Parâmetros Recomendados

samplers

Euler Ancestral (Euler a), Euler a

steps

25 - 28

cfg

4 - 7

resolution

2048x2048

Dicas

Use legendas baseadas em tags com o método de ordenação de tags para melhores resultados: 1girl/1boy/1other, nome do personagem, série, classificação, outras tags, depois aprimoramento de qualidade.

Adicione tags de aprimoramento de qualidade no final do prompt: masterpiece, high score, great score, absurdres.

Use prompts negativos recomendados para evitar artefatos e erros indesejados.

A escala CFG ótima está entre 4 e 7, 5 é recomendado.

Passos de amostragem ideais entre 25 e 28, com 28 recomendado.

Sampler preferido é Euler Ancestral (Euler a).

Observe limitações do modelo como dificuldade com anatomia complexa e renderização de texto.

Personagens recentes podem ter menor precisão devido a dados limitados de treinamento.

Destaques da Versão

Com o lançamento do Animagine XL 4.0 Opt (Otimizado), o modelo foi ainda mais refinado com um conjunto de dados adicional, melhorando seu desempenho para uso geral. Esta atualização traz várias melhorias:

  • Melhor estabilidade para saídas mais consistentes

  • Anatomia aprimorada com proporções mais precisas

  • Redução de ruído e artefatos nas gerações

  • Correção de problemas de baixa saturação, resultando em cores mais ricas

  • Melhoria na precisão das cores para resultados visualmente mais atraentes

Patrocinadores do Criador

Apoie o desenvolvimento do Animagine XL

Por favor, leia nosso Guia detalhado para prompts no Blog Cagliostrolab

Visão geral

Animagine XL 4.0, também estilizado como Anim4gine, é o modelo finalizado definitivo do SDXL temático de anime e a edição mais recente da série Animagine XL. Embora seja uma continuação, o modelo foi re-treinado a partir do Stable Diffusion XL 1.0 com um imenso conjunto de dados de 8,4 milhões de imagens em estilo anime diversificadas de várias fontes, com corte de conhecimento em 7 de janeiro de 2025, e afinado por aproximadamente 2650 horas de GPU. Semelhante à versão anterior, este modelo foi treinado utilizando o método de ordenação de tags para o treinamento de identidade e estilo.

Com o lançamento do Animagine XL 4.0 Opt (Otimizado), o modelo foi ainda mais refinado com um conjunto de dados adicional, melhorando a estabilidade, precisão anatômica, redução de ruído, saturação de cor e precisão geral das cores. Essas melhorias tornam o Animagine XL 4.0 Opt mais consistente e visualmente atraente mantendo a qualidade característica da série.

Registro de alterações

- 2025-02-13 – Adicionados Animagine XL 4.0 Opt e Animagine XL 4.0 Zero

  • Melhor estabilidade para saídas mais consistentes

  • Anatomia aprimorada com proporções mais precisas

  • Redução de ruído e artefatos nas gerações

  • Correção de problemas de baixa saturação, resultando em cores mais ricas

  • Melhoria na precisão das cores para resultados visualmente mais atraentes

- 2025-01-24 – Lançamento inicial

Detalhes do modelo

Diretrizes de uso

O resumo pode ser visto na imagem para a diretriz de prompts.

1. Estrutura do Prompt

O modelo foi treinado com legendas baseadas em tags e o método de ordenação de tags. Use este template estruturado:

1girl/1boy/1other, nome do personagem, de qual série, classificação, tudo o mais em qualquer ordem e termine com aprimoramento de qualidade

2. Tags para Aprimoramento de Qualidade

Adicione estas tags ao final do seu prompt:

masterpiece, high score, great score, absurdres

lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry

4. Configurações Ótimas

  • CFG Scale: 4-7 (5 recomendado)

  • Passos de Amostragem: 25-28 (28 recomendado)

  • Sampler Preferido: Euler Ancestral (Euler a)

6. Exemplo de Estrutura Final do Prompt

1girl, firefly \(honkai: star rail\), honkai \(series\), honkai: star rail, seguro, casual, solo, olhando para o espectador, ao ar livre, sorriso, estendendo a mão para o espectador, noite, masterpiece, high score, great score, absurdres

Tags Especiais

O modelo suporta diversas tags especiais que podem ser usadas para controlar diferentes aspectos do processo de geração de imagens. Essas tags são cuidadosamente ponderadas e testadas para fornecer resultados consistentes em diferentes prompts.

Tags de Qualidade

Tags de qualidade são controles fundamentais que influenciam diretamente a qualidade geral da imagem e o nível de detalhes. Tags de qualidade disponíveis:

  • masterpiece

  • best quality

  • low quality

  • worst quality

Tags de Pontuação

Tags de pontuação oferecem um controle mais sutil sobre a qualidade da imagem comparado às tags básicas de qualidade. Elas têm um impacto mais forte na direção da qualidade de saída neste modelo. Tags de pontuação disponíveis:

  • high score

  • great score

  • good score

  • average score

  • bad score

  • low score

Tags Temporais

As tags temporais permitem influenciar o estilo artístico baseado em períodos específicos ou anos. Isso pode ser útil para gerar imagens com características artísticas específicas de uma era. Tags de ano suportadas:

  • year 2005

  • year {n}

  • year 2025

Tags de Classificação

Tags de classificação ajudam a controlar o nível de segurança do conteúdo das imagens geradas. Essas tags devem ser usadas de forma responsável e em conformidade com as leis aplicáveis e políticas das plataformas. Classificações suportadas:

  • safe

  • sensitive

  • nsfw

  • explicit

Informações de Treinamento

O modelo foi treinado utilizando hardware de ponta e hiperparâmetros otimizados para garantir a mais alta qualidade de saída. Abaixo estão as especificações técnicas detalhadas e parâmetros usados durante o processo de treinamento:

Agradecimentos

Este projeto de longo prazo não teria sido possível sem o trabalho inovador, contribuições pioneiras e documentação abrangente fornecidos pela Stability AI, Novel AI e Waifu Diffusion Team. Somos especialmente gratos pela bolsa kickstarter da Main que nos permitiu avançar além da V2. Nesta iteração, gostaríamos de expressar nossa sincera gratidão a todos na comunidade pelo apoio contínuo, especialmente:

  1. Moescape AI: Nosso parceiro de colaboração inestimável na distribuição e teste do modelo

  2. Lesser Rabbit: Por fornecer bolsas essenciais para computação e pesquisa

  3. Kohya SS: Por desenvolver o abrangente framework de treinamento open-source

  4. discus0434: Por criar o Aesthetic Predictor 2.5 open-source líder na indústria

  5. Testadores iniciais: Pelo compromisso em fornecer feedback crítico e garantia rigorosa de qualidade

Contribuidores

Estendemos nosso sincero agradecimento aos membros dedicados da equipe que contribuíram significativamente para este projeto, incluindo, mas não se limitando a:

Modelo

Gradio

Relações, finanças e garantia de qualidade

Dados

Arrecadação de fundos está aberta novamente!

Estamos animados para apresentar novos métodos de arrecadação através do GitHub Sponsors para apoiar o treinamento, pesquisa e desenvolvimento do modelo. Seu apoio nos ajuda a ultrapassar os limites do que é possível com IA.

Você pode nos ajudar com:

  • Doar: Contribua via ETH ou USDT para o endereço abaixo.

  • Compartilhar: Divulgue nossos modelos e compartilhe suas criações!

  • Feedback: Nos informe como podemos melhorar.

Endereço para Doação:

ETH/USDT/USDC(e): 0xd8A1dA94BA7E6feCe8CfEacc1327f498fCcBFC0C

Github Sponsor: https://github.com/sponsors/cagliostrolab/

Por que usamos criptomoedas?:
Quando inicialmente abrimos arrecadação via Ko-fi e usando PayPal como método de retirada, nossa conta PayPal foi sinalizada e acabou banida, apesar de nossos esforços para explicar o propósito do projeto. Infelizmente, isso nos forçou a reembolsar todas as doações e nos deixou sem maneira confiável de receber apoio. Para evitar esses problemas e garantir transparência, agora usamos criptomoedas para arrecadação de fundos.

Quer doar em moeda não criptográfica?
Embora tenhamos tido uma experiência ruim com PayPal e você queira nos apoiar mas prefira não usar criptomoedas, sinta-se à vontade para entrar em contato conosco via Servidor Discord para métodos alternativos de doação.

Junte-se ao nosso Servidor Discord

Sinta-se à vontade para participar do nosso servidor discord: https://discord.gg/cqh9tZgbGc

Limitações

  • Formato do Prompt: Limitado a prompts textuais baseados em tags; entrada em linguagem natural pode não ser eficaz

  • Anatomia: Pode apresentar dificuldades com detalhes anatômicos complexos, particularmente poses das mãos e contagem de dedos

  • Geração de Texto: Renderização de texto em imagens não é suportada atualmente e não é recomendada

  • Novos Personagens: Personagens recentes podem ter menor precisão devido à disponibilidade limitada de dados de treinamento

  • Múltiplos Personagens: Cenas com múltiplos personagens podem exigir engenharia cuidadosa dos prompts

  • Resolução: Resoluções mais altas (ex.: 1536x1536) podem apresentar degradação já que o treinamento usou resolução original do SDXL

  • Consistência de Estilo: Pode exigir tags de estilo específicas pois o treinamento focou mais na preservação da identidade do que na consistência do estilo

Licença

Este modelo adota a original CreativeML Open RAIL++-M License da Stability AI sem modificações ou restrições adicionais. Os termos da licença permanecem exatamente como especificados na licença original do SDXL, que incluem:

  • Permitido: Uso comercial, modificações, distribuições, uso privado

  • Proibido: Atividades ilegais, geração de conteúdo nocivo, discriminação, exploração

  • ⚠️ Requisitos: Incluir cópia da licença, declarar alterações, preservar avisos

  • 📝 Garantia: Fornecida "NO ESTADO EM QUE SE ENCONTRA" sem garantias

Consulte a licença original do SDXL para os termos e condições completos e oficiais.

Anterior
Flux 1 Krea Dev FP8 - FP8_e4m3fn
Próximo
Alondra Vicious - Alondra Vicious

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

SDXL 1.0

Versão do modelo

v4 Opt

Hash do modelo

6327eca98b

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por Animagine XL 4.0 - v4 Opt

Imagens com anime

Imagens com modelo base

Imagens com sdxl