modelos/AlbedoBase XL - v2.0

AlbedoBase XL - v2.0

7/31/2025

1:32:08 PM

Palavras-chave e Tags Relacionadas

2d,3d,albedobase xl,albedobond,tudo em um,anime,modelo base,checkpoint,cinematográfico,jogo,lora,fusão de modelos,fotorealista,sdxl 1.0,sdxl1.0,stable diffusion xl,definitivo,unificar,v2.0

Um núcleo bioluminescente brilhante dentro dos destroços de um planeta destruído flutuando de forma sinistra acima de uma paisagem rochosa escura no espaço.

Figura fotorrealista que se assemelha a um cogumelo fly agaric com um grande chapéu vermelho, em uma floresta mágica ao pôr do sol azul, cercada por cogumelos menores e folhagem vibrante.

Uma mulher em traje espacial azul está dentro de uma estação espacial, suas mãos erguidas expressivamente perto de uma grande janela que mostra a Terra ao fundo, capturada com cores profundas e textura sutil de granulação.

Robô endoesqueleto T800 vestindo uma camiseta branca rasgada e calça azul de moletom segurando um cesto contendo pele humana em um ambiente interno de lavanderia com iluminação cinematográfica e alto detalhe.

Floresta exótica vibrante em estilo LEGO com um rio cristalino fluindo, sob céus azuis brilhantes e brilho solar, detalhada com vegetação exuberante de LEGO.

Prompts Negativos Recomendados

strabismus,asymmetrical eyes,pixelated images

amateur quality, vague shapes, vague texture, wrong perspective, ugly, dowdy style

Parâmetros Recomendados

samplers

DPM++ 2M SDE Heun Karras

steps

cfg

clip skip

resolution

1024x1024, 720x1280

vae

Included VAE - default

Dicas

Se você encontrar um bug onde nada é gerado, mude para CLIP SKIP 2 ou modifique ligeiramente o prompt.

Usar prompts em formato de sentença em vez de uma lista de tags melhora a qualidade da imagem.

Deixar o campo de prompt negativo vazio geralmente produz as melhores imagens em qualidade.

Verifique a grade de especificações para configurações recomendadas antes de usar.

Experimente alguns prompts negativos para resolver problemas como olhos assimétricos ou pixelização.

Destaques da Versão

Escrevi um script personalizado para convergir os modelos existentes AlbedoBase XL em um só. Alinhando minuciosamente os pesos das linhas e colunas de todos os blocos U-NET e CLIP segundo uma fórmula única de minha autoria.

Patrocinadores do Criador

Se você achou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será totalmente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord) ㅤ|ㅤ 🛒 compreㅤ |ㅤ 🌱 doe

Se você achou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será totalmente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord) ㅤ|ㅤ 🛒 compreㅤ |ㅤ 🌱 doe

AlbedoBase XL (SFW&NSFW)

O refinador é desnecessário e o VAE está incluído.

OBJETIVO

O Stable Diffusion XL possui 3,5 bilhões de parâmetros (excluindo o refinador), cerca de 3,6 vezes mais que a versão SD v1.5. Acredito que esse número não é apenas um valor, mas um número que pode levar a uma melhoria significativa no desempenho.

Já faz um tempo desde que percebemos que o desempenho geral do SD v1.5 melhorou além da imaginação graças às contribuições explosivas da nossa comunidade. Portanto, estou trabalhando para completar este modelo AlbedoBase XL para reproduzir de forma ideal a melhoria de desempenho que ocorreu no v1.5 também nesta versão XL.

Meu objetivo é testar diretamente o desempenho de todos os Checkpoints e LoRAs que são publicamente carregados no Civitai, e mesclar apenas os recursos que são julgados ótimos após passar por vários filtros. Isso superará o desempenho das IAs geradoras de imagem de empresas como Midjourney.

Até o momento, AlbedoBase XL v3.1 Large já mesclou cerca de 200 checkpoints selecionados e 251 LoRAs.

REGISTRO

v3.1-Large

• Mesclou mais de 50 versões selecionadas recentes de modelos SDXL usando o script recursivo empregado no V3.

A grade de especificações (370,7 MB): download

v3-mini

Peço sinceras desculpas por mantê-los esperando tanto tempo.

Estive lidando com alguns assuntos pessoais e, enquanto trabalhava na nova versão, também enfrentei problemas de saúde. Mesmo ao escrever isto, ainda estou enfrentando esses desafios.

Senti que não seria suficiente fornecer apenas uma breve atualização, então peço sua compreensão enquanto compartilho esta mensagem mais detalhada.

Desde o lançamento da versão 2.0, tenho me dedicado a estudar aprendizado profundo independentemente. Não tenho um diploma formal e, além de uma aptidão modesta para programação, apenas minha formação é em artes. Como resultado, falta-me a base matemática e científica para alcançar avanços significativos, dado o tempo e esforço investidos. Apesar disso, a experiência de me envolver nesse estudo e pesquisa autodirigidos tem sido um tesouro inestimável na minha vida.

Recentemente, me deparei com uma ideia que pode ser um avanço significativo. Após reformular centenas de fórmulas e métodos desde a versão 2.0, consegui desenvolver um algoritmo bastante intrigante e bem-sucedido. O processo de mesclagem de modelos foi baseado no SDXL1.0 e SD1.5, juntamente com outros modelos cuidadosamente selecionados. Estes foram categorizados em cinco classificações primárias: “ANIME,” “REALISMO,” “ARTÍSTICO,” “NSFW,” e “BASE,” e alimentados no algoritmo de mesclagem como conjuntos de dados. Essa abordagem resultou em alguns resultados fascinantes.

No entanto, por mais desafiador que tenha sido o desenvolvimento do algoritmo, nada foi tão difícil quanto a fase de testes de desempenho. Minha saúde física e mental deteriorou-se significativamente durante esse período, a ponto de perceber que não poderia continuar esse trabalho sozinho. Isso me levou a decidir lançar esta versão.

E agora, estou entusiasmado em anunciar o lançamento da tão esperada versão AlbedoBaseXL V3 Mini. Embora este modelo seja uma mesclagem em escala menor, ele não é limitado a nenhuma área específica e apresenta desempenho notável em vários domínios. Ele tem o potencial de servir como um novo modelo base para SDXL1.0. (Para referência, meu algoritmo de mesclagem não é uma “mesclagem linear,” então pode essencialmente ser considerado um modelo afinado novo.)

Este modelo, juntamente com os modelos AlbedoBase existentes, é versátil e supera todas as versões anteriores em todos os aspectos. (O conteúdo NSFW, embora não extremo, oferece uma gama mais ampla de expressão em comparação com versões anteriores como a v2.1. Um modelo dedicado para mesclagem NSFW será lançado no futuro.)

Por outro lado, notei que muitos modelos compartilhados recentemente começaram a adotar licenças que proíbem mesclagem ou comercialização externa. Isso tem sido decepcionante, pois me impediu de usar alguns modelos realmente excelentes para mesclagem.

Gostaria de expressar minha sincera gratidão aos desenvolvedores de modelos que forneceram licenças gratuitas, permitindo que seus modelos de alta qualidade—produtos de considerável tempo e esforço—sejam usados para mesclagem.

Voltarei em breve.

Aguardo ansiosamente seus testes de desempenho em diversas áreas, incluindo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D e NSFW.

Como desenvolvedores de modelos, apenas plantamos as sementes. São vocês, os usuários e artistas, que as cultivam e trazem flores e frutos.

Obrigado, como sempre.

Para aqueles que desejam apoiar meu trabalho com uma pequena contribuição financeira, por favor considere usar os links abaixo. Atualmente, não consigo garantir emprego e enfrento um futuro incerto quanto ao meu sustento.

🌱 doe

A grade de especificações (380,5 MB): download

v2.1
Remesclagem e ajuste da v0.1 para 2.0 utilizando novo algoritmo e fórmula de mesclagem.

A grade de especificações (424,5 MB): download

v2.0

Gostaria de agradecer a todos que me ajudaram na fase AlbedoBase XL Pre. Sem vocês, a data de lançamento provavelmente teria sido muito mais tarde. Muito obrigado!

Escrevi um script personalizado para convergir os modelos existentes AlbedoBase XL em um só. Alinhando minuciosamente os pesos das linhas e colunas de todos os blocos U-NET e CLIP segundo uma fórmula única de minha autoria.
Se você encontrar um bug na geração de imagem (se nada for gerado), por favor mude para CLIP SKIP 2 ou modifique ligeiramente o prompt! Pode haver combinações de prompts que o CLIP não reconheça. Nesse caso, você pode trocar a ordem das palavras, usar palavras diferentes ou, mais simplesmente, mudar o CLIP SKIP. Eu trabalharei gradualmente para resolver esses problemas no futuro, como na v1.3.

A grade de especificações (403,5 MB): download

v1.3

Para ilustrar a qualidade associada à aleatoriedade do modelo, padronizei o valor da seed como '9' para todas as imagens de exibição destinadas à amostragem e procedi com suas gerações imediatas.
Especialmente nesta versão, devido ao impacto significativo dos prompts negativos, deixar o campo de prompt negativo vazio provavelmente resultará em qualidade ótima.

A grade de especificações (438,7 MB): download

Como pode ser visto, à medida que o número de Steps aumenta, torna-se disponível para todos os samplers, e a qualidade também melhora.
Devido ao efeito do LoRA que desenvolvi e mesclei, conforme descrito abaixo, usar prompts em formato de sentença em vez de prompts em tags (lista de palavras) está diretamente relacionado à melhoria da qualidade.

Mesclei 45 checkpoints e 7 LoRAs. Depois disso, mesclei AlbedoBase v0.4 e v0.3 na ordem, menos de 0~5%, para reativar os modelos mesclados diluídos que haviam ficado desatualizados.
Entre os 7 LoRAs, um foi criado por mim. Ele envolve a análise e anotação de legendas para um total de 174 fotos pictóricas de alta qualidade usando GPT4-V. Mesclar este LoRA resultou em imagens surpreendentemente claras e um entendimento impressionantemente excelente dos prompts.

Meus LoRAs autorais estão exclusivamente disponíveis para compra a meus apoiadores Ko-fi no nível Criativo ou superior.

v1.2

Mesclei os 22 checkpoints mais recentes.

A grade de especificações (565,6 MB): download

v1.1

Estabilizado.
Mais detalhado.
Se você acha que é um usuário avançado, recomendo a versão 1.0. Se a versão 1.0 encontrar as configurações certas, pode gerar trabalhos muito mais vívidos.

A grade de especificações (349,7 MB): download

v1.0

Mesclei 106 LoRAs.
Mesclei 19 Checkpoints.

O modelo pode produzir resultados diferentes dependendo das configurações escolhidas, portanto é importante verificar a grade de especificações antes de usá-lo.
- Descobri que usar alguns prompts negativos específicos pode ajudar a resolver o problema de olhos assimétricos ou imagens pixeladas. A Grade de Especificações pode variar dependendo do seu dispositivo CPU ou GPU, então use-a como uma referência geral. Experimente alguns prompts negativos para melhorar a qualidade (ex.; estrabismo). Descobri que é difícil satisfazer todas as configurações igualmente à medida que o número de LoRAs mescladas aumenta. No entanto, gostaria que você focasse nessa vantagem na versão 1.0, pois pode produzir trabalhos de qualidade incrível em vários aspectos com as configurações certas. Voltarei com uma versão mais estável no futuro.
Você pode encontrar valores úteis de configuração na vitrine ou procurando por outros.
Como sempre, é melhor deixar o prompt negativo em branco para obter os melhores resultados.
Esta v1.0 deu muito trabalho, então vou fazer uma pausa por um tempo. Espero que vocês gostem de usar o modelo e, se mesclá-lo, por favor compartilhe no Civitai gratuitamente. Assim, todos nós podemos continuar melhorando-o.

A grade de especificações (479,4 MB): download

v0.4

Mesclei 132 LoRAs.
Mesclei 4 Checkpoints.

A grade de especificações: download

v0.3

Melhorado em todos os samplers.
Alcançou realismo vívido.
Estabilizado.

A grade de especificações: download

v0.2

Melhorias significativas em clareza e detalhamento.
Melhoria na implementação de mãos e pés.
Melhorias estéticas importantes; composição, abstração, fluxo, luz e cor, etc.

v0.1

Após ajuste apropriado no modelo SDXL1.0, mesclagem meticulosa e proposital de mais de 40 modelos de alta qualidade disponíveis publicamente no Civitai.
O teste concentrou-se principalmente em garantir máxima qualidade com o mínimo número de tokens de prompt, e não foi confirmado o quanto a qualidade pode melhorar ao usar um grande número de tokens. (Por favor, realizem seus próprios testes e compartilhem os resultados)
Geralmente, resultados mais bonitos são alcançados na metade do caminho entre realidade e animação.
Apesar disso, ao usar um prompt apropriado, geralmente não há nada que não possa expressar. (Afirmo que possui valor abundante como modelo base que supera outros em mesclagem. Contudo, lembre-se que esta é atualmente a v0.1)

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

SocaRealism XL - 1.3

Foto Realista de Banco de Imagens - v2.0

Usar este modelo