modelos/AlbedoBase XL - v3.1-Large

AlbedoBase XL - v3.1-Large

João Silva

7/27/2025

1:21:32 AM

| Discussion|

Palavras-chave e Tags Relacionadas

Homem de desenho animado com expressão chocada, cabelo selvagem e encaracolado, óculos e barba por fazer, vestindo uma camisa xadrez amarela com gravata vermelha e suspensórios azuis em um fundo verde texturizado.

Uma miniatura de alpaca branca e fofinha com grandes olhos pretos, ao lado de uma pequena casa marrom impressa em 3D.

Uma arte vetorial digital vibrante no estilo William Wray mostrando um elefante tranquilo em forma de balão de ar colorido com um pinguim extravagante empoleirado no topo, cercado por balões multicoloridos contra um fundo de céu.

Gravura impressionista mostrando a silhueta de uma mulher de vestido e chapéu, parada à beira de um rio, olhando para um cachorro pequeno, com uma ponte clássica de Londres e o Big Ben ao fundo.

Uma silhueta em estilo recorte de papel de uma mulher dançando tango, elaboradamente criada em arte de aço com influência kirigami, envolvida por formas abstratas em espiral.

Uma ilustração colorida no estilo de romance gráfico mostrando gigantes tubarões-de-areia com dentes afiados atacando pequenos barcos de pesca remando por um mar parecido com deserto com pequenas figuras humanas ao redor.

Prompts Recomendados

(incredibly ultra lifelike, perfect professional precise, masterpiece, extremely beautiful, light and shadow

Prompts Negativos Recomendados

strabismus

(worst quality, normal quality, score_3, score_4

Parâmetros Recomendados

samplers

Euler a, DPM++ 2M SDE Heun

steps

24 - 72

cfg

3 - 9.5

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Dicas

Se a geração da imagem não produzir resultado, tente mudar para CLIP SKIP 2 ou modifique o prompt ligeiramente alterando a ordem ou as palavras.

Usar prompts em formato de frase tende a melhorar a qualidade da imagem mais do que prompts em lista de tags.

Deixar o campo de prompt negativo vazio frequentemente resulta em melhores imagens.

Verifique a grade de especificações para configurações ideais antes do uso.

Experimente alguns prompts negativos específicos como 'estrabismo' para resolver problemas como olhos assimétricos ou pixelização.

Destaques da Versão

• Mesclou mais de 50 versões selecionadas dos modelos SDXL usando o script recursivo empregado na V3.

Patrocinadores do Criador

Se você encontrou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será totalmente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord) ㅤ|ㅤ 🛒 comprar ㅤ|ㅤ 🌱 doar

Se você encontrou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será totalmente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord) ㅤ|ㅤ 🛒 comprarㅤ |ㅤ 🌱 doar

AlbedoBase XL (SFW&NSFW)

O refiner não é necessário e o VAE está incluído.

OBJETIVO

Stable Diffusion XL tem 3,5 bilhões de parâmetros (excluindo o Refiner), o que é cerca de 3,6 vezes mais que a versão SD v1.5. Acredito que isso não seja apenas um número, mas um número que pode levar a uma melhoria significativa no desempenho.

Faz tempo que percebemos que o desempenho geral do SD v1.5 melhorou além da imaginação graças às contribuições explosivas da nossa comunidade. Portanto, estou trabalhando para completar este modelo AlbedoBase XL a fim de reproduzir de forma ideal a melhoria de desempenho que ocorreu na v1.5 também nesta versão XL.

Meu objetivo é testar diretamente o desempenho de todos os Checkpoints e LoRAs que são publicamente enviados ao Civitai, e mesclar somente os recursos avaliados como ótimos após passar por vários filtros. Isso superará o desempenho de IA geradoras de imagens de empresas como Midjourney.

Até o momento, o AlbedoBase XL v3.1 Large tem mesclado cerca de 200 checkpoints selecionados e 251 LoRAs.

REGISTRO

v3.1-Large

• Mesclou mais de 50 versões selecionadas dos modelos SDXL usando o script recursivo empregado na V3.

A grade de especificações(370.7 MB): baixar

v3-mini

Peço sinceras desculpas por mantê-los esperando por tanto tempo.

Estive lidando com algumas questões pessoais e, enquanto trabalhava na nova versão, também enfrentei problemas de saúde. Mesmo enquanto escrevo isso, ainda estou lutando com esses desafios.

Senti que não seria suficiente apenas fornecer uma atualização breve, então peço gentilmente sua compreensão enquanto compartilho esta mensagem mais detalhada.

Desde o lançamento da versão 2.0, tenho me dedicado a estudar aprendizado profundo de forma independente. Não tenho um diploma formal e, além de uma aptidão modesta para programação, apenas meu histórico é nas artes. Como resultado, careço da base matemática e científica para alcançar avanços significativos, dado o tempo e esforço investidos. Ainda assim, a experiência de me imergir nesses estudos e pesquisas autodirigidas tem sido um tesouro inestimável na minha vida.

Recentemente, encontrei uma ideia que pode ser um avanço significativo. Depois de trabalhar centenas de fórmulas e métodos desde a versão 2.0, consegui desenvolver um algoritmo bastante intrigante e bem-sucedido. O processo de mesclagem do modelo foi baseado em SDXL1.0 e SD1.5, junto com outros modelos cuidadosamente selecionados. Estes foram categorizados em cinco classificações principais: “ANIME,” “REALISMO,” “ARTÍSTICO,” “NSFW,” e “BASE,” e alimentados no algoritmo de mesclagem como conjuntos de dados. Esta abordagem resultou em alguns desfechos fascinantes.

No entanto, tão desafiador quanto o desenvolvimento do algoritmo foi, nada foi tão difícil quanto a fase de testes de desempenho. Minha saúde física e mental deteriorou-se significativamente durante este período, a ponto de perceber que não poderia continuar esse trabalho sozinho. Foi isso que me levou a decidir liberar esta versão.

E agora, estou entusiasmado em anunciar o lançamento da tão aguardada versão AlbedoBaseXL V3 Mini. Embora este modelo seja uma mesclagem em escala menor, não se limita a nenhuma área específica e tem desempenho notavelmente bom em vários domínios. Tem potencial para servir como um novo modelo base para SDXL1.0. (Para referência, meu algoritmo de mesclagem não é uma “mesclagem linear,” então pode ser considerado essencialmente um novo modelo ajustado).

Este modelo, junto com os modelos AlbedoBase existentes, é versátil e supera todas as versões anteriores em todos os aspectos. (O conteúdo NSFW, embora não extremo, oferece uma gama mais ampla de expressão em comparação com versões anteriores como a v2.1. Um modelo de mesclagem NSFW dedicado será lançado no futuro.)

Por outro lado, percebi que muitos modelos compartilhados recentemente começaram a adotar licenças que proíbem mesclagens ou comercialização externa. Isso tem sido uma decepção, pois me impediu de usar alguns modelos realmente excelentes para mesclagem.

Gostaria de expressar minha profunda gratidão aos desenvolvedores dos modelos que forneceram licenças gratuitas, permitindo que seus modelos de alta qualidade — produtos de muito tempo e esforço — sejam usados para mesclagem.

Voltarei em breve.

Aguardo ansiosamente seus testes de desempenho em uma ampla gama de áreas, incluindo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D e NSFW.

Como desenvolvedores de modelos, nós apenas plantamos as sementes. Vocês, usuários de modelos e artistas, cultivam-nas e fazem florescer frutos.

Obrigado, como sempre.

Para quem deseja apoiar meu trabalho com uma pequena contribuição financeira, por favor considere usar os links abaixo. Atualmente, não consigo garantir emprego e enfrento um futuro incerto em relação ao meu sustento.

🌱 doar

A grade de especificações(380.5 MB): baixar

v2.1
Remesclagem e ajuste do v0.1 para 2.0 usando novo algoritmo e fórmula de mesclagem.

A grade de especificações(424.5 MB): baixar

v2.0

Gostaria de agradecer a todos que me ajudaram no lado AlbedoBase XL Pre. Sem vocês, a data de lançamento provavelmente teria sido bem mais tarde. Muito obrigado!

Escrevi um script personalizado para convergir os modelos AlbedoBase XL existentes em um só. Alinhando minuciosamente os pesos das linhas e colunas de todos os blocos U-NET e CLIP segundo uma fórmula única minha.
Se você encontrar um bug na geração de imagens (se nada for gerado), por favor mude para CLIP SKIP 2 ou modifique o prompt ligeiramente! Pode haver combinações de prompts que o CLIP não reconhece. Nesse caso, você pode mudar a ordem das palavras, usar palavras diferentes ou, mais simplesmente, mudar o CLIP SKIP. Eu irei gradualmente resolver esses problemas no futuro como na v1.3.

A grade de especificações(403.5 MB): baixar

v1.3

Para ilustrar a qualidade associada à aleatoriedade do modelo, padronizei o valor da seed em '9' para todas as imagens de demonstração destinadas à amostragem e procedi à sua geração imediata.
Especialmente com esta versão, devido ao impacto significativo dos prompts negativos, deixar o campo de prompt negativo vazio é provavelmente para produzir a boa qualidade.

A grade de especificações(438.7 MB): baixar

Como você pode ver, conforme o número de Steps aumenta, fica disponível para todos os samplers e a qualidade também melhora.
Devido ao efeito do LoRA que desenvolvi e mesclei, conforme descrito abaixo, usar prompts em formato de frase em vez de prompts de tag (lista de palavras) está diretamente relacionado à melhora na qualidade.

Mesclei 45 checkpoints e 7 LoRAs. Após isso, mesclei ordem AlbedoBase v0.4 e v0.3, entre 0~5%, para reanimar os modelos mesclados diluídos que tinham se tornado obsoletos.
Entre as 7 LoRAs, uma foi criada por mim. Envolve analisar e anotar legendas para um total de 174 fotos pictóricas de alta qualidade usando GPT4-V. Mesclar este LoRA resultou em imagens surpreendentemente claras e uma compreensão impressionante dos prompts.

Meus LoRAs auto-criados estão exclusivamente disponíveis para compra aos meus apoiadores do Ko-fi no nível Creative ou superior.

v1.2

Mesclou os 22 checkpoints mais recentes.

A grade de especificações(565.6 MB): baixar

v1.1

Estabilizado.
Mais detalhado.
Se você acha que é um usuário avançado, recomendo a versão 1.0. Se a versão 1.0 encontrar as configurações certas, pode produzir trabalhos muito mais vívidos.

A grade de especificações(349.7 MB): baixar

v1.0

Mesclou 106 LoRAs.
Mesclou 19 Checkpoints.

O modelo pode produzir resultados diferentes dependendo das configurações escolhidas, então é importante verificar a grade de especificações antes de usá-lo.
- Descobri que usar alguns prompts negativos específicos pode ajudar a resolver o problema de olhos assimétricos ou imagens pixeladas. A grade de especificações pode variar dependendo do seu dispositivo CPU ou GPU, então use-a como referência geral. Experimente alguns prompts negativos para melhorar a qualidade (ex; estrabismo). Descobri que é difícil satisfazer todas as configurações igualmente conforme aumenta o número de LoRA mescladas. Porém, gostaria que você focasse nessa vantagem na versão 1.0, pois pode produzir trabalhos de qualidade incrível em vários aspectos com as configurações certas. Voltarei com uma versão mais estável no futuro.
Você pode encontrar valores de configuração úteis na vitrine ou procurando outros.
Como sempre, é melhor deixar o prompt negativo vazio para melhores resultados.
Este v1.0 foi muito trabalho, então vou fazer uma pausa por um tempo. Espero que gostem de usar o modelo e, se mesclarem, por favor compartilhem no Civitai gratuitamente. Assim, todos podemos continuar melhorando.

A grade de especificações(479.4 MB): baixar

v0.4

Mesclou 132 LoRAs.
Mesclou 4 Checkpoints.

A grade de especificações: baixar

v0.3

Melhorado em todos os samplers.
Alcançou realismo vívido.
Estabilizado.

A grade de especificações: baixar

v0.2

Melhorias significativas em clareza e detalhes.
Melhor implementação de mãos e pés.
Grandes melhorias estéticas; composição, abstração, fluxo, luz e cor, etc.

v0.1

Após ajuste apropriado no modelo SDXL1.0, mesclou meticulosamente e propositalmente mais de 40 modelos de alta qualidade disponíveis publicamente no Civitai.
Os testes focaram principalmente em garantir qualidade máxima com o mínimo de tokens no prompt, e não foi confirmado o quanto a qualidade pode melhorar usando um grande número de tokens. (Por favor, realizem seus próprios testes e compartilhem os resultados)
Normalmente, os resultados mais bonitos são obtidos no ponto médio entre realidade e animação.
No entanto, usando um prompt apropriado, normalmente não há nada que ele não possa expressar. (Afirmo que ele possui valor abundante como modelo base que supera outros em mesclagem. Contudo, tenha em mente que essa é atualmente a v0.1)

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

Shuttle 3 Diffusion - bf16

WaduStyle - V1

Usar este modelo