modelos/AlbedoBase XL - v1.3

AlbedoBase XL - v1.3

João Silva

7/22/2025

1:48:57 PM

| Discussion|

Palavras-chave e Tags Relacionadas

Ayanami Rei como um cyborg com armadura branca e cabelo azul curto, posando confiante em uma rua cyberpunk iluminada por néon em Nova York.

Retrato hiper-realista de uma mulher idosa que se assemelha a Amelia Earhart, vestida com moda dos anos 1970, piscando para a câmera enquanto segura uma xícara de café branca em um ambiente interno aconchegante.

Uma jovem cheerleader morena dançando com saia verde e top branco com detalhes vermelhos em campo de estádio de futebol, atmosfera vibrante

Jovem torcedora morena dançando com roupa esportiva azul e vermelha vibrante em um estádio de futebol com público ao fundo

Uma cheerleader vestindo uma camiseta esportiva vermelha e saia plissada branca dança em um campo de futebol com uma multidão no estádio ao fundo.

Pintura realista de uma jovem com cabelos longos usando minissaia branca e blusa azul claro, em uma pista de boliche com bolas de boliche ao lado.

Prompts Negativos Recomendados

strabismus

Parâmetros Recomendados

samplers

DPM++ 2M SDE Heun Exponential

steps

cfg

resolution

720x1280, 1024x1024

vae

included VAE

Dicas

Se a geração de imagens não produzir resultado, tente mudar para CLIP SKIP 2 ou modifique o prompt levemente alterando a ordem ou as palavras.

Usar prompts em forma de sentença tende a melhorar mais a qualidade da imagem do que prompts em lista de tags.

Deixar o campo de prompt negativo vazio geralmente gera melhores resultados de imagem.

Verifique a grade de especificações para configurações ideais antes de usar.

Experimente alguns prompts negativos específicos, como 'estrabismo', para resolver problemas como olhos assimétricos ou pixelização.

Destaques da Versão

v1.3

Para ilustrar a qualidade associada à aleatoriedade do modelo, padronizei o valor de seed em '9' para todas as imagens de vitrine destinadas à amostragem e procedi com sua geração imediata.
Especialmente nesta versão, devido ao impacto significativo dos prompts negativos, deixar o campo de prompt negativo vazio provavelmente produz a melhor qualidade.

A grade de especificações (438.7 MB): download

Como você pode ver, conforme o número de Steps aumenta, fica disponível para todos os samplers, e a qualidade também melhora.
Devido ao efeito do LoRA que desenvolvi e mesclei, como descrito abaixo, usar prompts em forma de sentença em vez de prompts em forma de tag (lista de palavras) está diretamente relacionado à melhoria da qualidade.

Mesclei 45 checkpoints e 7 LoRAs. Depois, mesclei AlbedoBase v0.4 e v0.3 em ordem, menos de 0~5%, para reativar os modelos mesclados diluídos que estavam desatualizados.
Entre os 7 LoRAs, um foi criado por mim. Envolve a análise e anotação de legendas para um total de 174 fotos ilustrativas de alta qualidade usando GPT4-V. A fusão desse LoRA resultou em imagens surpreendentemente nítidas e um entendimento impressionante dos prompts.

Meus LoRAs criados por mim estão disponíveis exclusivamente para compra por meus apoiadores Ko-fi no nível Creative ou superior aqui. Planejo lançar mais atualizações futuramente. Os preços variam de $10 a $50.

Patrocinadores do Criador

Se você encontrou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será totalmente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord) ㅤ|ㅤ 🛒 comprar ㅤ|ㅤ 🌱 doar

Se você encontrou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será totalmente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord) ㅤ|ㅤ 🛒 comprarㅤ |ㅤ 🌱 doar

AlbedoBase XL (SFW&NSFW)

O refiner não é necessário, e o VAE está incluído.

OBJETIVO

Stable Diffusion XL possui 3,5 bilhões de parâmetros (excluindo o Refiner), cerca de 3,6 vezes mais que a versão SD v1.5. Eu acredito que isso não é apenas um número, mas um número que pode levar a uma melhoria significativa no desempenho.

Já faz um tempo desde que percebemos que o desempenho geral do SD v1.5 melhorou além da imaginação graças às contribuições explosivas de nossa comunidade. Portanto, estou trabalhando para completar este modelo AlbedoBase XL para reproduzir de forma ideal a melhora de desempenho que ocorreu na v1.5 também nesta versão XL.

Meu objetivo é testar diretamente o desempenho de todos os Checkpoints e LoRAs que são publicamente carregados no Civitai, e mesclar apenas os recursos julgados ótimos após passarem por vários filtros. Isso superará o desempenho da IA geradora de imagens de empresas como Midjourney.

Até o momento, AlbedoBase XL v3.1 Large fundiu cerca de 200 checkpoints selecionados e 251 LoRAs.

REGISTRO

v3.1-Large

• Mais de 50 versões selecionadas dos modelos SDXL foram fundidas usando o script recursivo empregado na V3.

A grade de especificações (370.7 MB): download

v3-mini

Peço sinceras desculpas por deixá-los esperando tanto tempo.

Tenho lidado com alguns assuntos pessoais e, enquanto trabalhava na nova versão, também enfrentei problemas de saúde. Mesmo enquanto escrevo isto, ainda estou lutando com esses desafios.

Senti que não seria suficiente apenas fornecer uma breve atualização, por isso peço sua compreensão enquanto compartilho esta mensagem mais detalhada.

Desde o lançamento da versão 2.0, tenho me dedicado ao estudo autodidata de deep learning. Não possuo um diploma formal, e, além de uma modesta aptidão para programação, minha formação é nas artes. Como resultado, me falta a base matemática e científica para alcançar grandes avanços, dado o tempo e esforço investidos. Apesar disso, a experiência de me aprofundar neste estudo e pesquisa autônoma tem sido um tesouro inestimável em minha vida.

Recentemente, deparei-me com uma ideia que pode ser um avanço significativo. Depois de reformular centenas de fórmulas e métodos desde a versão 2.0, consegui desenvolver um algoritmo bastante intrigante e bem-sucedido. O processo de fusão do modelo foi baseado no SDXL1.0 e SD1.5, junto com outros modelos cuidadosamente selecionados. Eles foram categorizados em cinco classificações principais: “ANIME,” “REALISMO,” “ARTÍSTICO,” “NSFW,” e “BASE,” e alimentados no algoritmo de fusão como conjuntos de dados. Essa abordagem resultou em alguns resultados fascinantes.

No entanto, por mais desafiador que tenha sido o desenvolvimento do algoritmo, nada foi tão árduo quanto a fase de testes de desempenho. Minha saúde física e mental deteriorou-se significativamente durante esse período, ao ponto de perceber que não conseguiria continuar esse trabalho sozinho. Isso foi o que me levou a decidir liberar essa versão.

E agora, estou entusiasmado em anunciar o lançamento da tão aguardada versão AlbedoBaseXL V3 Mini. Embora este modelo seja uma fusão em menor escala, não está limitado a nenhuma área específica e apresenta desempenho notavelmente bom em vários domínios. Tem potencial para servir como um novo modelo base para SDXL1.0. (Para referência, meu algoritmo de fusão não é uma “fusão linear,” então ele pode ser considerado essencialmente um novo modelo afinado.)

Este modelo, juntamente com os modelos AlbedoBase existentes, é versátil e supera todas as versões anteriores em todos os aspectos. (O conteúdo NSFW, embora não extremo, oferece uma gama mais ampla de expressão comparado com versões anteriores como a v2.1. Um modelo específico para fusão NSFW será lançado futuramente.)

Por outro lado, notei que muitos modelos compartilhados recentemente passaram a adotar licenças que proíbem fusão ou comercialização externa. Isso foi uma decepção, pois me impediu de usar alguns modelos realmente excelentes para fusão.

Gostaria de expressar minha sincera gratidão aos desenvolvedores de modelos que forneceram licenças gratuitas, permitindo que seus modelos de alta qualidade — produtos de considerável tempo e esforço — sejam usados para fusão.

Voltarei em breve.

Espero ansiosamente pelos seus testes de desempenho em várias áreas, incluindo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D e NSFW.

Como desenvolvedores de modelos, nós apenas plantamos as sementes. É, em última análise, você, os usuários e artistas de modelos, quem as cultiva e faz florescer.

Obrigado, como sempre.

Para quem desejar apoiar meu trabalho com uma pequena contribuição financeira, por favor considere usar os links abaixo. Atualmente não consigo obter emprego e enfrento um futuro incerto quanto ao meu sustento.

🌱 doar

A grade de especificações (380.5 MB): download

v2.1
Re-fusão e ajuste da v0.1 para 2.0 usando novo algoritmo de fusão e fórmula.

A grade de especificações (424.5 MB): download

v2.0

Gostaria de agradecer a todos que me ajudaram no lado AlbedoBase XL Pre. Sem vocês, a data de lançamento provavelmente teria sido muito mais tarde. Muito obrigado!

Escrevi um script personalizado para convergir os modelos AlbedoBase XL existentes em um só. Alinhando delicadamente os pesos das linhas e colunas de todos os blocos U-NET e CLIP segundo uma fórmula única minha.
Se você encontrar um erro na geração de imagens (se nada for gerado), tente mudar para CLIP SKIP 2 ou modifique o prompt levemente! Pode haver combinações de prompts que o CLIP não reconhece. Neste caso, você pode mudar a ordem das palavras, usar palavras diferentes ou, mais simplesmente, alterar o CLIP SKIP. Trabalharei gradualmente para resolver esses problemas no futuro como na v1.3.

A grade de especificações (403.5 MB): download

v1.3

Para ilustrar a qualidade associada à aleatoriedade do modelo, padronizei o valor de seed em '9' para todas as imagens de vitrine destinadas à amostragem e procedi com sua geração imediata.
Especialmente nesta versão, devido ao impacto significativo dos prompts negativos, deixar o campo de prompt negativo vazio provavelmente produz a melhor qualidade.

A grade de especificações (438.7 MB): download

Como você pode ver, conforme o número de Steps aumenta, fica disponível para todos os samplers, e a qualidade também melhora.
Devido ao efeito do LoRA que desenvolvi e mesclei, como descrito abaixo, usar prompts em forma de sentença em vez de prompts em forma de tag (lista de palavras) está diretamente relacionado à melhoria da qualidade.

Mesclei 45 checkpoints e 7 LoRAs. Depois, mesclei AlbedoBase v0.4 e v0.3 em ordem, menos de 0~5%, para reativar os modelos mesclados diluídos que estavam desatualizados.
Entre os 7 LoRAs, um foi criado por mim. Envolve a análise e anotação de legendas para um total de 174 fotos ilustrativas de alta qualidade usando GPT4-V. A fusão desse LoRA resultou em imagens surpreendentemente nítidas e um entendimento impressionante dos prompts.

Meus LoRAs criados por mim estão disponíveis exclusivamente para compra por meus apoiadores Ko-fi no nível Creative ou superior aqui.

v1.2

Mesclou os 22 checkpoints mais recentes.

A grade de especificações (565.6 MB): download

v1.1

Estabilizado.
Mais detalhado.
Se você acha que é um usuário avançado, recomendo a versão 1.0. Se a versão 1.0 encontrar as configurações corretas, pode produzir trabalhos muito mais vívidos.

A grade de especificações (349.7 MB): download

v1.0

Mesclou 106 LoRAs.
Mesclou 19 Checkpoints.

O modelo pode produzir resultados diferentes dependendo das configurações escolhidas, por isso é importante verificar a grade de especificações antes de usá-lo.
- Descobri que usar alguns prompts negativos específicos pode ajudar a resolver o problema de olhos assimétricos ou imagens pixeladas. A Grade de especificações pode variar dependendo do seu dispositivo CPU ou GPU, então use-a como referência geral. Experimente alguns prompts negativos para melhorar a qualidade (ex; estrabismo). Notei que é difícil satisfazer todas as configurações igualmente conforme o número de LoRAs mesclados aumenta. Entretanto, gostaria que você focasse nesta vantagem na versão 1.0, pois ela pode produzir trabalhos de qualidade surpreendente em vários aspectos com as configurações corretas. Voltarei com uma versão mais estável no futuro.
Você pode encontrar valores de configuração úteis nas vitrines ou procurando com outros usuários.
Como sempre, é melhor deixar o prompt negativo em branco para melhores resultados.
Esta v1.0 foi muito trabalho, então estou dando uma pausa. Espero que vocês gostem de usar o modelo e, se fizerem outra fusão, por favor compartilhem-na gratuitamente no Civitai. Assim, todos podemos continuar melhorando.

A grade de especificações (479.4 MB): download

v0.4

Mesclou 132 LoRAs.
Mesclou 4 Checkpoints.

A grade de especificações: download

v0.3

Melhorado em todos os samplers.
Alcançou realismo vívido.
Estabilizado.

A grade de especificações: download

v0.2

Melhorias significativas em clareza e detalhes.
Implementação melhorada de mãos e pés.
Grandes melhorias estéticas; composição, abstração, fluxo, luz e cor, etc.

v0.1

Após o ajuste fino apropriado no modelo SDXL1.0, fundiu minuciosa e propositalmente mais de 40 modelos de alta qualidade disponíveis publicamente no Civitai.
Os testes focaram principalmente em garantir a máxima qualidade com o mínimo número de tokens no prompt, e não foi confirmado quanto a qualidade pode melhorar ao usar um grande número de tokens. (Por favor, realizem seus próprios testes e compartilhem os resultados)
Normalmente, os resultados mais bonitos são obtidos no ponto intermediário entre realidade e animação.
No entanto, quando usado um prompt apropriado, geralmente não há nada que ele não possa expressar. (Afirmo que possui valor abundante como modelo base que supera outros em fusão. Contudo, lembre-se que esta é a versão v0.1)

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

🥂🎆SDXL FaeTastic🎆🥂 - v24

Photo Factory - V1

Usar este modelo