modelos/AlbedoBase XL - v2.1

AlbedoBase XL - v2.1

João Silva

7/7/2025

2:10:15 PM

| Discussion|

Palavras-chave e Tags Relacionadas

Uma mulher segurando uma vela acesa com um fundo escuro totalmente preto iluminando metade do seu rosto com a luz quente da vela.

Ilustração detalhada de um tornado rodopiando sobre uma paisagem rural com casas e uma caminhonete, retratada em parchment envelhecido com respingos de tinta e efeitos de textura.

Figura de hacker digitalizado com capuz em estilo cyberpunk com cabos mecânicos e traje futurista escuro

Uma figura misteriosa e pálida com um longo casaco preto esvoaçante segurando uma arma está em uma rua escura e enevoada da cidade, com um carro retrô e um poste de luz ao fundo, em estilo neo-noir.

Uma cena de fantasia kawaii apresentando uma garota de cabelos ruivos em um vestido branco sentada em frente a uma grande criatura verde com uma boca larga e cheia de dentes, cercada por vários pequenos animais fofos que se assemelham a coelhos.

Barcos e palmeiras em silhueta em um rio ao pôr do sol com céu laranja incandescente em estilo collagraph por William Wray.

Duas pessoas em silhueta de barco de pesca em água calma com reflexo da luz solar intensa, obra em estilo colagrafia por William Wray

Um pato antropomórfico usando óculos oldschool e jaqueta de couro pilotando uma motocicleta com um pato branco sentado na frente.

Retrato de uma bela jovem com cabelo esvoaçante e visual de moda sexy, posando em um pátio ensolarado de uma mansão toscana com cores vibrantes e traje haute couture.

Veículo de corrida retrofuturista de monociclo com piloto usando capacete e jaqueta de couro, representado no estilo de uma colagrafia de William Wray

Silhueta preta de um homem em pé com cabelo espetado e jaqueta, contra um fundo abstrato salpicado bege e branco no estilo arte de rua.

Três indivíduos punk com cabelo espigado e tatuagens vestidos com roupas preppy contra um fundo amarelo, ilustrados com estilo espátula inspirado por Dave McKean.

Prompts Negativos Recomendados

strabismus

lowres

Parâmetros Recomendados

samplers

DPM++ 2M SDE Heun Karras

steps

24 - 60

cfg

7.5 - 8

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Dicas

Se a geração de imagens não produzir nada, tente mudar para CLIP SKIP 2 ou modifique o prompt ligeiramente mudando a ordem das palavras ou usando palavras diferentes.

Deixar o campo de prompt negativo em branco pode produzir imagens de boa qualidade, especialmente na versão 1.3.

Usar prompts em forma de frase em vez de prompts de tag (lista de palavras) pode melhorar a qualidade da imagem devido aos efeitos do LoRA.

Verifique a grade de especificações antes de usar o modelo para as melhores configurações, disponível através dos links de download fornecidos.

Destaques da Versão

Re-mesclar e ajustar v0.1 a 2.0 usando novo algoritmo de mesclagem e fórmula.

Patrocinadores do Criador

Se você achou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será inteiramente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord) ㅤ|ㅤ 🛒 comprar ㅤ|ㅤ 🌱 doar

Se você achou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será inteiramente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord) ㅤ|ㅤ 🛒 comprarㅤ |ㅤ 🌱 doar

AlbedoBase XL (SFW&NSFW)

O refinador é desnecessário, e o VAE está incluído.

OBJETIVO

Stable Diffusion XL tem 3,5 bilhões de parâmetros (excluindo o Refinador), o que é cerca de 3,6 vezes mais que a versão SD v1.5. Acredito que isso não é apenas um número, mas um número que pode levar a uma melhoria significativa no desempenho.

Faz algum tempo desde que percebemos que o desempenho geral do SD v1.5 melhorou além da imaginação graças às contribuições explosivas da nossa comunidade. Portanto, estou trabalhando para completar este modelo AlbedoBase XL para reproduzir de forma ideal a melhoria de desempenho que ocorreu na v1.5 nesta versão XL também.

Meu objetivo é testar diretamente o desempenho de todos os Checkpoints e LoRAs que são disponibilizados publicamente no Civitai, e mesclar apenas os recursos julgados ótimos após passar por vários filtros. Isso superará o desempenho da IA geradora de imagens de empresas como Midjourney.

Até o momento, o AlbedoBase XL v3.1 Large tem mesclado cerca de 200 checkpoints selecionados e 251 LoRAs.

REGISTRO

v3.1-Large

• Mesclou mais de 50 versões recentes selecionadas dos modelos SDXL usando o script recursivo empregado no V3.

A grade de especificações (370,7 MB): download

v3-mini

Peço sinceras desculpas por mantê-los esperando por tanto tempo.

Estive lidando com alguns assuntos pessoais e, enquanto trabalhava na nova versão, também enfrentei problemas de saúde. Mesmo enquanto escrevo isso, ainda estou lutando contra esses desafios.

Senti que não seria suficiente fornecer apenas uma atualização breve, então peço sua compreensão enquanto compartilho esta mensagem mais detalhada.

Desde o lançamento da versão 2.0, tenho me dedicado a estudar aprendizado profundo de forma independente. Não possuo um diploma formal e, além de uma aptidão modesta para programação, minha formação é em artes. Como resultado, me falta a base matemática e científica para alcançar grandes avanços, dado o tempo e esforço investidos. Apesar disso, a experiência de me aprofundar nesse estudo e pesquisa autodirigidos tem sido um tesouro inestimável em minha vida.

Recentemente, tive uma ideia que pode ser uma grande descoberta. Após refazer centenas de fórmulas e métodos desde a versão 2.0, consegui desenvolver um algoritmo bastante intrigante e bem-sucedido. O processo de mesclagem do modelo foi baseado no SDXL1.0 e SD1.5, juntamente com outros modelos cuidadosamente selecionados. Estes foram categorizados em cinco classificações principais: “ANIME,” “REALISMO,” “ARTÍSTICO,” “NSFW,” e “BASE,” e alimentados no algoritmo de mesclagem como conjuntos de dados. Essa abordagem resultou em alguns resultados fascinantes.

No entanto, tão desafiador quanto o desenvolvimento do algoritmo foi, nada foi tão assustador quanto a fase de teste de desempenho. Minha saúde física e mental se deteriorou significativamente durante esse período, ao ponto de perceber que não poderia continuar esse trabalho sozinho. Isso me levou a decidir lançar esta versão.

E agora, estou entusiasmado em anunciar o lançamento da tão esperada versão AlbedoBaseXL V3 Mini. Embora este modelo seja uma mesclagem em escala menor, ele não é limitado a nenhuma área específica e apresenta desempenho notável em vários domínios. Tem o potencial de servir como um novo modelo base para SDXL1.0. (Para referência, meu algoritmo de mesclagem não é uma “mesclagem linear,” então pode ser considerado essencialmente um novo modelo ajustado.)

Este modelo, junto com os modelos AlbedoBase existentes, é versátil e supera todas as versões anteriores em todos os aspectos. (O conteúdo NSFW, embora não extremo, oferece uma gama mais ampla de expressão em comparação com versões anteriores como a v2.1. Um modelo dedicado de mesclagem NSFW será lançado no futuro.)

Por outro lado, notei que muitos modelos compartilhados recentemente começaram a adotar licenças que proíbem a mesclagem ou comercialização externa. Isso foi uma decepção, pois me impediu de usar alguns modelos realmente excelentes para mesclagem.

Gostaria de expressar minha profunda gratidão aos desenvolvedores de modelos que forneceram licenças gratuitas, permitindo que seus modelos de alta qualidade — frutos de considerável tempo e esforço — sejam usados para mesclagem.

Voltarei em breve.

Aguardo ansiosamente seus testes de desempenho em uma ampla variedade de áreas, incluindo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D e NSFW.

Como desenvolvedores de modelos, plantamos apenas as sementes. Vocês, usuários de modelos e artistas, são os que as cultivam e fazem florescer e frutificar.

Obrigado, como sempre.

Para aqueles que desejam apoiar meu trabalho com uma pequena contribuição financeira, considerem usar os links abaixo. Atualmente não consigo garantir emprego e enfrento um futuro incerto quanto ao meu sustento.

🌱 doar

A grade de especificações (380,5 MB): download

v2.1
Re-mesclar e ajustar v0.1 a 2.0 usando novo algoritmo de mesclagem e fórmula.

A grade de especificações (424,5 MB): download

v2.0

Gostaria de agradecer a todos que me ajudaram no lado AlbedoBase XL Pre. Sem vocês, a data de lançamento provavelmente teria sido muito mais tarde. Muito obrigado!

Escrevi um script personalizado para convergir os modelos AlbedoBase XL existentes em um só. Alinhando intrinsecamente os pesos de linhas e colunas de todos os blocos U-NET e CLIP de acordo com uma fórmula exclusiva minha.
Se você encontrar um bug na geração de imagens (se nada for gerado), por favor mude para CLIP SKIP 2 ou modifique ligeiramente o prompt! Pode haver combinações de prompts que o CLIP não reconhece. Nesse caso, você pode mudar a ordem das palavras, usar palavras diferentes ou, mais simplesmente, mudar o CLIP SKIP. Eu vou gradualmente trabalhar para resolver esses problemas no futuro, como na v1.3.

A grade de especificações (403,5 MB): download

v1.3

Para ilustrar a qualidade associada à aleatoriedade do modelo, padronizei o valor da semente em '9' para todas as imagens de demonstração destinadas à amostragem e as gerei imediatamente.
Especialmente com esta versão, devido ao impacto significativo dos prompts negativos, deixar o campo de prompt negativo em branco provavelmente produzirá qualidade agradável.

A grade de especificações (438,7 MB): download

Como você pode ver, conforme o número de Steps aumenta, ele fica disponível para todos os samplers, e a qualidade também melhora.
Devido ao efeito do LoRA que desenvolvi e mesclei, como descrito abaixo, usar prompts em forma de frase em vez de prompts de tag (lista de palavras) está diretamente relacionado a melhorar a qualidade.

Mesclei 45 checkpoints e 7 LoRAs. Depois disso, mesclei AlbedoBase v0.4 e v0.3 em ordem, menos de 0~5%, para reavivar os modelos mesclados diluídos que haviam se tornado desatualizados.
Dos 7 LoRAs, um foi criado por mim. Envolve analisar e anotar legendas para um total de 174 fotos pictóricas de alta qualidade usando GPT4-V. Mesclar esse LoRA resultou em imagens incrivelmente claras e uma compreensão impressionante dos prompts.

Meus LoRAs auto-criados estão exclusivamente disponíveis para compra para meus apoiadores Ko-fi no nível Creative ou superior.

v1.2

Mesclou os 22 checkpoints mais recentes.

A grade de especificações (565,6 MB): download

v1.1

Estabilizado.
Mais detalhado.
Se você achar que é um usuário avançado, recomendo a versão 1.0. Se a versão 1.0 encontrar as configurações certas, pode produzir trabalhos muito mais vívidos.

A grade de especificações (349,7 MB): download

v1.0

Mesclou 106 LoRAs.
Mesclou 19 Checkpoints.

O modelo pode produzir resultados diferentes dependendo das configurações que você escolher, então é importante verificar a grade de especificações antes de usá-lo.
- Descobri que usar alguns prompts negativos específicos pode ajudar a resolver o problema de olhos assimétricos ou imagens pixeladas. A Grade de Especificações pode variar dependendo do seu dispositivo CPU ou GPU, então use-a como referência geral. Experimente alguns prompts negativos para melhorar a qualidade (ex: estrabismo). Percebi que é difícil satisfazer todas as configurações igualmente conforme o número de LoRA mesclados aumenta. No entanto, gostaria que você focasse nesta vantagem na versão 1.0, pois ela pode produzir trabalhos de qualidade incrível em vários aspectos com as configurações certas. Voltarei com uma versão mais estável no futuro.
Você pode encontrar valores de configuração úteis na vitrine ou buscando outras pessoas.
Como sempre, é melhor deixar o prompt negativo em branco para melhores resultados.
Esta v1.0 deu muito trabalho, então estou fazendo uma pausa. Espero que você aproveite o uso do modelo e, se mesclar, por favor compartilhe no Civitai gratuitamente. Assim, todos podemos continuar melhorando-o.

A grade de especificações (479,4 MB): download

v0.4

Mesclou 132 LoRAs.
Mesclou 4 Checkpoints.

A grade de especificações: download

v0.3

Melhorado em todos os samplers.
Alcançou realismo vívido.
Estabilizado.

A grade de especificações: download

v0.2

Melhorias significativas em clareza e detalhamento.
Melhoria na implementação de mãos e pés.
Grandes melhorias estéticas; composição, abstração, fluxo, luz e cor, etc.

v0.1

Após o ajuste fino apropriado no modelo SDXL1.0
, mesclei meticulosamente mais de 40 modelos de alta qualidade disponíveis publicamente no Civitai.
Os testes focaram principalmente em garantir máxima qualidade com o mínimo número de tokens no prompt, e não foi confirmado o quanto a qualidade pode melhorar ao usar um grande número de tokens. (Por favor, faça seus próprios testes e compartilhe os resultados)
Normalmente, os resultados mais bonitos são alcançados no ponto médio entre realidade e animação.
No entanto, usando um prompt adequado, geralmente não há nada que ele não possa expressar. (Afirmo que possui valor abundante como modelo base que supera outros em mesclagem. Contudo, lembre-se de que esta é atualmente a v0.1)

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

Fluxartis - Opus I

Embeddings Negativos e Positivos por Stable Yogi - v1.0

Usar este modelo