Retrato hiper-realista de uma mulher idosa que se assemelha a Amelia Earhart, vestida com moda dos anos 1970, piscando para a câmera enquanto segura uma xícara de café branca em um ambiente interno aconchegante.
Uma jovem cheerleader morena dançando com saia verde e top branco com detalhes vermelhos em campo de estádio de futebol, atmosfera vibrante
Jovem torcedora morena dançando com roupa esportiva azul e vermelha vibrante em um estádio de futebol com público ao fundo
Uma cheerleader vestindo uma camiseta esportiva vermelha e saia plissada branca dança em um campo de futebol com uma multidão no estádio ao fundo.
Pintura realista de uma jovem com cabelos longos usando minissaia branca e blusa azul claro, em uma pista de boliche com bolas de boliche ao lado.

Prompts Negativos Recomendados

strabismus

Parâmetros Recomendados

samplers

DPM++ 2M SDE Heun Exponential

steps

42

cfg

7

resolution

720x1280, 1024x1024

vae

included VAE

Dicas

Se a geração de imagens não produzir resultado, tente mudar para CLIP SKIP 2 ou modifique o prompt levemente alterando a ordem ou as palavras.

Usar prompts em forma de sentença tende a melhorar mais a qualidade da imagem do que prompts em lista de tags.

Deixar o campo de prompt negativo vazio geralmente gera melhores resultados de imagem.

Verifique a grade de especificações para configurações ideais antes de usar.

Experimente alguns prompts negativos específicos, como 'estrabismo', para resolver problemas como olhos assimétricos ou pixelização.

Destaques da Versão

v1.3

  • Para ilustrar a qualidade associada à aleatoriedade do modelo, padronizei o valor de seed em '9' para todas as imagens de vitrine destinadas à amostragem e procedi com sua geração imediata.

  • Especialmente nesta versão, devido ao impacto significativo dos prompts negativos, deixar o campo de prompt negativo vazio provavelmente produz a melhor qualidade.

A grade de especificações (438.7 MB): download

  • Como você pode ver, conforme o número de Steps aumenta, fica disponível para todos os samplers, e a qualidade também melhora.

  • Devido ao efeito do LoRA que desenvolvi e mesclei, como descrito abaixo, usar prompts em forma de sentença em vez de prompts em forma de tag (lista de palavras) está diretamente relacionado à melhoria da qualidade.

  • Mesclei 45 checkpoints e 7 LoRAs. Depois, mesclei AlbedoBase v0.4 e v0.3 em ordem, menos de 0~5%, para reativar os modelos mesclados diluídos que estavam desatualizados. 

  • Entre os 7 LoRAs, um foi criado por mim. Envolve a análise e anotação de legendas para um total de 174 fotos ilustrativas de alta qualidade usando GPT4-V. A fusão desse LoRA resultou em imagens surpreendentemente nítidas e um entendimento impressionante dos prompts.

  • Meus LoRAs criados por mim estão disponíveis exclusivamente para compra por meus apoiadores Ko-fi no nível Creative ou superior aqui. Planejo lançar mais atualizações futuramente. Os preços variam de $10 a $50.

Patrocinadores do Criador

Se você encontrou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será totalmente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord) ㅤ|ㅤ 🛒 comprar ㅤ|ㅤ 🌱 doar


Se você encontrou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será totalmente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord)|ㅤ 🛒 comprarㅤ |ㅤ 🌱 doar


AlbedoBase XL (SFW&NSFW)

O refiner não é necessário, e o VAE está incluído.


OBJETIVO

Stable Diffusion XL possui 3,5 bilhões de parâmetros (excluindo o Refiner), cerca de 3,6 vezes mais que a versão SD v1.5. Eu acredito que isso não é apenas um número, mas um número que pode levar a uma melhoria significativa no desempenho.

Já faz um tempo desde que percebemos que o desempenho geral do SD v1.5 melhorou além da imaginação graças às contribuições explosivas de nossa comunidade. Portanto, estou trabalhando para completar este modelo AlbedoBase XL para reproduzir de forma ideal a melhora de desempenho que ocorreu na v1.5 também nesta versão XL.

Meu objetivo é testar diretamente o desempenho de todos os Checkpoints e LoRAs que são publicamente carregados no Civitai, e mesclar apenas os recursos julgados ótimos após passarem por vários filtros. Isso superará o desempenho da IA geradora de imagens de empresas como Midjourney.

Até o momento, AlbedoBase XL v3.1 Large fundiu cerca de 200 checkpoints selecionados e 251 LoRAs.


REGISTRO

v3.1-Large

• Mais de 50 versões selecionadas dos modelos SDXL foram fundidas usando o script recursivo empregado na V3.

A grade de especificações (370.7 MB): download


v3-mini

Peço sinceras desculpas por deixá-los esperando tanto tempo.

Tenho lidado com alguns assuntos pessoais e, enquanto trabalhava na nova versão, também enfrentei problemas de saúde. Mesmo enquanto escrevo isto, ainda estou lutando com esses desafios.

Senti que não seria suficiente apenas fornecer uma breve atualização, por isso peço sua compreensão enquanto compartilho esta mensagem mais detalhada.

Desde o lançamento da versão 2.0, tenho me dedicado ao estudo autodidata de deep learning. Não possuo um diploma formal, e, além de uma modesta aptidão para programação, minha formação é nas artes. Como resultado, me falta a base matemática e científica para alcançar grandes avanços, dado o tempo e esforço investidos. Apesar disso, a experiência de me aprofundar neste estudo e pesquisa autônoma tem sido um tesouro inestimável em minha vida.

Recentemente, deparei-me com uma ideia que pode ser um avanço significativo. Depois de reformular centenas de fórmulas e métodos desde a versão 2.0, consegui desenvolver um algoritmo bastante intrigante e bem-sucedido. O processo de fusão do modelo foi baseado no SDXL1.0 e SD1.5, junto com outros modelos cuidadosamente selecionados. Eles foram categorizados em cinco classificações principais: “ANIME,” “REALISMO,” “ARTÍSTICO,” “NSFW,” e “BASE,” e alimentados no algoritmo de fusão como conjuntos de dados. Essa abordagem resultou em alguns resultados fascinantes.

No entanto, por mais desafiador que tenha sido o desenvolvimento do algoritmo, nada foi tão árduo quanto a fase de testes de desempenho. Minha saúde física e mental deteriorou-se significativamente durante esse período, ao ponto de perceber que não conseguiria continuar esse trabalho sozinho. Isso foi o que me levou a decidir liberar essa versão.

E agora, estou entusiasmado em anunciar o lançamento da tão aguardada versão AlbedoBaseXL V3 Mini. Embora este modelo seja uma fusão em menor escala, não está limitado a nenhuma área específica e apresenta desempenho notavelmente bom em vários domínios. Tem potencial para servir como um novo modelo base para SDXL1.0. (Para referência, meu algoritmo de fusão não é uma “fusão linear,” então ele pode ser considerado essencialmente um novo modelo afinado.)

Este modelo, juntamente com os modelos AlbedoBase existentes, é versátil e supera todas as versões anteriores em todos os aspectos. (O conteúdo NSFW, embora não extremo, oferece uma gama mais ampla de expressão comparado com versões anteriores como a v2.1. Um modelo específico para fusão NSFW será lançado futuramente.)

Por outro lado, notei que muitos modelos compartilhados recentemente passaram a adotar licenças que proíbem fusão ou comercialização externa. Isso foi uma decepção, pois me impediu de usar alguns modelos realmente excelentes para fusão.

Gostaria de expressar minha sincera gratidão aos desenvolvedores de modelos que forneceram licenças gratuitas, permitindo que seus modelos de alta qualidade — produtos de considerável tempo e esforço — sejam usados para fusão.

Voltarei em breve.

Espero ansiosamente pelos seus testes de desempenho em várias áreas, incluindo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D e NSFW.

Como desenvolvedores de modelos, nós apenas plantamos as sementes. É, em última análise, você, os usuários e artistas de modelos, quem as cultiva e faz florescer.

Obrigado, como sempre.


Para quem desejar apoiar meu trabalho com uma pequena contribuição financeira, por favor considere usar os links abaixo. Atualmente não consigo obter emprego e enfrento um futuro incerto quanto ao meu sustento.

🌱 doar

A grade de especificações (380.5 MB): download


v2.1
Re-fusão e ajuste da v0.1 para 2.0 usando novo algoritmo de fusão e fórmula.

A grade de especificações (424.5 MB): download

v2.0

Gostaria de agradecer a todos que me ajudaram no lado AlbedoBase XL Pre. Sem vocês, a data de lançamento provavelmente teria sido muito mais tarde. Muito obrigado!

  • Escrevi um script personalizado para convergir os modelos AlbedoBase XL existentes em um só. Alinhando delicadamente os pesos das linhas e colunas de todos os blocos U-NET e CLIP segundo uma fórmula única minha.

  • Se você encontrar um erro na geração de imagens (se nada for gerado), tente mudar para CLIP SKIP 2 ou modifique o prompt levemente! Pode haver combinações de prompts que o CLIP não reconhece. Neste caso, você pode mudar a ordem das palavras, usar palavras diferentes ou, mais simplesmente, alterar o CLIP SKIP. Trabalharei gradualmente para resolver esses problemas no futuro como na v1.3.

A grade de especificações (403.5 MB): download

v1.3

  • Para ilustrar a qualidade associada à aleatoriedade do modelo, padronizei o valor de seed em '9' para todas as imagens de vitrine destinadas à amostragem e procedi com sua geração imediata.

  • Especialmente nesta versão, devido ao impacto significativo dos prompts negativos, deixar o campo de prompt negativo vazio provavelmente produz a melhor qualidade.

A grade de especificações (438.7 MB): download

  • Como você pode ver, conforme o número de Steps aumenta, fica disponível para todos os samplers, e a qualidade também melhora.

  • Devido ao efeito do LoRA que desenvolvi e mesclei, como descrito abaixo, usar prompts em forma de sentença em vez de prompts em forma de tag (lista de palavras) está diretamente relacionado à melhoria da qualidade.

  • Mesclei 45 checkpoints e 7 LoRAs. Depois, mesclei AlbedoBase v0.4 e v0.3 em ordem, menos de 0~5%, para reativar os modelos mesclados diluídos que estavam desatualizados. 

  • Entre os 7 LoRAs, um foi criado por mim. Envolve a análise e anotação de legendas para um total de 174 fotos ilustrativas de alta qualidade usando GPT4-V. A fusão desse LoRA resultou em imagens surpreendentemente nítidas e um entendimento impressionante dos prompts.

  • Meus LoRAs criados por mim estão disponíveis exclusivamente para compra por meus apoiadores Ko-fi no nível Creative ou superior aqui.


v1.2

  • Mesclou os 22 checkpoints mais recentes.

A grade de especificações (565.6 MB): download

v1.1

  • Estabilizado.

  • Mais detalhado.

  • Se você acha que é um usuário avançado, recomendo a versão 1.0. Se a versão 1.0 encontrar as configurações corretas, pode produzir trabalhos muito mais vívidos.

A grade de especificações (349.7 MB): download

v1.0

  • Mesclou 106 LoRAs.

  • Mesclou 19 Checkpoints.

  1. O modelo pode produzir resultados diferentes dependendo das configurações escolhidas, por isso é importante verificar a grade de especificações antes de usá-lo.

    • Descobri que usar alguns prompts negativos específicos pode ajudar a resolver o problema de olhos assimétricos ou imagens pixeladas. A Grade de especificações pode variar dependendo do seu dispositivo CPU ou GPU, então use-a como referência geral. Experimente alguns prompts negativos para melhorar a qualidade (ex; estrabismo). Notei que é difícil satisfazer todas as configurações igualmente conforme o número de LoRAs mesclados aumenta. Entretanto, gostaria que você focasse nesta vantagem na versão 1.0, pois ela pode produzir trabalhos de qualidade surpreendente em vários aspectos com as configurações corretas. Voltarei com uma versão mais estável no futuro.

  2. Você pode encontrar valores de configuração úteis nas vitrines ou procurando com outros usuários.

  3. Como sempre, é melhor deixar o prompt negativo em branco para melhores resultados.

  4. Esta v1.0 foi muito trabalho, então estou dando uma pausa. Espero que vocês gostem de usar o modelo e, se fizerem outra fusão, por favor compartilhem-na gratuitamente no Civitai. Assim, todos podemos continuar melhorando.

A grade de especificações (479.4 MB): download

v0.4

  • Mesclou 132 LoRAs.

  • Mesclou 4 Checkpoints.

A grade de especificações: download

v0.3

  • Melhorado em todos os samplers.

  • Alcançou realismo vívido.

  • Estabilizado.

A grade de especificações: download

v0.2

  • Melhorias significativas em clareza e detalhes.

  • Implementação melhorada de mãos e pés.

  • Grandes melhorias estéticas; composição, abstração, fluxo, luz e cor, etc.

v0.1

  • Após o ajuste fino apropriado no modelo SDXL1.0, fundiu minuciosa e propositalmente mais de 40 modelos de alta qualidade disponíveis publicamente no Civitai.

  • Os testes focaram principalmente em garantir a máxima qualidade com o mínimo número de tokens no prompt, e não foi confirmado quanto a qualidade pode melhorar ao usar um grande número de tokens. (Por favor, realizem seus próprios testes e compartilhem os resultados)

  • Normalmente, os resultados mais bonitos são obtidos no ponto intermediário entre realidade e animação.

  • No entanto, quando usado um prompt apropriado, geralmente não há nada que ele não possa expressar. (Afirmo que possui valor abundante como modelo base que supera outros em fusão. Contudo, lembre-se que esta é a versão v0.1)


Anterior
🥂🎆SDXL FaeTastic🎆🥂 - v24
Próximo
Photo Factory - V1

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

SDXL 1.0

Versão do modelo

v1.3

Hash do modelo

a40d817f46

Palavras treinadas

all in one
photo
2d
3d
anime
game
photorealistic
cinematic
design
base

Criador

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por AlbedoBase XL - v1.3

Retrato hiper-realista de uma mulher idosa que se assemelha a Amelia Earhart, vestida com moda dos anos 1970, piscando para a câmera enquanto segura uma xícara de café branca em um ambiente interno aconchegante.
Uma jovem cheerleader morena dançando com saia verde e top branco com detalhes vermelhos em campo de estádio de futebol, atmosfera vibrante
Jovem torcedora morena dançando com roupa esportiva azul e vermelha vibrante em um estádio de futebol com público ao fundo
Uma cheerleader vestindo uma camiseta esportiva vermelha e saia plissada branca dança em um campo de futebol com uma multidão no estádio ao fundo.
Pintura realista de uma jovem com cabelos longos usando minissaia branca e blusa azul claro, em uma pista de boliche com bolas de boliche ao lado.

Imagens com 3d

Retrato fotorrealista em close de uma garota hipster estilosa com maquiagem escura, linha da mandíbula definida e um colar atraente.
Imagem 3D realista de Tifa Lockhart sentada com uma perna levantada, vestindo top esportivo branco e calça de moletom preta, mostrando pele brilhante e suor em fundo branco simples.
Uma tartaruga altamente detalhada usando um jetpack, voando acima de um canal urbano vibrante cercado por prédios coloridos sob um céu azul.
Um carro clássico amarelo vibrante acelerando em uma rua urbana molhada com uma grande explosão ao fundo sob um céu nublado.
Loona de Helluva Boss sentada em uma cadeira gamer com grandes olhos vermelhos tristes, segurando uma placa em chamas dizendo 'Preciso de Buzz para gerar mais Loona' dentro de uma sala de jogos.
Quarto compacto futurista com design metálico e industrial, apresentando uma cama bagunçada próxima a uma grande janela panorâmica com vista para o horizonte da cidade cyberpunk iluminada por neon à noite.
Uma imagem fotorrealista de uma mulher estilosa em um vestido vermelho marcante e óculos escuros, posando confiante em um terminal de aeroporto cercada por uma pilha alta e caótica de malas coloridas sobre um carrinho de bagagem.
Uma menina mariposa 3D realista com cabelo preto e branco dividido, olhos vermelhos grandes e expressão admirada com baba, inclinação sobre uma lâmpada brilhante sobre uma mesa de madeira.
Uma arbalista medieval feminina renderizada em 3D com cabelo castanho trançado, olhos castanhos, vestindo roupa medieval marrom clara e armadura de couro, segurando uma besta com um olhar sério de lado.
Arte digital 3D de um gato pirata amarelo com olhos azuis brilhantes, um grande chapéu de pirata marinho adornado com um emblema de caveira, uma capa marinha detalhada presa por correntes douradas, e um casaco marrom, posando confiante contra um fundo de vitral.

Imagens com tudo em um

Uma freira de anime fofa com cabelo loiro trançado, grandes olhos azuis e expressão alegre. Ela está vestida com o hábito tradicional de freira com véu preto e faixa branca na cabeça, segurando as mãos em uma pose de oração. Esta imagem foi gerada por IA usando Stable Diffusion.
Garota no estilo anime com cabelo azul longo em rabo de cavalo, segurando uma katana, de pé sob árvores de sakura em flor. Criado com IA usando Stable Diffusion.
Garota anime com cabelo longo azul-cinzento, traje ornamentado e acessórios detalhados, imagem gerada por IA usando Stable Diffusion.

Imagens com anime

Uma pintura digital detalhada de uma garota anime com cabelo loiro e olhos azuis marcantes, iluminada por uma luz suave e onírica em estilo CGI.
Retrato em close de Dio Brando com cabelo loiro e faixa verde na cabeça, cercado por efeitos brilhantes sob um céu azul brilhante.
Um bar cyberpunk iluminado por luzes de neon violeta, cheio de frequentadores futuristas usando capacetes e equipamentos cibernéticos, com telas holográficas e uma atmosfera high-tech.
Uma garota de anime detalhada com cabelo loiro vestindo roupas brancas e vermelhas caminhando por um riacho na floresta cercada por águas-vivas laranja brilhantes ao anoitecer.
Retrato de uma garota elfa com longos cabelos brancos em twintails, olhos azuis, orelhas pontudas, usando uma capa branca com detalhes em dourado e joias sobre fundo preto.
Garota elfa em estilo anime com longos rabos de cavalo prateados e olhos verdes, em pé em um campo de flores azuis, vestindo um capuz branco, camisa listrada e meia-calça preta.
Uma jovem mulher anime com olhos azuis e cabelo castanho está diante de um fundo mosaico floral azul cobalto em uma estética sonhadora.
Ilustração digital em estilo anime mostrando uma grande estrutura pontiaguda de pirâmide de pedra triangular em terra árida com pedras espalhadas sob um céu estrelado e um planeta com anéis laranja.
Guerreira feminina detalhada em estilo anime, com traje de couro preto, em uma pose dinâmica com efeitos coloridos em azul e laranja rodopiando ao fundo.
Um retrato detalhado de um ciborgue com cabelo branco longo, olhos azuis e armadura robótica intrincada, em uma paisagem urbana futurista cyberpunk à noite.

Imagens com modelo base

Cena fotorrealista de personagens mortos-vivos incluindo zumbis e esqueletos caminhando por um cemitério assustador iluminado por lanternas de abóbora brilhantes sob um céu escuro e ameaçador.

Imagens com fotorealista

Silhueta de um homem cibernético com asas e pernas longas e esbeltas preenchida com colagem de mídia mista fotorrealista de paisagens urbanas e edifícios sob iluminação cinematográfica.
Imagem futurista em preto e branco com linhas metálicas que se estendem do topo, com folhagem com tons vermelhos emoldurando a cena e um diamante azul pulsante no centro.
Imagem fotorrealista de um robô empregada deitada no chão da floresta com folhagem entrelaçada em seus cabelos e partes corporais robóticas, vestindo um vestido branco de empregada.
Supermodelo fantástica com beleza etérea vestindo um vestido avant-garde vibrante e colorido, adornado com joias intrincadas, contra um fundo ondulante e vívido multicolorido.
Jovem barista feminina atrás do balcão rústico de uma cafeteria, vestindo camisa preta com botões e avental preto, sorrindo suavemente com maquiagem natural e cabelo preso.
Três mulheres usando suéteres e calças em estilo náutico, juntas no convés de um iate de luxo à noite com o oceano do Caribe ao fundo.
Cena fotorrealista de uma jovem japonesa em um vestido de verão colorido esvoaçante caminhando por uma trilha na floresta cercada por águas-vivas flutuantes e brilhantes sob iluminação natural.
Uma garota fofa sentada confortavelmente em uma biblioteca aconchegante, estudando à luz de velas com iluminação de ambiente quente e um livro aberto à sua frente.
Uma ilustração vetorial 2D detalhada de uma mulher adornada com flores de orquídea negra e padrões florais intrincados em estilo barroco.
Close-up de um jovem com uma barbeta loira curta e óculos, meio iluminado pelo sol da manhã, com um gato tigrado descansando em seu ombro.