Vista de uma zona rural italiana ensolarada com colinas onduladas, fazendas, uma vila pitoresca com telhados de terracota e nuvens dramáticas sob um céu azul claro.
Retrato gravado em close-up extremo em preto e branco no estilo grunge de um rosto com texturas detalhadas e linhas expressivas, inspirado por Richard Hambleton.
Retrato abstrato escuro de uma figura feminina com silhueta preta e respingos vívidos de tinta vermelha sobre fundo claro, inspirado no estilo de Richard Hambleton.
Cidade futurista com altas torres cilíndricas de vidro situada em uma paisagem montanhosa nevada sob um céu dramático ao pôr do sol.
Homem de desenho animado com expressão chocada, cabelo selvagem e encaracolado, óculos e barba por fazer, vestindo uma camisa xadrez amarela com gravata vermelha e suspensórios azuis em um fundo verde texturizado.
Uma miniatura de alpaca branca e fofinha com grandes olhos pretos, ao lado de uma pequena casa marrom impressa em 3D.
Uma arte vetorial digital vibrante no estilo William Wray mostrando um elefante tranquilo em forma de balão de ar colorido com um pinguim extravagante empoleirado no topo, cercado por balões multicoloridos contra um fundo de céu.
Gravura impressionista mostrando a silhueta de uma mulher de vestido e chapéu, parada à beira de um rio, olhando para um cachorro pequeno, com uma ponte clássica de Londres e o Big Ben ao fundo.
Uma silhueta em estilo recorte de papel de uma mulher dançando tango, elaboradamente criada em arte de aço com influência kirigami, envolvida por formas abstratas em espiral.

Prompts Recomendados

(incredibly ultra lifelike, perfect professional precise, masterpiece, extremely beautiful, light and shadow

Prompts Negativos Recomendados

strabismus

(worst quality, normal quality, score_3, score_4

Parâmetros Recomendados

samplers

Euler a, DPM++ 2M SDE Heun

steps

24 - 72

cfg

3 - 9.5

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Dicas

Se a geração da imagem não produzir resultado, tente mudar para CLIP SKIP 2 ou modifique o prompt ligeiramente alterando a ordem ou as palavras.

Usar prompts em formato de frase tende a melhorar a qualidade da imagem mais do que prompts em lista de tags.

Deixar o campo de prompt negativo vazio frequentemente resulta em melhores imagens.

Verifique a grade de especificações para configurações ideais antes do uso.

Experimente alguns prompts negativos específicos como 'estrabismo' para resolver problemas como olhos assimétricos ou pixelização.

Destaques da Versão

• Mesclou mais de 50 versões selecionadas dos modelos SDXL usando o script recursivo empregado na V3.

Patrocinadores do Criador

Se você encontrou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será totalmente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord) ㅤ|ㅤ 🛒 comprar ㅤ|ㅤ 🌱 doar


Se você encontrou valor no modelo, por favor considere oferecer seu apoio. Sua contribuição será totalmente dedicada ao avanço da comunidade SDXL.

🙋🏼‍♂️ junte-se a nós (discord)|ㅤ 🛒 comprarㅤ |ㅤ 🌱 doar


AlbedoBase XL (SFW&NSFW)

O refiner não é necessário e o VAE está incluído.


OBJETIVO

Stable Diffusion XL tem 3,5 bilhões de parâmetros (excluindo o Refiner), o que é cerca de 3,6 vezes mais que a versão SD v1.5. Acredito que isso não seja apenas um número, mas um número que pode levar a uma melhoria significativa no desempenho.

Faz tempo que percebemos que o desempenho geral do SD v1.5 melhorou além da imaginação graças às contribuições explosivas da nossa comunidade. Portanto, estou trabalhando para completar este modelo AlbedoBase XL a fim de reproduzir de forma ideal a melhoria de desempenho que ocorreu na v1.5 também nesta versão XL.

Meu objetivo é testar diretamente o desempenho de todos os Checkpoints e LoRAs que são publicamente enviados ao Civitai, e mesclar somente os recursos avaliados como ótimos após passar por vários filtros. Isso superará o desempenho de IA geradoras de imagens de empresas como Midjourney.

Até o momento, o AlbedoBase XL v3.1 Large tem mesclado cerca de 200 checkpoints selecionados e 251 LoRAs.


REGISTRO

v3.1-Large

• Mesclou mais de 50 versões selecionadas dos modelos SDXL usando o script recursivo empregado na V3.

A grade de especificações(370.7 MB): baixar


v3-mini

Peço sinceras desculpas por mantê-los esperando por tanto tempo.

Estive lidando com algumas questões pessoais e, enquanto trabalhava na nova versão, também enfrentei problemas de saúde. Mesmo enquanto escrevo isso, ainda estou lutando com esses desafios.

Senti que não seria suficiente apenas fornecer uma atualização breve, então peço gentilmente sua compreensão enquanto compartilho esta mensagem mais detalhada.

Desde o lançamento da versão 2.0, tenho me dedicado a estudar aprendizado profundo de forma independente. Não tenho um diploma formal e, além de uma aptidão modesta para programação, apenas meu histórico é nas artes. Como resultado, careço da base matemática e científica para alcançar avanços significativos, dado o tempo e esforço investidos. Ainda assim, a experiência de me imergir nesses estudos e pesquisas autodirigidas tem sido um tesouro inestimável na minha vida.

Recentemente, encontrei uma ideia que pode ser um avanço significativo. Depois de trabalhar centenas de fórmulas e métodos desde a versão 2.0, consegui desenvolver um algoritmo bastante intrigante e bem-sucedido. O processo de mesclagem do modelo foi baseado em SDXL1.0 e SD1.5, junto com outros modelos cuidadosamente selecionados. Estes foram categorizados em cinco classificações principais: “ANIME,” “REALISMO,” “ARTÍSTICO,” “NSFW,” e “BASE,” e alimentados no algoritmo de mesclagem como conjuntos de dados. Esta abordagem resultou em alguns desfechos fascinantes.

No entanto, tão desafiador quanto o desenvolvimento do algoritmo foi, nada foi tão difícil quanto a fase de testes de desempenho. Minha saúde física e mental deteriorou-se significativamente durante este período, a ponto de perceber que não poderia continuar esse trabalho sozinho. Foi isso que me levou a decidir liberar esta versão.

E agora, estou entusiasmado em anunciar o lançamento da tão aguardada versão AlbedoBaseXL V3 Mini. Embora este modelo seja uma mesclagem em escala menor, não se limita a nenhuma área específica e tem desempenho notavelmente bom em vários domínios. Tem potencial para servir como um novo modelo base para SDXL1.0. (Para referência, meu algoritmo de mesclagem não é uma “mesclagem linear,” então pode ser considerado essencialmente um novo modelo ajustado).

Este modelo, junto com os modelos AlbedoBase existentes, é versátil e supera todas as versões anteriores em todos os aspectos. (O conteúdo NSFW, embora não extremo, oferece uma gama mais ampla de expressão em comparação com versões anteriores como a v2.1. Um modelo de mesclagem NSFW dedicado será lançado no futuro.)

Por outro lado, percebi que muitos modelos compartilhados recentemente começaram a adotar licenças que proíbem mesclagens ou comercialização externa. Isso tem sido uma decepção, pois me impediu de usar alguns modelos realmente excelentes para mesclagem.

Gostaria de expressar minha profunda gratidão aos desenvolvedores dos modelos que forneceram licenças gratuitas, permitindo que seus modelos de alta qualidade — produtos de muito tempo e esforço — sejam usados para mesclagem.

Voltarei em breve.

Aguardo ansiosamente seus testes de desempenho em uma ampla gama de áreas, incluindo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D e NSFW.

Como desenvolvedores de modelos, nós apenas plantamos as sementes. Vocês, usuários de modelos e artistas, cultivam-nas e fazem florescer frutos.

Obrigado, como sempre.


Para quem deseja apoiar meu trabalho com uma pequena contribuição financeira, por favor considere usar os links abaixo. Atualmente, não consigo garantir emprego e enfrento um futuro incerto em relação ao meu sustento.

🌱 doar

A grade de especificações(380.5 MB): baixar


v2.1
Remesclagem e ajuste do v0.1 para 2.0 usando novo algoritmo e fórmula de mesclagem.

A grade de especificações(424.5 MB): baixar

v2.0

Gostaria de agradecer a todos que me ajudaram no lado AlbedoBase XL Pre. Sem vocês, a data de lançamento provavelmente teria sido bem mais tarde. Muito obrigado!

  • Escrevi um script personalizado para convergir os modelos AlbedoBase XL existentes em um só. Alinhando minuciosamente os pesos das linhas e colunas de todos os blocos U-NET e CLIP segundo uma fórmula única minha.

  • Se você encontrar um bug na geração de imagens (se nada for gerado), por favor mude para CLIP SKIP 2 ou modifique o prompt ligeiramente! Pode haver combinações de prompts que o CLIP não reconhece. Nesse caso, você pode mudar a ordem das palavras, usar palavras diferentes ou, mais simplesmente, mudar o CLIP SKIP. Eu irei gradualmente resolver esses problemas no futuro como na v1.3.

A grade de especificações(403.5 MB): baixar

v1.3

  • Para ilustrar a qualidade associada à aleatoriedade do modelo, padronizei o valor da seed em '9' para todas as imagens de demonstração destinadas à amostragem e procedi à sua geração imediata.

  • Especialmente com esta versão, devido ao impacto significativo dos prompts negativos, deixar o campo de prompt negativo vazio é provavelmente para produzir a boa qualidade.

A grade de especificações(438.7 MB): baixar

  • Como você pode ver, conforme o número de Steps aumenta, fica disponível para todos os samplers e a qualidade também melhora.

  • Devido ao efeito do LoRA que desenvolvi e mesclei, conforme descrito abaixo, usar prompts em formato de frase em vez de prompts de tag (lista de palavras) está diretamente relacionado à melhora na qualidade.

  • Mesclei 45 checkpoints e 7 LoRAs. Após isso, mesclei ordem AlbedoBase v0.4 e v0.3, entre 0~5%, para reanimar os modelos mesclados diluídos que tinham se tornado obsoletos.

  • Entre as 7 LoRAs, uma foi criada por mim. Envolve analisar e anotar legendas para um total de 174 fotos pictóricas de alta qualidade usando GPT4-V. Mesclar este LoRA resultou em imagens surpreendentemente claras e uma compreensão impressionante dos prompts.

  • Meus LoRAs auto-criados estão exclusivamente disponíveis para compra aos meus apoiadores do Ko-fi no nível Creative ou superior.


v1.2

  • Mesclou os 22 checkpoints mais recentes.

A grade de especificações(565.6 MB): baixar

v1.1

  • Estabilizado.

  • Mais detalhado.

  • Se você acha que é um usuário avançado, recomendo a versão 1.0. Se a versão 1.0 encontrar as configurações certas, pode produzir trabalhos muito mais vívidos.

A grade de especificações(349.7 MB): baixar

v1.0

  • Mesclou 106 LoRAs.

  • Mesclou 19 Checkpoints.

  1. O modelo pode produzir resultados diferentes dependendo das configurações escolhidas, então é importante verificar a grade de especificações antes de usá-lo.

    • Descobri que usar alguns prompts negativos específicos pode ajudar a resolver o problema de olhos assimétricos ou imagens pixeladas. A grade de especificações pode variar dependendo do seu dispositivo CPU ou GPU, então use-a como referência geral. Experimente alguns prompts negativos para melhorar a qualidade (ex; estrabismo). Descobri que é difícil satisfazer todas as configurações igualmente conforme aumenta o número de LoRA mescladas. Porém, gostaria que você focasse nessa vantagem na versão 1.0, pois pode produzir trabalhos de qualidade incrível em vários aspectos com as configurações certas. Voltarei com uma versão mais estável no futuro.

  2. Você pode encontrar valores de configuração úteis na vitrine ou procurando outros.

  3. Como sempre, é melhor deixar o prompt negativo vazio para melhores resultados.

  4. Este v1.0 foi muito trabalho, então vou fazer uma pausa por um tempo. Espero que gostem de usar o modelo e, se mesclarem, por favor compartilhem no Civitai gratuitamente. Assim, todos podemos continuar melhorando.

A grade de especificações(479.4 MB): baixar

v0.4

  • Mesclou 132 LoRAs.

  • Mesclou 4 Checkpoints.

A grade de especificações: baixar

v0.3

  • Melhorado em todos os samplers.

  • Alcançou realismo vívido.

  • Estabilizado.

A grade de especificações: baixar

v0.2

  • Melhorias significativas em clareza e detalhes.

  • Melhor implementação de mãos e pés.

  • Grandes melhorias estéticas; composição, abstração, fluxo, luz e cor, etc.

v0.1

  • Após ajuste apropriado no modelo SDXL1.0, mesclou meticulosamente e propositalmente mais de 40 modelos de alta qualidade disponíveis publicamente no Civitai.

  • Os testes focaram principalmente em garantir qualidade máxima com o mínimo de tokens no prompt, e não foi confirmado o quanto a qualidade pode melhorar usando um grande número de tokens. (Por favor, realizem seus próprios testes e compartilhem os resultados)

  • Normalmente, os resultados mais bonitos são obtidos no ponto médio entre realidade e animação.

  • No entanto, usando um prompt apropriado, normalmente não há nada que ele não possa expressar. (Afirmo que ele possui valor abundante como modelo base que supera outros em mesclagem. Contudo, tenha em mente que essa é atualmente a v0.1)


Anterior
Shuttle 3 Diffusion - bf16
Próximo
WaduStyle - V1

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

SDXL 1.0

Versão do modelo

v3.1-Large

Hash do modelo

c379d154eb

Criador

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por AlbedoBase XL - v3.1-Large

Vista de uma zona rural italiana ensolarada com colinas onduladas, fazendas, uma vila pitoresca com telhados de terracota e nuvens dramáticas sob um céu azul claro.
Retrato gravado em close-up extremo em preto e branco no estilo grunge de um rosto com texturas detalhadas e linhas expressivas, inspirado por Richard Hambleton.
Retrato abstrato escuro de uma figura feminina com silhueta preta e respingos vívidos de tinta vermelha sobre fundo claro, inspirado no estilo de Richard Hambleton.
Cidade futurista com altas torres cilíndricas de vidro situada em uma paisagem montanhosa nevada sob um céu dramático ao pôr do sol.
Homem de desenho animado com expressão chocada, cabelo selvagem e encaracolado, óculos e barba por fazer, vestindo uma camisa xadrez amarela com gravata vermelha e suspensórios azuis em um fundo verde texturizado.
Uma miniatura de alpaca branca e fofinha com grandes olhos pretos, ao lado de uma pequena casa marrom impressa em 3D.
Uma arte vetorial digital vibrante no estilo William Wray mostrando um elefante tranquilo em forma de balão de ar colorido com um pinguim extravagante empoleirado no topo, cercado por balões multicoloridos contra um fundo de céu.
Gravura impressionista mostrando a silhueta de uma mulher de vestido e chapéu, parada à beira de um rio, olhando para um cachorro pequeno, com uma ponte clássica de Londres e o Big Ben ao fundo.
Uma silhueta em estilo recorte de papel de uma mulher dançando tango, elaboradamente criada em arte de aço com influência kirigami, envolvida por formas abstratas em espiral.

Imagens com 3d

Retrato fotorrealista em close de uma garota hipster estilosa com maquiagem escura, linha da mandíbula definida e um colar atraente.
Imagem 3D realista de Tifa Lockhart sentada com uma perna levantada, vestindo top esportivo branco e calça de moletom preta, mostrando pele brilhante e suor em fundo branco simples.
Uma tartaruga altamente detalhada usando um jetpack, voando acima de um canal urbano vibrante cercado por prédios coloridos sob um céu azul.
Um carro clássico amarelo vibrante acelerando em uma rua urbana molhada com uma grande explosão ao fundo sob um céu nublado.
Loona de Helluva Boss sentada em uma cadeira gamer com grandes olhos vermelhos tristes, segurando uma placa em chamas dizendo 'Preciso de Buzz para gerar mais Loona' dentro de uma sala de jogos.
Quarto compacto futurista com design metálico e industrial, apresentando uma cama bagunçada próxima a uma grande janela panorâmica com vista para o horizonte da cidade cyberpunk iluminada por neon à noite.
Uma imagem fotorrealista de uma mulher estilosa em um vestido vermelho marcante e óculos escuros, posando confiante em um terminal de aeroporto cercada por uma pilha alta e caótica de malas coloridas sobre um carrinho de bagagem.
Uma menina mariposa 3D realista com cabelo preto e branco dividido, olhos vermelhos grandes e expressão admirada com baba, inclinação sobre uma lâmpada brilhante sobre uma mesa de madeira.
Uma arbalista medieval feminina renderizada em 3D com cabelo castanho trançado, olhos castanhos, vestindo roupa medieval marrom clara e armadura de couro, segurando uma besta com um olhar sério de lado.
Arte digital 3D de um gato pirata amarelo com olhos azuis brilhantes, um grande chapéu de pirata marinho adornado com um emblema de caveira, uma capa marinha detalhada presa por correntes douradas, e um casaco marrom, posando confiante contra um fundo de vitral.

Imagens com tudo em um

Uma freira de anime fofa com cabelo loiro trançado, grandes olhos azuis e expressão alegre. Ela está vestida com o hábito tradicional de freira com véu preto e faixa branca na cabeça, segurando as mãos em uma pose de oração. Esta imagem foi gerada por IA usando Stable Diffusion.
Garota no estilo anime com cabelo azul longo em rabo de cavalo, segurando uma katana, de pé sob árvores de sakura em flor. Criado com IA usando Stable Diffusion.
Garota anime com cabelo longo azul-cinzento, traje ornamentado e acessórios detalhados, imagem gerada por IA usando Stable Diffusion.

Imagens com anime

Uma pintura digital detalhada de uma garota anime com cabelo loiro e olhos azuis marcantes, iluminada por uma luz suave e onírica em estilo CGI.
Retrato em close de Dio Brando com cabelo loiro e faixa verde na cabeça, cercado por efeitos brilhantes sob um céu azul brilhante.
Um bar cyberpunk iluminado por luzes de neon violeta, cheio de frequentadores futuristas usando capacetes e equipamentos cibernéticos, com telas holográficas e uma atmosfera high-tech.
Uma garota de anime detalhada com cabelo loiro vestindo roupas brancas e vermelhas caminhando por um riacho na floresta cercada por águas-vivas laranja brilhantes ao anoitecer.
Retrato de uma garota elfa com longos cabelos brancos em twintails, olhos azuis, orelhas pontudas, usando uma capa branca com detalhes em dourado e joias sobre fundo preto.
Garota elfa em estilo anime com longos rabos de cavalo prateados e olhos verdes, em pé em um campo de flores azuis, vestindo um capuz branco, camisa listrada e meia-calça preta.
Uma jovem mulher anime com olhos azuis e cabelo castanho está diante de um fundo mosaico floral azul cobalto em uma estética sonhadora.
Ilustração digital em estilo anime mostrando uma grande estrutura pontiaguda de pirâmide de pedra triangular em terra árida com pedras espalhadas sob um céu estrelado e um planeta com anéis laranja.
Guerreira feminina detalhada em estilo anime, com traje de couro preto, em uma pose dinâmica com efeitos coloridos em azul e laranja rodopiando ao fundo.
Um retrato detalhado de um ciborgue com cabelo branco longo, olhos azuis e armadura robótica intrincada, em uma paisagem urbana futurista cyberpunk à noite.

Imagens com modelo base

Cena fotorrealista de personagens mortos-vivos incluindo zumbis e esqueletos caminhando por um cemitério assustador iluminado por lanternas de abóbora brilhantes sob um céu escuro e ameaçador.

Imagens com fotorealista

Silhueta de um homem cibernético com asas e pernas longas e esbeltas preenchida com colagem de mídia mista fotorrealista de paisagens urbanas e edifícios sob iluminação cinematográfica.
Imagem futurista em preto e branco com linhas metálicas que se estendem do topo, com folhagem com tons vermelhos emoldurando a cena e um diamante azul pulsante no centro.
Imagem fotorrealista de um robô empregada deitada no chão da floresta com folhagem entrelaçada em seus cabelos e partes corporais robóticas, vestindo um vestido branco de empregada.
Supermodelo fantástica com beleza etérea vestindo um vestido avant-garde vibrante e colorido, adornado com joias intrincadas, contra um fundo ondulante e vívido multicolorido.
Jovem barista feminina atrás do balcão rústico de uma cafeteria, vestindo camisa preta com botões e avental preto, sorrindo suavemente com maquiagem natural e cabelo preso.
Três mulheres usando suéteres e calças em estilo náutico, juntas no convés de um iate de luxo à noite com o oceano do Caribe ao fundo.
Cena fotorrealista de uma jovem japonesa em um vestido de verão colorido esvoaçante caminhando por uma trilha na floresta cercada por águas-vivas flutuantes e brilhantes sob iluminação natural.
Uma garota fofa sentada confortavelmente em uma biblioteca aconchegante, estudando à luz de velas com iluminação de ambiente quente e um livro aberto à sua frente.
Uma ilustração vetorial 2D detalhada de uma mulher adornada com flores de orquídea negra e padrões florais intrincados em estilo barroco.
Close-up de um jovem com uma barbeta loira curta e óculos, meio iluminado pelo sol da manhã, com um gato tigrado descansando em seu ombro.