Um caldeirão de bronze cheio de folhas e galhos repousa ao lado de um grande tronco de árvore coberto de musgo em uma floresta de outono vibrante, cercado por samambaias e folhagem marcante.
Uma mulher encapuzada com vestes esfarrapadas senta-se numa mesa de madeira iluminada por velas em uma taberna escura, lendo um livro antigo com símbolos rúnicos, cercada por velas tremulantes e sombras.
Interior de quarto no estilo Njideka Akunyili Crosby mostrando uma mulher reclinada em uma cama com tecidos vibrantes, cercada por recortes de revistas, cortinas de renda e pinturas de retratos nas paredes.
Clareira em estilo aquarela e carvão à beira de um lago durante o anoitecer na primavera com estética suave de fundo de visual novel de horror anime dos anos 1920.
Uma mulher misteriosa em um longo sobretudo escuro com cabelo selvagem está contra um fundo abstrato em tinta azul e cinza com hachuras caóticas e iluminação dramática.
Silhueta de uma casa tradicional e gazebo envoltos em névoa espessa com uma grande montanha ao fundo durante a luz do início da manhã.
Vários pagodes emergem de montanhas cobertas de névoa, olhando para um rio com barcos tradicionais flutuando, enquadrados pela névoa e árvores distantes.
Vista aérea de uma cabana retangular longa situada no fundo de um vale verde, cercada por árvores densas e montanhas imponentes sob um céu escuro, carregado de chuva com muitas nuvens.
Cabana quadrada moderna inclinada para frente em uma floresta à noite, com uma grande parede de vidro, sofá preto interno, plantas, iluminação incandescente quente e assentos na varanda externa.
Cabana de madeira com estufa de dois andares elevada sobre pilares em superfície florestal inclinada cercada por pinheiros, névoa e grama amarela.
Duas cabines modernas de concreto com grandes janelas de vidro empilhadas perpendicularmente sobre colunas de concreto, situadas em uma encosta de montanha rochosa coberta de neve com um pano de fundo montanhoso.
Cabana moderna retangular pintada de branco com janelas de vidro e iluminação interna, elevada acima das árvores da floresta em duas colunas inclinadas de concreto sob um céu cinzento.

Prompts Negativos Recomendados

(deformed iris, deformed pupils), text, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, (extra fingers), (mutated hands), poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, (fused fingers), (too many fingers), long neck, camera

Parâmetros Recomendados

samplers

Euler

steps

50

cfg

8

resolution

525x525

Dicas

O modelo é destinado a fins de pesquisa, incluindo geração de obras de arte, ferramentas educacionais e implantação segura.

Não é destinado a gerar representações factuais ou verdadeiras de pessoas ou eventos.

As limitações incluem fotorealismo imperfeito, incapacidade de renderizar texto legível, desafios com prompts composicionais e possível geração incorreta de faces.

O modelo utiliza dois codificadores de texto pré-treinados: OpenCLIP-ViT/G e CLIP-ViT/L.

O pipeline em duas etapas inclui geração latente base seguida de refinamento em alta resolução usando SDEdit (img2img).

Patrocinadores do Criador

Originalmente Publicado no Hugging Face e compartilhado aqui com permissão da Stability AI.

Originalmente Publicado no Hugging Face e compartilhado aqui com permissão da Stability AI.

O SDXL consiste em um pipeline de duas etapas para difusão latente: Primeiro, usamos um modelo base para gerar latentes do tamanho desejado da saída. Na segunda etapa, usamos um modelo especializado de alta resolução e aplicamos uma técnica chamada SDEdit (https://arxiv.org/abs/2108.01073, também conhecido como "img2img") nos latentes gerados na primeira etapa, usando o mesmo prompt.

Descrição do Modelo

  • Desenvolvido por: Stability AI

  • Tipo de modelo: Modelo generativo texto-imagem baseado em difusão

  • Descrição do modelo: Este é um modelo que pode ser usado para gerar e modificar imagens com base em prompts de texto. É um Modelo de Difusão Latente que usa dois codificadores de texto pré-treinados fixos (OpenCLIP-ViT/G e CLIP-ViT/L).

  • Recursos para mais informações: Repositório GitHub.

Fontes do Modelo

Usos

Uso Direto

O modelo é destinado apenas para fins de pesquisa. Áreas e tarefas possíveis de pesquisa incluem

  • Geração de obras de arte e uso em design e outros processos artísticos.

  • Aplicações em ferramentas educacionais ou criativas.

  • Pesquisa em modelos generativos.

  • Implantação segura de modelos com potencial para gerar conteúdo prejudicial.

  • Investigação e entendimento das limitações e vieses dos modelos generativos.

Usos excluídos são descritos abaixo.

Uso Fora do Escopo

O modelo não foi treinado para ser representações factuais ou verdadeiras de pessoas ou eventos, portanto, usar o modelo para gerar tais conteúdos está fora do escopo das capacidades deste modelo.

Limitações e Viés

Limitações

  • O modelo não alcança fotorealismo perfeito.

  • O modelo não consegue renderizar texto legível.

  • O modelo tem dificuldade com tarefas mais complexas que envolvem composição, como renderizar uma imagem correspondente a “Um cubo vermelho em cima de uma esfera azul”.

  • Faces e pessoas em geral podem não ser geradas corretamente.

  • A parte de autoencodificação do modelo é com perda.

Viés

Embora as capacidades dos modelos de geração de imagem sejam impressionantes, eles também podem reforçar ou exacerbar vieses sociais.

O gráfico acima avalia a preferência dos usuários pelo SDXL (com e sem refinamento) em comparação ao Stable Diffusion 1.5 e 2.1. O modelo base SDXL apresenta desempenho significativamente melhor que as variantes anteriores, e o modelo combinado com o módulo de refinamento alcança o melhor desempenho geral.

Anterior
Plant Milk 🌿 - Pacote de Modelos - Walnut
Próximo
FLUX.1 - DEV FP8 - Kijai [11 GB]

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

SDXL 1.0

Versão do modelo

v1.0 VAE fix

Hash do modelo

e6bb9ea85b

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por SD XL - v1.0 VAE fix

Um caldeirão de bronze cheio de folhas e galhos repousa ao lado de um grande tronco de árvore coberto de musgo em uma floresta de outono vibrante, cercado por samambaias e folhagem marcante.
Uma mulher encapuzada com vestes esfarrapadas senta-se numa mesa de madeira iluminada por velas em uma taberna escura, lendo um livro antigo com símbolos rúnicos, cercada por velas tremulantes e sombras.
Interior de quarto no estilo Njideka Akunyili Crosby mostrando uma mulher reclinada em uma cama com tecidos vibrantes, cercada por recortes de revistas, cortinas de renda e pinturas de retratos nas paredes.
Clareira em estilo aquarela e carvão à beira de um lago durante o anoitecer na primavera com estética suave de fundo de visual novel de horror anime dos anos 1920.
Uma mulher misteriosa em um longo sobretudo escuro com cabelo selvagem está contra um fundo abstrato em tinta azul e cinza com hachuras caóticas e iluminação dramática.
Silhueta de uma casa tradicional e gazebo envoltos em névoa espessa com uma grande montanha ao fundo durante a luz do início da manhã.
Vários pagodes emergem de montanhas cobertas de névoa, olhando para um rio com barcos tradicionais flutuando, enquadrados pela névoa e árvores distantes.
Vista aérea de uma cabana retangular longa situada no fundo de um vale verde, cercada por árvores densas e montanhas imponentes sob um céu escuro, carregado de chuva com muitas nuvens.
Cabana quadrada moderna inclinada para frente em uma floresta à noite, com uma grande parede de vidro, sofá preto interno, plantas, iluminação incandescente quente e assentos na varanda externa.
Cabana de madeira com estufa de dois andares elevada sobre pilares em superfície florestal inclinada cercada por pinheiros, névoa e grama amarela.
Duas cabines modernas de concreto com grandes janelas de vidro empilhadas perpendicularmente sobre colunas de concreto, situadas em uma encosta de montanha rochosa coberta de neve com um pano de fundo montanhoso.
Cabana moderna retangular pintada de branco com janelas de vidro e iluminação interna, elevada acima das árvores da floresta em duas colunas inclinadas de concreto sob um céu cinzento.

Imagens com modelo base

Cena fotorrealista de personagens mortos-vivos incluindo zumbis e esqueletos caminhando por um cemitério assustador iluminado por lanternas de abóbora brilhantes sob um céu escuro e ameaçador.

Imagens com oficial

Um retrato hiperdetalhado de uma guerreira feminina com cabelo azul escuro e olhos amarelos hipnotizantes, segurando um orbe dourado luminoso em armadura dourada sob iluminação cinematográfica.

Imagens com sdxl

Um dragão detalhado com brilho metálico e intricadas veias ais-vesselz pulsantes vermelhas e azuis cobrindo seu corpo.
Uma paisagem urbana abandonada com edifícios em ruínas entrelaçados com ais-vesselz vermelhos pulsantes, ruas cobertas com líquido vermelho viscoso.
Close-up de uma cabeça de dragão robótico com placas de armadura azul, destacada com brilhos celestiais e cel shading nítido contra o horizonte de uma cidade ao anoitecer.

Imagens com stability ai

Menina loira em estilo anime vestindo um vestido branco de verão e um grande chapéu de sol com decoração de girassol, felizmente posicionada em um campo de girassóis ao pôr do sol com os braços levantados.
Personagem Ffixgarnet com cabelo longo preto e olhos castanhos, vestindo um body laranja com amarração cruzada, mangas bufantes brancas e luvas vermelhas, subindo uma escada de corda de madeira contra fundo de céu azul, corada e olhando para trás
Personagem de anime com cabelo rosa-choque e asas ígneas agachada em uma pose dinâmica contra um fundo roxo de fantasia sombria com rochas afiadas e irregulares.
Vista em close-up de múltiplas esferas texturizadas pretas flutuando contra um fundo cósmico escuro com luzes coloridas e sonhadoras de bokeh.
Close-up de um ciborgue com capacete preto fosco sem rosto, cabelo preto longo e armadura vermelha e preta intrincada brilhando levemente em vermelho em um ambiente de clima sombrio.
Guerreira empregada com twintails verdes empunhando uma arma de haste com serra circular em uma fábrica de robôs mal iluminada com peças mecânicas e cabos, respingos de sangue no chão.