Girafa preta e branca contempla um dente-de-leão gigante em uma encosta nevada sob um céu ventoso dispersando sementes de dente-de-leão em tons monocromáticos.

Prompts Negativos Recomendados

big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Parâmetros Recomendados

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, DPM++ 2M beta, sgm_uniform, DDEIS, normal, simple, beta, dpmpp_3m_sde, dpmpp_3m_sde_gpu

steps

12 - 25

cfg

1.5 - 11

Dicas

Use DPM++ 2/3M SDE com os samplers Karras ou Exponential e 25+ passos com CFG em torno de 5-7 para melhores resultados com SDXL.

Tente DPM++ SDE Karras com menos passos (ex. 12) e CFG mais alto (8-11) para estilizações alternativas.

Samplers Euler Ancestral / Normal produzem resultados menos detalhados que podem ser desejáveis com o modelo Fv6 para reduzir ruído.

O CLIP Skip padrão é 2, mas testar 1 pode melhorar a aderência ao prompt, e 3-4 pode melhorar o foco nos conceitos.

Para modelos Flux, samplers como DPM++ 2M beta ou sgm_uniform são preferidos.

As configurações de CFG influenciam muito a qualidade da imagem; CFG baixo (1.5-2.5) evita efeito de pele plástica em fotos, enquanto estilos de ilustração podem exigir CFG mais alto (3-6+).

CFG ou passos inadequados frequentemente causam imagens borradas ou malformadas, e ajustes podem ser necessários dependendo do estilo.

Destaques da Versão

Baseado no Fv4 com uma fusão com algumas versões anteriores dos meus modelos, bem como BigLove_XL2 para avançar ainda mais o realismo.

O resultado é que o Fv5 é minha versão mais fotorealista até agora, com imagens mais precisas e sutis comparadas ao F4, mas conforme o realismo é ampliado, o modelo fica menos capaz de produzir imagens estilizadas, especialmente ilustrações: uma nova versão da série G virá em breve para esses casos :)

Para as configurações, DPM++ 2/3M SDE / Karras ou Exponential são sempre boas escolhas com 25+ passos e CFG entre 5-7. Mas DPM++ SDE / Karras com menos passos (ex. 12) e CFG maior (8-11) vale a pena tentar. O padrão CLIP SKIP de 2 também é uma boa opção, mas usar 1 ou 3-4 também vale testar.

Patrocinadores do Criador

Se você gosta da minha contribuição para esta comunidade, sinta-se à vontade para me comprar um café: quanto mais cafeína eu tomar, mais modelos posso criar 😅

Se você gosta da minha contribuição para esta comunidade, sinta-se à vontade para me comprar um café: quanto mais cafeína eu tomar, mais modelos posso criar 😅

Galeria de comparação aqui: Fv6-Fv5 e comparação de ilustrações NSFW entre Gv1-Cv6-Fv2.

Modelo SOTA atual no meu experimento:

  • Modelo base SDXL: Gv4 é o modelo mais equilibrado que permite imagens realistas e estilizadas NSFW e SFW. Estética melhor que o Fv6, mas menos fotorealista.

  • Modelo fotorealista SDXL (SFW e NSFW): Fv6 é o caminho para hiper-realismo, incluindo imagens NSFW realistas, mas carece bastante das capacidades de estilização do Gv4.

  • Ilustração SDXL : Gv4 (SFW e NSFW). Cv6 ainda vale a pena tentar se você não gosta de imagens NSFW.

  • Modelo Flux: Flux1-A1

Configurações de geração de imagem para modelos SDXL

DPM++ 2/3M SDE / Karras ou Exponential são sempre uma boa aposta com 25+ passos e CFG em torno de 5-7. Mas DPM++ SDE / Karras com menos passos (ex. 12) e CFG maior (8-11) vale a pena tentar, assim como Euler Ancestral / Normal para um resultado com menos detalhes que também pode ser interessante com um modelo como Fv6 para obter algo menos "ruidoso".

O padrão CLIP Skip de 2 também é uma boa escolha, mas usar 1 ou 3-4 também é válido: 1 enfatiza mais a aderência ao prompt e 3-4 às vezes oferece um resultado melhor do que o padrão, focando mais nos "conceitos".

Configurações de geração de imagem para modelos Flux

Minhas configurações preferidas são DPM++ 2M / beta ou sgm_uniform ou DDEIS / normal para sampler/ scheduler, beta resultando em uma imagem mais forte e vívida. Para uma imagem mais sutil, Euler / simple ou beta parecem boas opções.

O CFG parece ter um enorme impacto na imagem final e ser muito sensível a pequenas variações.

  • Para fotos, o CFG deve permanecer baixo (1.5-2.5) para evitar efeito de pele plástica.

  • Para arte fina e ilustração, é mais complicado pois depende do meio. Para estilos "brutos" (pintura, aquarela etc.), o CFG deve ficar baixo na faixa de 1.5-2.5, mas para estilo anime ou quadrinhos, o CFG geralmente precisa ser aumentado para atingir o estilo desejado (3-6 ou mais).

Se a imagem estiver bagunçada/malformada ou borrada, geralmente é porque o CFG/passos não estão adequados para essa imagem, mas nem sempre é fácil saber se devem ser aumentados ou diminuídos (pelo menos para mim 😊).

Com certeza há bastante a aprender sobre o comportamento do Flux que é bem diferente do SDXL e precisaremos nos adaptar.

Fluxo de trabalho

Todas as minhas imagens são carregadas com o workflow ComfyUI embutido que infelizmente é incompatível com o processamento do CivitAI e geralmente o prompt não pode ser recuperado. Você pode, no entanto, baixar a imagem PNG original com o workflow incluído clicando no ícone "DOWNLOAD" no visualizador de imagens.

Por que eu tento publicar principalmente imagens direto do meu modelo com talvez um pouco de Lora (meu ou algum aprimorador de detalhes), também uso às vezes Controlnet para obter composições melhores e mais detalhadas com mais facilidade: neste caso a imagem fonte obviamente não está no workflow, mas acho que você ainda pode usar a imagem que publico como fonte se quiser fazer uma variação :)

Passado


A partir da série E, os modelos evoluem às vezes fundindo-se com outros modelos (graças a outros contribuidores!), mas principalmente via treinamento no meu próprio conjunto de dados: um conjunto modesto (~2000 imagens atualmente), mas tento compensar de alguma forma com qualidade e originalidade.

A partir do Fv1, incluí muitas imagens sintéticas que criei usando versões anteriores: trabalhando muito com o prompt e retocando quando necessário no Photoshop para ter um conjunto de dados que contém muitas imagens originais.


A ideia central por trás deste modelo era criar uma ferramenta versátil mesclando alguns dos melhores modelos existentes que combinam com meu gosto pessoal (fotografia e arte fantástica para simplificar). Meus objetivos principais eram:

  1. Fotorealismo: A capacidade de produzir imagens impressionantemente realistas tanto de pessoas quanto de objetos/natureza.

  2. Flexibilidade: A capacidade de criar imagens altamente estilizadas, permitindo expressão artística através de vários estilos e combinações de artistas. Sou de uma geração mais antiga e venho da Europa, então "estilo" para mim não significa "anime kawaii japonês com peitos" ou "desenho da DC Comics com muitos super-heróis e mulheres loiras voluptuosas", mas mais de um universo de Frank Frazetta, Milo Manara, Boris Vallejo, H.R.Giger, Wojtek Siudmak e mestres da arte fantástica: com certeza há peitos envolvidos, mas o estilo é um pouco diferente :P

  3. Como não gosto de ser limitado na minha exploração do corpo humano, a ideia também é ter um modelo NSFW razoavelmente capaz. Contudo, devido à natureza das imagens de treinamento disponíveis nos conjuntos de dados, NSFW geralmente vem com um forte viés para fotos pornográficas ou anime pornográfico japonês e impacta a flexibilidade (tipicamente assim que você usa a palavra "sexy" no seu prompt, precisa ponderar o estilo). Portanto, este ponto NÃO é prioridade para o modelo base, mas é enfatizado no modelo NSFW.

Anterior
ICBINP XL - v4
Próximo
MonsterCoffeeBang! Mix - v1.1 Sem VAE

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

SDXL 1.0

Versão do modelo

Fv5

Hash do modelo

17b3e65f07

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por O Experimento Araminta (SDXL+Flux) - Fv5

Girafa preta e branca contempla um dente-de-leão gigante em uma encosta nevada sob um céu ventoso dispersando sementes de dente-de-leão em tons monocromáticos.

Imagens com modelo base

Cena fotorrealista de personagens mortos-vivos incluindo zumbis e esqueletos caminhando por um cemitério assustador iluminado por lanternas de abóbora brilhantes sob um céu escuro e ameaçador.

Imagens com conteúdo adulto

Uma jovem mulher elegante vestindo um macacão vermelho vibrante com detalhe na gola preta, sentada de forma elegante em uma cadeira de madeira estofada carmesim, com cabelo escuro liso e rosto detalhado.
Vista de perfil de uma guerreira cibernética com longos cabelos rosa trançados, tatuagens no braço, vestindo colete de armadura azul-petróleo e segurando uma katana, com fundo industrial iluminado por neon.
Ilustração em estilo anime de uma garota loira com olhos azuis vestindo um biquíni vermelho, posando confiantemente na praia com gotas de água na pele e ondas ao fundo.
Uma pintura digital detalhada de uma guerreira feroz de longos cabelos vermelhos agachada sobre um pedestal de pedra em um cemitério, segurando uma espada nas costas. Ela veste armadura escura e uma capa azul esverdeada, iluminada por relâmpagos místicos no céu noturno.
Uma jovem usando um chapéu de palha e vestido está com sua bicicleta em um caminho no campo cercado por flores silvestres, observando o pôr do sol sobre uma vila e colinas onduladas.
Retrato em close-up de uma princesa guerreira viking com moicano branco, olhos azuis, joias intrincadas, roupas de pele e tatuagens, com céu noturno ao fundo com nébula e estrelas.
Uma feminina steampunk com cabelo trançado e óculos na cabeça, apresentando um torso mecânico transparente com engrenagens e pistões visíveis, posando confiante em uma paisagem urbana mecânica.
Vista em close de uma mulher pequena usando óculos escuros e jaqueta de couro, iluminada por luzes de neon em uma cidade futurista à noite com estilo synthwave retrô dos anos 1980.
Uma mulher cyborg cyberpunk com chifres oni vermelhos e cabelo preto, usando uma máscara preta e braços mecânicos azuis, segurando uma espada katana azul brilhante em um corredor futurista escuro.
Uma garota em estilo cyberpunk com cabelo preto curto, vestindo um top amarelo e calças pretas de cintura alta, segurando uma arma futurista em pé diante de um grande tanque mecha e cenário industrial.

Imagens com fotorealista

Um resort futurista à beira-mar no Caribe com vilas flutuantes luminosas e palmeiras geneticamente aprimoradas sob sóis gêmeos em um céu noturno sereno, com passarelas bioluminescentes e drones.
Uma criatura alienígena deformada com olhos grandes está contra um fundo escuro e assustador, iluminada por uma iluminação perturbadora e cinematográfica.
Imagem fotorealista de uma modelo feminina de moda com cabelo curto vestindo jaqueta amarela, top branco, saia preta, leggings laranja e saltos altos brancos, em pé em ambiente interno.
Retrato fotorrealista de uma mulher moderna com cabelo loiro encaracolado usando tecidos vibrantes e joias intrincadas, com fundo de tapeçaria ornamentada.
Mulher loira com sardas e sorriso sentada ao ar livre usando camiseta vinho decote em V e micro-saia floral sob iluminação natural
Cobra verde esmeralda hiper-realista enrolada em um galho de árvore coberto de musgo com a boca bem aberta, revelando presas venenosas pingando veneno, cercada por folhagem tropical exuberante e luz suave do sol.
Close-up da cabeça de um humanoide réptil fotorrealista com pele escamosa texturizada altamente detalhada iluminada por iluminação dramática quente.
Retrato de uma dama medieval baixa usando armadura brigandina reforçada com peitoral metálico e braçadeiras de braço, de pé em uma praça medieval com olhos amarelos e cabelo preto curto.
Uma imagem fotorrealista de um modelo alado posando dramaticamente com salto alto em um ambiente de desfile de moda com estilo de filme vintage e fumaça.

Imagens com realista

Um resort futurista à beira-mar no Caribe com vilas flutuantes luminosas e palmeiras geneticamente aprimoradas sob sóis gêmeos em um céu noturno sereno, com passarelas bioluminescentes e drones.
Retrato realista de uma menina com cabelo castanho longo e olhos castanhos, usando brincos rosa em forma de coração e um colar preto com pingentes de coração, língua para fora com uma gota de saliva, contra um fundo preto
Retrato fotorrealista de uma mulher moderna com cabelo loiro encaracolado usando tecidos vibrantes e joias intrincadas, com fundo de tapeçaria ornamentada.
Retrato estilizado de uma garota gato com pele azul, olhos vermelhos brilhantes, cabelo branco e maquiagem futurista vestindo uma roupa preta semelhante a uma armadura contra um fundo vibrante vermelho e azul com iluminação neon e fumaça vermelha.
Retrato animado de Lois Lane usando um paletó roxo e saia preta, de pé em uma rua urbana com arranha-céus ao fundo, segurando uma bolsa roxa e sorrindo.
Uma jovem com cabelos longos e brancos usando traje preto do Homem de Ferro e uma máscara de gás preta futurista, de pé em frente a um alienígena de pele negra com olhos vermelhos brilhantes dentro de uma nave escura.
Homem realista vestindo armadura de poder sci-fi de alta tecnologia com pelos faciais e olhos azuis, em um cenário urbano com fundo desfocado.
Retrato em close de uma mulher loira usando armadura metálica detalhada e reflexiva com ombreiras e peitoral, contra um fundo desfocado de pilares de pedra antiga.
Mulher musculosa renderizada em 3D com sardas e cabelo preto em um plugsuit brilhante, posando contra um fundo vermelho simples com iluminação cinematográfica e estilo atompunk.

Imagens com mulher

Uma mulher elfa de cabelo prateado usando armadura futurista está contra um céu colorido e turbulento com nuvens, retratada em estilo vívido de pintura a óleo cyberpunk.
Retrato animado de Lois Lane usando um paletó roxo e saia preta, de pé em uma rua urbana com arranha-céus ao fundo, segurando uma bolsa roxa e sorrindo.
Retrato de corpo inteiro de uma mulher com sardas e cabelo ruivo longo usando um vestido esvoaçante multicolorido em tons de laranja, roxo e azul.
Uma mulher segurando uma vela acesa com um fundo escuro totalmente preto iluminando metade do seu rosto com a luz quente da vela.
Retrato de uma mulher com cabelo loiro platinado e olhos roxos, vestindo um top cropped preto ombro a ombro, em frente a uma parede texturizada amarronzada, mostrando uma tatuagem no braço superior e físico definido.
Mulher musculosa renderizada em 3D com sardas e cabelo preto em um plugsuit brilhante, posando contra um fundo vermelho simples com iluminação cinematográfica e estilo atompunk.
Retrato em close de uma mulher com olhos verdes deitada em uma cama, iluminada pela luz quente do sol da hora dourada em ambiente interno.
Retrato em close-up de uma mulher com cabelo médio bagunçado e luz quente nos lábios, enquadrada por uma janela vintage com sombra parcial e reflexo da Torre Eiffel.
Mulher em estilo anime com cabelo de cobra verde sentada em cadeira de escritório azul à sua mesa, vestindo traje profissional e salto alto preto.
Uma mulher parecida com Medusa com cobras verdes como cabelo, usando óculos e um vestido vermelho, acenando para o espectador com grandes olhos verdes.