modelos/EnvyBetterHands LoCon - beta2

EnvyBetterHands LoCon - beta2

João Silva

5/17/2025

1:22:11 PM

| Discussion|

Palavras-chave e Tags Relacionadas

ba43b0efee,conceito,_envy_,envybetterhands locon,hands,locon,fotorealista,sd 1.5

Retrato de uma garota com cabelo curto preto e chifres de demônio vestindo armadura de renda preta e uma capa esvoaçante em estilo monocromático com olhos azuis e fundo decorativo.

Uma fada de cabelo prateado vestindo um vestido verde justo e uma tiara, parada em uma floresta mística sob a lua cheia com asas amarelas brilhantes e fadas ao seu redor.

Um estudioso masculino loiro platinado focado em traje formal sentado em uma mesa de madeira em uma vasta biblioteca, cercado por símbolos mágicos azuis brilhantes e livros antigos, com luz mágica rodopiante e formas geométricas flutuantes.

Retrato de uma mulher vampira loira platinada com olhos roxos brilhantes e manchas de sangue, vestindo uma capa roxa escura e um espartilho de couro, parada em um cemitério gótico enevoado sob uma lua vermelha com morcegos voando.

Retrato de um comandante militar determinado com cabelo ruivo e olhos azuis vestindo um uniforme elegante azul-marinho com detalhes em ouro, misturando estilos da era napoleônica e cyberpunk, em uma fortaleza urbana com fumaça.

Um retrato detalhado de uma mulher vampira com capuz, sardas, olhos de jade e cabelo castanho claro trançado, em pé em um cemitério enevoado ao luar com uma atmosfera aterrorizante.

Um retrato detalhado de uma mulher hemomancer élfica sardenta usando capuz e vestes escarlates, com olhos vermelhos sangue e símbolos mágicos intricados girando em uma caverna sombria na floresta.

Uma mulher mítica atlanteana com cabelo prateado e armadura aquática intricada flutua graciosamente debaixo d'água cercada por recifes de coral, vida marinha luminosa e profundezas oceânicas místicas.

Uma ilustração de fantasia sombria de uma mulher psíquica com cabelo castanho escuro e olhos fechados, segurando esferas de energia mágica azul brilhante com um misterioso terceiro olho na testa e tatuagens intrincadas, em uma atmosfera etérea.

Retrato lateral de um tecno-bruxo com cabelo prateado, olhos cinza-azuis, usando roupas de mago escuras e esfarrapadas e óculos de ficção científica em um fundo gótico e assustador.

Retrato de uma sacerdotisa mágica da lua com cabelos brancos, olhos azuis brilhantes, armadura azul elaborada e fundo com observatório lunar sob a lua cheia.

Um homem masculino de cabelos brancos em trajes intricados de guerreiro gótico está sob um céu iluminado pela lua luminosa segurando um símbolo de crescente azul brilhante.

Prompts Recomendados

nice hands,perfect hands,beautiful hands,fingernails

(masterpiece,best quality:1.3),nice hands

Prompts Negativos Recomendados

extra fingers,deformed hands,polydactyl:1.5,worst quality, low quality, poor quality, bad quality:1.35

deformed hands,polydactyl:1.3),(worst quality,low quality,poor quality,bad quality:1.35)

Parâmetros Recomendados

samplers

DPM++ 2M Karras

steps

32 - 60

cfg

9.5 - 15

resolution

512x768

vae

vae-ft-mse-840000-ema-pruned.vae

other models

7th_anime_v3_B (b000309cca), revAnimated_v12 (02aecf0c7d), EnvyCuteMix01, EnvyMix_V11 (c0c4ed6b84), EnvyMix_v1 (53c86ec36e), theovercomer8sContrastFix_sd15, applesugarJam_applesugarJamV10 (3c5afac440)

Parâmetros Recomendados para Alta Resolução

upscaler

4x-AnimeSharp

upscale

steps

13 - 18

denoising strength

0.44

Dicas

A força deve ser configurada em torno de 1.0.

Combine livremente com outras LoRAs para melhores resultados.

Evite usar embeddings negativos como badhandv4 para melhorar mãos.

Experimente o limiar dinâmico para melhores resultados.

Destaques da Versão

Reiniciado o treinamento do zero, porque aparentemente treinar no vanilla 1.5 é melhor para criar modelos que não exageram ou mudam muito o estilo. Esta nova versão ainda precisa de mais treinamento, então não é tão eficaz quanto a antiga, mas parece melhorar as coisas em média, funciona em muito mais modelos e não altera o estilo, então acho que é o caminho certo. Vou brincar com prompts e atualizar a descrição principal com conselhos.

Patrocinadores do Criador

Estou usando Lora Block Weight. Acredito que você também possa usar Additional Networks e SD Webui Lycoris.

Este modelo é um LoCon. Você DEVE instalar a extensão Lycoris para que ele carregue.

Estou usando Lora Block Weight. Acredito que você também possa usar Additional Networks e SD Webui Lycoris.

ATUALIZAÇÃO 27/04/2023: Cheguei a um platô no treinamento, então estou no processo de adicionar muitas mais imagens ao conjunto de dados, incluindo algumas mais complicadas como dedos entrelaçados. Provavelmente terei que diminuir ainda mais a taxa de aprendizado, então as coisas podem ficar mais lentas a partir daqui. Vou manter todos informados conforme o progresso.

Conselhos de prompt para beta 2:

Este é um treino completamente novo sobre o vanilla Stable Diffusion 1.5. Fiz isso baseado no conselho de um entusiasta, e é surpreendente o quanto ele é mais compatível com modelos diferentes. Ele não altera o estilo do seu modelo de forma alguma, pelo que consegui perceber, e realmente afeta apenas as mãos e ocasionalmente os braços, deixando o restante intocado.
Parece funcionar melhor com força em 1, embora aumentar para valores mais altos (1.5, 2, etc.) possa ajudar em algumas imagens, ao custo de piorar outras. Não há necessidade de mexer na escala CFG, pois isso não causa exageros nesses níveis.
Combine livremente com outras LoRAs.
Obtive os melhores resultados colocando "nice hands, perfect hands" no prompt positivo (aumentar o peso piora as coisas), e "(extra fingers, deformed hands, polydactyl:1.5)" no prompt negativo. Isso é com EnvyMix v1 (e provavelmente RevAnimated), mas seus resultados podem variar para outros modelos.
Embeddings negativos de "bad hands" parecem piorar, embora eu não tenha testado extensivamente.
Como de costume, isso não fará milagres, mas percebo que, em muitas imagens, melhora as coisas em geral. Espero que continue melhorando com mais algumas noites de treinamento.

Conselhos de prompt para alpha 3 e beta 1:

Note que esse conselho é para RevAnimated 1.2. Seus resultados podem variar com outros modelos.
Ele tende a exagerar um pouco, mas você precisa que a força esteja definida em 1.0 para funcionar bem. Você pode contornar isso reduzindo o valor CFG para cerca de 5 ou 6. Tive bons resultados ativando a extensão de limiar dinâmico e configurando-a para imitar CFG 5, assim posso definir meu valor CFG para 9 ou 10 e os resultados ficam bons.
Usei com outra LoRA e obtive resultados estranhos, então pode variar também aí. No momento, estou tentando fazê-lo funcionar consistentemente em um caso simples de uso.
Curiosamente, acho que ele regrediu um pouco nas mãos em posições neutras, mas está visivelmente melhor em interações mais complicadas, como segurar objetos (por isso tenho muitas imagens de ferreiros e bibliotecários nos exemplos).
Mantenha seus prompts simples, e tende a dar resultados melhores.
Com RevAnimated, geralmente obtenho 1 ou 2 imagens utilizáveis a cada 8, com várias outras que estão próximas e podem ser corrigidas com inpainting.

Conselhos de prompt para alpha 2:

Está ficando mais forte agora, funciona melhor com força ao redor de 1. Definir em 1.3 como a versão anterior deixará as coisas ruins.
Meu prompt negativo ainda é "(extra fingers, deformed hands:1.15), (worst quality, low quality, poor quality, bad quality:1.35)"
Tive sorte apenas colocando "nice hands" no prompt principal.

Conselhos de prompt para alpha 1:

Seu prompt deve conter as palavras: "beautiful hands, perfect hands, fingernails". Tive mais sorte com elas mais para o meio e sem ênfase.
O LoCon alpha1 parece funcionar melhor com força em torno de 1.3 (no RevAnimated 1.1, onde estou testando agora -- pode variar com outros modelos)
Não use embeddings negativos para melhorar mãos. Quando removi badhandv4 do meu prompt negativo, as coisas melhoraram visivelmente. Talvez você queira tentar sem nenhum embedding negativo. Não uso há um tempo.
Meu prompt negativo é: "(extra fingers, deformed hands:1.15), (worst quality, low quality, poor quality, bad quality:1.35)", obtido após muito experimento ajustando forças e termos um a um. Deve funcionar razoavelmente bem.
Tudo isso me dá esperança de que existe uma chance real de resolver as mãos no SD 1.5. Mesmo com bons prompts, geralmente não obtenho resultados perfeitos, mas estão perto. Vou considerar isso concluído quando criar mãos bem formadas sem precisar adicionar nada no prompt positivo ou negativo.

Agora voltando ao seu readme normalmente programado...

Estou testando a teoria de que talvez o motivo pelo qual as mãos do MidJourney estão muito melhores agora seja porque eles dedicaram tempo para treinar especificamente uma rede com um conjunto de imagens de alta qualidade de mãos, e literalmente ninguém mais tentou. Esta LoRA definitivamente ainda não chegou ao nível do MidJourney, mas tenho treinado durante várias noites e adicionando ao conjunto de dados onde parece deficiente, e a qualidade parece estar melhorando constantemente. Assim, vou postar isso agora para que as pessoas possam começar a usar. Considere isto uma alpha inicial -- só vou parar de atualizar quando não melhorar mais.

As imagens de exemplo são escolhidas criteriosamente. Por favor, não espere que este modelo melhore todas as suas gerações de mãos. Pode até piorar algumas, então você deve avaliar sua utilidade em muitas imagens e não apenas uma. Se funcionar para você como funciona para mim, muitos de seus resultados devem ser da mesma qualidade ou melhor (alguns apenas ruins de formas diferentes).

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

Add More Details Detail Enhancer Tweaker LoRA - v10

EasyNegative - EasyNegative

Usar este modelo