modelos/EnvyBetterHands LoCon - beta2

EnvyBetterHands LoCon - beta2

Marta García

5/17/2025

1:18:57 PM

| Discussion|

Palabras Clave y Etiquetas Relacionadas

ba43b0efee,concepto,_envy_,envybetterhands locon,manos,locon,fotorrealista,sd 1.5

Retrato de una chica con cabello corto negro y cuernos de diablo que lleva armadura de encaje negro y una capa fluida en estilo monocromo con ojos azules y fondo decorativo.

Un hada de cabello plateado que lleva un vestido verde ajustado y una tiara, de pie en un bosque místico bajo la luna llena con alas amarillas brillantes y duendecillos a su alrededor.

Un estudioso masculino rubio platino concentrado, vestido de manera formal, sentado en un escritorio de madera en una vasta biblioteca, rodeado de símbolos mágicos azules brillantes y tomos antiguos, con luz mágica giratoria y formas geométricas flotantes.

Retrato de una mujer vampiro rubia platino con ojos morados brillantes y manchas de sangre, vistiendo una capa púrpura oscura y corsé de cuero, parada en un cementerio gótico brumoso bajo una luna roja con murciélagos volando.

Retrato de un comandante militar decidido con cabello rojizo y ojos azules que lleva un elegante uniforme azul marino con acentos dorados que combina estilos de la era napoleónica y ciberpunk, de pie en una fortaleza urbana llena de humo.

Un retrato detallado de una mujer vampiro con capucha, pecas, ojos de jade y cabello castaño claro trenzado, de pie en un cementerio iluminado por la luna con niebla y una atmósfera inquietante.

Un retrato detallado de una mujer hemomancer elfa pecosa con capucha y túnicas escarlata, ojos rojo sangre y símbolos mágicos intrincados girando en una cueva de bosque oscuro.

Una mítica mujer atlante con cabello plateado y armadura acuática intrincada flota con gracia bajo el agua rodeada de arrecifes de coral, vida marina luminiscente y profundidades oceánicas místicas.

Una ilustración de fantasía oscura de una mujer psíquica con cabello castaño oscuro y ojos cerrados, sosteniendo esferas de energía mágica azul brillantes con un tercer ojo místico en su frente y tatuajes intrincados, ambientada en una atmósfera etérea.

Retrato lateral de un tecno-hechicero con cabello plateado, ojos gris-azules, vistiendo ropas oscuras y raídas de mago y gafas de ciencia ficción en un fondo gótico y tenebroso.

Retrato de una sacerdotisa lunar mágica con cabello blanco, ojos azules brillantes, armadura azul intrincada y un fondo de observatorio lunar bajo la luna llena.

Un hombre masculino de cabello blanco con atuendo intrincado de guerrero gótico, de pie bajo un cielo iluminado por la luna que sostiene un símbolo de creciente azul brillante.

Prompts Recomendados

nice hands,perfect hands,beautiful hands,fingernails

(masterpiece,best quality:1.3),nice hands

Prompts Negativos Recomendados

extra fingers,deformed hands,polydactyl:1.5,worst quality, low quality, poor quality, bad quality:1.35

deformed hands,polydactyl:1.3),(worst quality,low quality,poor quality,bad quality:1.35)

Parámetros Recomendados

samplers

DPM++ 2M Karras

steps

32 - 60

cfg

9.5 - 15

resolution

512x768

vae

vae-ft-mse-840000-ema-pruned.vae

other models

7th_anime_v3_B (b000309cca), revAnimated_v12 (02aecf0c7d), EnvyCuteMix01, EnvyMix_V11 (c0c4ed6b84), EnvyMix_v1 (53c86ec36e), theovercomer8sContrastFix_sd15, applesugarJam_applesugarJamV10 (3c5afac440)

Parámetros Recomendados de Alta Resolución

upscaler

4x-AnimeSharp

upscale

steps

13 - 18

denoising strength

0.44

Consejos

La fuerza debe ajustarse alrededor de 1.0.

Mezcla libremente con otros LoRAs para mejores resultados.

Evita usar embeddings negativos como badhandv4 para mejorar manos.

Experimenta con el umbral dinámico para obtener mejores resultados.

Aspectos Destacados de la Versión

Reinicié el entrenamiento desde cero, porque aparentemente entrenar con vanilla 1.5 es mejor para obtener modelos que no sobrecocinen las cosas ni cambien demasiado el estilo. Esta nueva versión aún necesita más entrenamiento, por lo que no es tan efectiva como la anterior, pero parece mejorar las cosas en promedio, y funciona con muchos más modelos sin alterar el estilo, así que creo que probablemente esta es la dirección correcta. Jugaré un poco con los prompts y actualizaré la descripción principal con consejos.

Patrocinadores del Creador

Estoy usando Lora Block Weight. Creo que también puedes usar Additional Networks y SD Webui Lycoris.

Este modelo es un LoCon. DEBES instalar la extensión Lycoris para que cargue.

Estoy usando Lora Block Weight. Creo que también puedes usar Additional Networks y SD Webui Lycoris.

ACTUALIZACIÓN 27/4/2023: He llegado a un estancamiento en el entrenamiento, así que estoy en el proceso de añadir muchas más imágenes al conjunto de datos, incluyendo algunas más complicadas como dedos entrelazados. Probablemente tendré que bajar aún más la tasa de aprendizaje, por lo que las cosas podrían ir más lento a partir de ahora. Mantendré a todos informados conforme avance el proceso.

CONSEJOS para el prompting en beta 2:

Este es un entrenamiento completamente nuevo encima de Stable Diffusion 1.5 vanilla. Lo hice basándome en el consejo de un compañero entusiasta, y es sorprendente lo compatible que es con diferentes modelos. No altera el estilo de tu modelo en absoluto hasta donde puedo ver, y realmente solo afecta a las manos y ocasionalmente a los brazos, dejando todo lo demás intacto.
Parece funcionar mejor con una fuerza de 1, aunque subirla más (1.5, 2, etc.) puede ayudar en algunas imágenes a costa de empeorar otras. No es necesario modificar tu escala CFG, ya que no causa sobrecocción a estos niveles.
Mezcla libremente con otros LoRAs.
He tenido mejores resultados poniendo "manos bonitas, manos perfectas" en el prompt positivo (aumentar el peso empeora las cosas), y "(dedos extra, manos deformes, polidactilia:1.5)" en el prompt negativo. Esto es para EnvyMix v1 (y probablemente RevAnimated), pero tu experiencia puede variar con otros modelos.
Los embeddings negativos "malas manos" parecen empeorar, aunque no lo he probado extensamente.
Como siempre, esto no hará milagros, pero encuentro que en un gran número de imágenes mejora en promedio. Espero que siga mejorando con algunas noches más de entrenamiento.

Consejos para prompting en alpha 3 y beta 1:

Ten en cuenta que estos consejos son para RevAnimated 1.2. Tu experiencia puede variar con otros modelos.
Tiende a sobrecocinar un poco, pero necesitas la fuerza configurada en 1.0 para que funcione bien. Puedes solucionar esto reduciendo el valor CFG a 5 o 6 aproximadamente. He tenido buena suerte usando la extensión de umbral dinámico y configurándola para imitar CFG 5, y luego puedo poner mi CFG en 9 o 10 y los resultados quedan bien.
Probé combinarlo con otro LoRA y obtuve resultados bastante extraños, así que tu experiencia puede variar también ahí. Ahora mismo solo intento que funcione consistentemente en un caso simple de uso.
Curiosamente, creo que ha tenido un ligero retroceso con las manos en posiciones neutrales, pero es visiblemente mejor en interacciones más complicadas, como sostener objetos (por eso tengo tantas imágenes de herreros y bibliotecarios en los ejemplos).
Mantén tus prompts simples y tiende a funcionar mejor.
Con RevAnimated, suelo obtener 1 o 2 imágenes utilizables de cada 8, con otras bastante cercanas que probablemente se pueden corregir con repintado.

Consejos de prompting para alpha 2:

Ahora es más fuerte, y funciona mejor cerca de fuerza 1. Configurarlo a 1.3 como la versión anterior hará que las cosas se vean mal.
Mi prompt negativo sigue siendo "(dedos extra, manos deformes:1.15), (peor calidad, baja calidad, calidad pobre, mala calidad:1.35)"
Me ha funcionado bien solo poniendo "manos bonitas" en el prompt principal.

Consejos de prompting para alpha 1:

Tu prompt debería contener estas palabras: "manos hermosas, manos perfectas, uñas". He tenido mejor suerte usándolas hacia el medio, sin énfasis.
El LoCon alpha1 parece funcionar mejor con una fuerza de alrededor de 1.3 (en RevAnimated 1.1, donde lo estoy probando ahora -- tu experiencia puede variar para otros modelos)
No utilices embeddings negativos para mejorar manos. Cuando eliminé badhandv4 de mi prompt negativo, las cosas mejoraron notablemente. Puede que quieras probar sin ningún embedding negativo. No los he usado desde hace un tiempo.
Mi prompt negativo es: "(dedos extra, manos deformes:1.15), (peor calidad, baja calidad, calidad pobre, mala calidad:1.35)", que definí tras muchas pruebas ajustando fuerzas y términos uno a uno. Debería funcionar bastante bien.
Todo esto me da esperanza de que hay una verdadera oportunidad para solucionar las manos en SD 1.5. Incluso con buenos prompts, generalmente no obtengo resultados perfectos, pero están cerca. Consideraré esto terminado cuando cree manos bien formadas sin tener que añadir nada a los prompts positivo o negativo.

Ahora volvemos al readme habitual...

Estoy probando la teoría de que quizás la razón por la que las manos de MidJourney son mucho mejores ahora es que simplemente dedicaron tiempo a entrenar específicamente una red con un conjunto de imágenes de alta calidad de manos, y literalmente nadie más lo ha intentado realmente. Este LoRA definitivamente aún no está al nivel de MidJourney, pero lo he estado entrenando durante varias noches y añadiendo al conjunto de datos donde parece deficiente, y la calidad parece mejorar constantemente. Por ello, voy a publicar esto ahora para que la gente pueda empezar a usarlo. Considera esto una alpha temprana -- solo dejaré de actualizarlo cuando deje de mejorar.

Las imágenes de ejemplo están cuidadosamente seleccionadas. Por favor, no esperes que este modelo mejore todas tus generaciones de manos. Incluso puede empeorar algunas, por lo que deberías evaluar su utilidad con un gran número de imágenes y no solo una. Si te funciona como a mí, muchos de tus resultados deberían ser iguales o de mejor calidad (algunos simplemente serán malos de formas diferentes).