EnvyBetterHands LoCon - beta2
Palabras Clave y Etiquetas Relacionadas
Imágenes destacadas
Prompts Recomendados
nice hands,perfect hands,beautiful hands,fingernails
(masterpiece,best quality:1.3),nice hands
Prompts Negativos Recomendados
extra fingers,deformed hands,polydactyl:1.5,worst quality, low quality, poor quality, bad quality:1.35
deformed hands,polydactyl:1.3),(worst quality,low quality,poor quality,bad quality:1.35)
Parámetros Recomendados
samplers
steps
cfg
resolution
vae
other models
Parámetros Recomendados de Alta Resolución
upscaler
upscale
steps
denoising strength
Consejos
La fuerza debe ajustarse alrededor de 1.0.
Mezcla libremente con otros LoRAs para mejores resultados.
Evita usar embeddings negativos como badhandv4 para mejorar manos.
Experimenta con el umbral dinámico para obtener mejores resultados.
Aspectos Destacados de la Versión
Reinicié el entrenamiento desde cero, porque aparentemente entrenar con vanilla 1.5 es mejor para obtener modelos que no sobrecocinen las cosas ni cambien demasiado el estilo. Esta nueva versión aún necesita más entrenamiento, por lo que no es tan efectiva como la anterior, pero parece mejorar las cosas en promedio, y funciona con muchos más modelos sin alterar el estilo, así que creo que probablemente esta es la dirección correcta. Jugaré un poco con los prompts y actualizaré la descripción principal con consejos.
Patrocinadores del Creador
Estoy usando Lora Block Weight. Creo que también puedes usar Additional Networks y SD Webui Lycoris.
Este modelo es un LoCon. DEBES instalar la extensión Lycoris para que cargue.
Estoy usando Lora Block Weight. Creo que también puedes usar Additional Networks y SD Webui Lycoris.
ACTUALIZACIÓN 27/4/2023: He llegado a un estancamiento en el entrenamiento, así que estoy en el proceso de añadir muchas más imágenes al conjunto de datos, incluyendo algunas más complicadas como dedos entrelazados. Probablemente tendré que bajar aún más la tasa de aprendizaje, por lo que las cosas podrían ir más lento a partir de ahora. Mantendré a todos informados conforme avance el proceso.
CONSEJOS para el prompting en beta 2:
Este es un entrenamiento completamente nuevo encima de Stable Diffusion 1.5 vanilla. Lo hice basándome en el consejo de un compañero entusiasta, y es sorprendente lo compatible que es con diferentes modelos. No altera el estilo de tu modelo en absoluto hasta donde puedo ver, y realmente solo afecta a las manos y ocasionalmente a los brazos, dejando todo lo demás intacto.
Parece funcionar mejor con una fuerza de 1, aunque subirla más (1.5, 2, etc.) puede ayudar en algunas imágenes a costa de empeorar otras. No es necesario modificar tu escala CFG, ya que no causa sobrecocción a estos niveles.
Mezcla libremente con otros LoRAs.
He tenido mejores resultados poniendo "manos bonitas, manos perfectas" en el prompt positivo (aumentar el peso empeora las cosas), y "(dedos extra, manos deformes, polidactilia:1.5)" en el prompt negativo. Esto es para EnvyMix v1 (y probablemente RevAnimated), pero tu experiencia puede variar con otros modelos.
Los embeddings negativos "malas manos" parecen empeorar, aunque no lo he probado extensamente.
Como siempre, esto no hará milagros, pero encuentro que en un gran número de imágenes mejora en promedio. Espero que siga mejorando con algunas noches más de entrenamiento.
Consejos para prompting en alpha 3 y beta 1:
Ten en cuenta que estos consejos son para RevAnimated 1.2. Tu experiencia puede variar con otros modelos.
Tiende a sobrecocinar un poco, pero necesitas la fuerza configurada en 1.0 para que funcione bien. Puedes solucionar esto reduciendo el valor CFG a 5 o 6 aproximadamente. He tenido buena suerte usando la extensión de umbral dinámico y configurándola para imitar CFG 5, y luego puedo poner mi CFG en 9 o 10 y los resultados quedan bien.
Probé combinarlo con otro LoRA y obtuve resultados bastante extraños, así que tu experiencia puede variar también ahí. Ahora mismo solo intento que funcione consistentemente en un caso simple de uso.
Curiosamente, creo que ha tenido un ligero retroceso con las manos en posiciones neutrales, pero es visiblemente mejor en interacciones más complicadas, como sostener objetos (por eso tengo tantas imágenes de herreros y bibliotecarios en los ejemplos).
Mantén tus prompts simples y tiende a funcionar mejor.
Con RevAnimated, suelo obtener 1 o 2 imágenes utilizables de cada 8, con otras bastante cercanas que probablemente se pueden corregir con repintado.
Consejos de prompting para alpha 2:
Ahora es más fuerte, y funciona mejor cerca de fuerza 1. Configurarlo a 1.3 como la versión anterior hará que las cosas se vean mal.
Mi prompt negativo sigue siendo "(dedos extra, manos deformes:1.15), (peor calidad, baja calidad, calidad pobre, mala calidad:1.35)"
Me ha funcionado bien solo poniendo "manos bonitas" en el prompt principal.
Consejos de prompting para alpha 1:
Tu prompt debería contener estas palabras: "manos hermosas, manos perfectas, uñas". He tenido mejor suerte usándolas hacia el medio, sin énfasis.
El LoCon alpha1 parece funcionar mejor con una fuerza de alrededor de 1.3 (en RevAnimated 1.1, donde lo estoy probando ahora -- tu experiencia puede variar para otros modelos)
No utilices embeddings negativos para mejorar manos. Cuando eliminé badhandv4 de mi prompt negativo, las cosas mejoraron notablemente. Puede que quieras probar sin ningún embedding negativo. No los he usado desde hace un tiempo.
Mi prompt negativo es: "(dedos extra, manos deformes:1.15), (peor calidad, baja calidad, calidad pobre, mala calidad:1.35)", que definí tras muchas pruebas ajustando fuerzas y términos uno a uno. Debería funcionar bastante bien.
Todo esto me da esperanza de que hay una verdadera oportunidad para solucionar las manos en SD 1.5. Incluso con buenos prompts, generalmente no obtengo resultados perfectos, pero están cerca. Consideraré esto terminado cuando cree manos bien formadas sin tener que añadir nada a los prompts positivo o negativo.
Ahora volvemos al readme habitual...
Estoy probando la teoría de que quizás la razón por la que las manos de MidJourney son mucho mejores ahora es que simplemente dedicaron tiempo a entrenar específicamente una red con un conjunto de imágenes de alta calidad de manos, y literalmente nadie más lo ha intentado realmente. Este LoRA definitivamente aún no está al nivel de MidJourney, pero lo he estado entrenando durante varias noches y añadiendo al conjunto de datos donde parece deficiente, y la calidad parece mejorar constantemente. Por ello, voy a publicar esto ahora para que la gente pueda empezar a usarlo. Considera esto una alpha temprana -- solo dejaré de actualizarlo cuando deje de mejorar.
Las imágenes de ejemplo están cuidadosamente seleccionadas. Por favor, no esperes que este modelo mejore todas tus generaciones de manos. Incluso puede empeorar algunas, por lo que deberías evaluar su utilidad con un gran número de imágenes y no solo una. Si te funciona como a mí, muchos de tus resultados deberían ser iguales o de mejor calidad (algunos simplemente serán malos de formas diferentes).
Detalles del Modelo
Discusión
Por favor log in para dejar un comentario.