modèles/EnvyBetterHands LoCon - beta2

EnvyBetterHands LoCon - beta2

|
5/17/2025
|
1:15:40 PM
| Discussion|
0
Portrait d'une fille aux cheveux noirs courts et cornes de diable portant une armure en dentelle noire et une cape flottante dans un style monochrome avec des yeux bleus et un fond décoratif.
Une fée aux cheveux argentés portant une robe moulante verte et un diadème, debout dans une forêt mystique sous la pleine lune avec des ailes jaunes brillantes et des lutins autour d'elle.
Un érudit masculin blond platine concentré en tenue formelle est assis à un bureau en bois dans une vaste bibliothèque, entouré de symboles magiques bleus lumineux et de livres anciens, avec une lumière magique tourbillonnante et des formes géométriques flottantes.
Portrait d'une femme vampire aux cheveux blond platine avec des yeux violets lumineux et des taches de sang, portant une cape violet foncé et un corset en cuir, debout dans un cimetière gothique brumeux sous une lune rouge avec des chauves-souris volant.
Portrait d'un commandant militaire déterminé aux cheveux roux et yeux bleus portant un élégant uniforme marine orné d'accents dorés mêlant style époque napoléonienne et cyberpunk, debout dans une forteresse urbaine enfumée.
Portrait détaillé d'une femme vampire à capuche avec des taches de rousseur, des yeux de jade et des cheveux châtain clair tressés en queue de poisson, debout dans un cimetière brumeux au clair de lune avec une atmosphère inquiétante.
Un portrait détaillé d'une femme hémomancienne elfe tachetée portant une capuche et des robes écarlates, avec des yeux rouge sang et des symboles magiques complexes tourbillonnant dans une grotte forestière sombre.
Une femme atlante mythique aux cheveux argentés et armure aquatique complexe flotte gracieusement sous l'eau entourée de récifs coralliens, de vie marine luminescente et de profondeurs océaniques mystiques.
Une illustration de fantasy sombre d'une femme psychique aux cheveux châtain foncé et aux yeux fermés, tenant des sphères d'énergie magique bleues lumineuses avec un troisième œil mystique sur le front et des tatouages complexes, dans une atmosphère éthérée.
Portrait de profil d'un techno-warlock aux cheveux argentés, yeux gris-bleu, portant des vêtements de mage sombres et en lambeaux ainsi que des lunettes de science-fiction dans un arrière-plan gothique et inquiétant.
Portrait d'une prêtresse magique de la lune aux cheveux blancs, yeux bleus lumineux, armure bleue complexe et fond d'observatoire lunaire sous la pleine lune.
Un homme masculin aux cheveux blancs portant une tenue complexe de guerrier gothique se tient sous un ciel clair de lune lumineux en tenant un symbole de croissant bleu lumineux.

Prompts recommandés

nice hands,perfect hands,beautiful hands,fingernails

(masterpiece,best quality:1.3),nice hands

Prompts négatifs recommandés

extra fingers,deformed hands,polydactyl:1.5,worst quality, low quality, poor quality, bad quality:1.35

deformed hands,polydactyl:1.3),(worst quality,low quality,poor quality,bad quality:1.35)

Paramètres recommandés

samplers

DPM++ 2M Karras

steps

32 - 60

cfg

9.5 - 15

resolution

512x768

vae

vae-ft-mse-840000-ema-pruned.vae

other models

7th_anime_v3_B (b000309cca), revAnimated_v12 (02aecf0c7d), EnvyCuteMix01, EnvyMix_V11 (c0c4ed6b84), EnvyMix_v1 (53c86ec36e), theovercomer8sContrastFix_sd15, applesugarJam_applesugarJamV10 (3c5afac440)

Paramètres haute résolution recommandés

upscaler

4x-AnimeSharp

upscale

2

steps

13 - 18

denoising strength

0.44

Conseils

La force doit être réglée autour de 1.0.

Mélangez librement avec d’autres LoRAs pour de meilleurs résultats.

Évitez d’utiliser des embeddings négatifs comme badhandv4 pour améliorer les mains.

Expérimentez avec le dynamic thresholding pour de meilleurs résultats.

Points forts de la version

Reprise de l'entraînement depuis zéro, car apparemment entraîner sur vanilla 1.5 est en fait meilleur pour créer des modèles qui ne surcuisent pas les images ou ne modifient pas beaucoup le style. Cette nouvelle version a encore besoin de plus d’entraînement, donc elle n’est pas aussi efficace que l’ancienne, mais en moyenne elle améliore un peu les choses, fonctionne sur beaucoup plus de modèles et ne modifie pas le style, donc je pense que c’est probablement la bonne direction. Je vais expérimenter un peu sur le prompting et mettre à jour la description principale avec des conseils.

Sponsors du créateur

J'utilise Lora Block Weight. Je crois que vous pouvez également utiliser Additional Networks et SD Webui Lycoris.

Ce modèle est un LoCon. Vous DEVEZ installer l'extension Lycoris pour pouvoir le charger.

J'utilise Lora Block Weight. Je crois que vous pouvez également utiliser Additional Networks et SD Webui Lycoris.

MISE À JOUR 27/04/2023 : J'ai atteint un plateau d'entraînement, donc je suis en train d'ajouter beaucoup plus d'images au jeu de données, incluant des cas plus compliqués comme des doigts entremêlés. Je vais probablement devoir baisser encore le taux d'apprentissage, donc les progrès pourraient ralentir. Je tiendrai tout le monde informé au fur et à mesure.

Conseils pour le prompting pour la beta 2 :

  • C'est un entraînement complètement nouveau basé sur Stable Diffusion 1.5 vanilla. J'ai fait cela suivant le conseil d’un passionné, et c'est étonnant à quel point cela est plus compatible avec différents modèles. Cela ne modifie pas du tout le style de votre modèle, à ma connaissance, et cela affecte vraiment uniquement les mains et parfois les bras, laissant le reste intact.

  • Il semble fonctionner au mieux avec une force de 1, bien qu'augmenter au-delà (1.5, 2, etc.) puisse aider sur certaines images mais détériorer d'autres. Pas besoin de toucher à votre échelle CFG, car cela ne provoque pas de surcuisson à ces niveaux.

  • Vous pouvez le mélanger librement avec d'autres LoRAs.

  • J'ai obtenu les meilleurs résultats en mettant "nice hands, perfect hands" dans le prompt positif (augmenter le poids empire les choses), et "(extra fingers, deformed hands, polydactyl:1.5)" dans le prompt négatif. Cela sur EnvyMix v1 (et probablement RevAnimated), mais vos résultats peuvent varier selon le modèle.

  • Les embeddings négatifs "Bad hands" semblent empirer la situation, bien que je n’aie pas testé cela en profondeur.

  • Comme d'habitude, ce n'est pas miraculeux, mais je trouve qu'en moyenne sur un grand nombre d'images, cela améliore généralement les choses. Espérons que cela continuera à s'améliorer avec quelques nuits supplémentaires de formation.

Conseils pour le prompting pour alpha 3 et beta 1 :

  • Notez que ces conseils sont pour RevAnimated 1.2. Vos résultats peuvent varier avec d'autres modèles.

  • Il y a un peu de surcuisson, mais il faut que la force soit réglée à 1.0 pour que ça marche bien. Vous pouvez contourner cela en réduisant la valeur CFG à environ 5 ou 6. J'ai eu de bons résultats en activant l'extension de dynamic thresholding en la réglant pour imiter CFG 5, puis je peux mettre mon CFG à 9 ou 10 et les résultats restent corrects.

  • J'ai essayé avec un autre LoRA et obtenu des résultats assez étranges, donc vos résultats peuvent varier aussi ici. Pour l’instant, j’essaie juste de le faire fonctionner de façon stable dans un cas simple.

  • Bizarrement, je pense qu’il a un peu régressé sur les mains en position neutre, mais c’est visiblement mieux pour des interactions plus compliquées, comme tenir des objets (d’où beaucoup de photos de forgerons et bibliothécaires dans les exemples).

  • Gardez vos prompts simples, c’est en général mieux.

  • Avec RevAnimated, j’obtiens environ 1 ou 2 images utilisables sur 8, avec d’autres assez proches qu’on peut sûrement corriger avec de l’inpainting.

Conseils pour le prompting pour alpha 2 :

  • Il devient plus fort maintenant, et marche mieux autour d’une force de 1. Le réglage à 1.3 comme la version précédente donne un mauvais rendu.

  • Mon prompt négatif reste "(extra fingers, deformed hands:1.15), (worst quality, low quality, poor quality, bad quality:1.35)"

  • J’ai eu de bons résultats en mettant simplement "nice hands" dans le prompt principal.

Conseils pour le prompting pour alpha 1 :

  • Votre prompt devrait contenir ces mots : "beautiful hands, perfect hands, fingernails". J’ai eu les meilleurs résultats avec ces termes vers le milieu et sans emphase.

  • Le LoCon alpha1 semble fonctionner au mieux autour de la force 1.3 (sur RevAnimated 1.1, où je le teste en ce moment — vos résultats peuvent varier selon les modèles)

  • N’utilisez pas d’embeddings négatifs pour améliorer les mains. Quand j’ai retiré badhandv4 de mon prompt négatif, ça s’est nettement amélioré. Vous pouvez essayer sans aucun embedding négatif. Je n’en utilise plus depuis un moment.

  • Mon prompt négatif est : "(extra fingers, deformed hands:1.15), (worst quality, low quality, poor quality, bad quality:1.35)", obtenu après beaucoup d’expérimentation en ajustant forces et termes un par un. Cela devrait bien fonctionner.

  • Tout cela me donne l’espoir qu’il y a une vraie chance de résoudre le problème des mains sur SD 1.5. Même avec un bon prompting, je n’obtiens pas des résultats parfaits, mais c’est proche. Je considérerai que c’est terminé quand il produira des mains bien formées sans rien ajouter au prompt positif ou négatif.

Retour maintenant à votre readme habituel...

Je teste la théorie que la raison pour laquelle les mains de MidJourney sont bien meilleures maintenant est qu’ils ont simplement pris le temps d’entraîner spécifiquement un réseau sur un ensemble de photos de mains de haute qualité, et littéralement personne d'autre n’a vraiment essayé. Ce LoRA n’est définitivement pas encore au niveau de MidJourney, mais je l’ai entraîné plusieurs nuits à la suite en ajoutant au dataset là où il était déficient, et la qualité semble s’améliorer continuellement. Je publie donc cette version pour que les gens puissent commencer à l’utiliser. Considérez ceci comme une alpha précoce — je ne mettrai plus à jour que lorsqu’il ne s’améliorera plus.

Les images d'exemple sont triées sur le volet. Merci de ne pas vous attendre à ce que ce modèle améliore toutes vos générartions de mains. Il peut même en détériorer certaines, donc vous devriez évaluer son utilité sur un grand nombre d’images et pas seulement une. S’il fonctionne comme pour moi, beaucoup de vos résultats seront de qualité égale ou meilleure (certaines juste mauvaises mais différemment).

Précédent
Ajouter Plus de Détails Detail Enhancer Tweaker LoRA - v10
Suivant
EasyNegative - EasyNegative

Détails du modèle

Type de modèle

LoCon

Modèle de base

SD 1.5

Version du modèle

beta2

Hash du modèle

ba43b0efee

Créateur

Discussion

Veuillez vous log in pour laisser un commentaire.

Collection de modèles - EnvyBetterHands LoCon

Images par EnvyBetterHands LoCon - beta2

Portrait d'une fille aux cheveux noirs courts et cornes de diable portant une armure en dentelle noire et une cape flottante dans un style monochrome avec des yeux bleus et un fond décoratif.
Une fée aux cheveux argentés portant une robe moulante verte et un diadème, debout dans une forêt mystique sous la pleine lune avec des ailes jaunes brillantes et des lutins autour d'elle.
Un érudit masculin blond platine concentré en tenue formelle est assis à un bureau en bois dans une vaste bibliothèque, entouré de symboles magiques bleus lumineux et de livres anciens, avec une lumière magique tourbillonnante et des formes géométriques flottantes.
Portrait d'une femme vampire aux cheveux blond platine avec des yeux violets lumineux et des taches de sang, portant une cape violet foncé et un corset en cuir, debout dans un cimetière gothique brumeux sous une lune rouge avec des chauves-souris volant.
Portrait d'un commandant militaire déterminé aux cheveux roux et yeux bleus portant un élégant uniforme marine orné d'accents dorés mêlant style époque napoléonienne et cyberpunk, debout dans une forteresse urbaine enfumée.
Portrait détaillé d'une femme vampire à capuche avec des taches de rousseur, des yeux de jade et des cheveux châtain clair tressés en queue de poisson, debout dans un cimetière brumeux au clair de lune avec une atmosphère inquiétante.
Un portrait détaillé d'une femme hémomancienne elfe tachetée portant une capuche et des robes écarlates, avec des yeux rouge sang et des symboles magiques complexes tourbillonnant dans une grotte forestière sombre.
Une femme atlante mythique aux cheveux argentés et armure aquatique complexe flotte gracieusement sous l'eau entourée de récifs coralliens, de vie marine luminescente et de profondeurs océaniques mystiques.
Une illustration de fantasy sombre d'une femme psychique aux cheveux châtain foncé et aux yeux fermés, tenant des sphères d'énergie magique bleues lumineuses avec un troisième œil mystique sur le front et des tatouages complexes, dans une atmosphère éthérée.
Portrait de profil d'un techno-warlock aux cheveux argentés, yeux gris-bleu, portant des vêtements de mage sombres et en lambeaux ainsi que des lunettes de science-fiction dans un arrière-plan gothique et inquiétant.
Portrait d'une prêtresse magique de la lune aux cheveux blancs, yeux bleus lumineux, armure bleue complexe et fond d'observatoire lunaire sous la pleine lune.
Un homme masculin aux cheveux blancs portant une tenue complexe de guerrier gothique se tient sous un ciel clair de lune lumineux en tenant un symbole de croissant bleu lumineux.

Images avec concept

Portrait d'une fille cyborg à la peau rose, yeux jaunes avec sclère noire, portant une tenue mécanique inspirée du steampunk avec engrenages, rouages et un membre mécanique, sur un fond présentant un cadran d'horloge antique.
Une femme mystérieuse aux longs cheveux noirs flottants et une robe sombre ornée de dentelle se tient dans un champ de fleurs, baignée dans une lueur éthérée d'un coucher de soleil futuriste et entourée d'étincelles lumineuses.

Images avec hands

Une fille android futuriste sereine avec un bras cybernétique chromé brillant est assise gracieusement dans le siège en cuir rouge moelleux d'une Rolls-Royce luxueuse, illuminée par les lumières au néon de la ville.
Portrait abstrait en gros plan d'une jeune femme avec des carrés translucides géométriques superposés sur son visage, mêlant des tons sombres et froids atténués avec des coups de pinceau superposés.
Portrait rapproché rendu en 3D d'une geisha cyberpunk avec maquillage néon lumineux, une coiffe crâne holographique, des éléments de design futuristes rouge et or, et des détails d'art linéaire complexe.
Illustration hyper-réaliste détaillée d'une princesse guerrière mongole portant une armure de cuir blanc avec des motifs complexes et un col en fourrure, agenouillée dans une cape rouge sur de vastes plaines mongoles avec des montagnes en arrière-plan.
Illustration ligne-unique monochrome complexe d'une femme assise dans le style d'Adam Hughes, avec des accents floraux et une atmosphère psychédélique et méditative.
Une fille cyborg aux bras et jambes mécaniques descend d'un bus scolaire jaune un matin d'automne dans une ville calme du Midwest, entourée de champs de maïs dorés et de chênes ambrés.
Homme adulte aux cheveux coiffés en arrière portant des lunettes de soleil et une chemise hawaïenne rose à motifs floraux, assis à l'intérieur à une table de café, tenant un verre de jus d'orange et affichant un sourire en coin.
Cyborg sans visage en corps entier avec une armure noire et argentée élégante illuminée par des lumières LED bleues dans un environnement cyberpunk sombre.
Portrait symétrique en gros plan d'une geisha futuriste avec des parties robotiques et une armure en fer grunge dans un style d'art linéaire détaillé avec des caractéristiques hyperréalistes et des tons bleus à faible saturation.
Illustration très détaillée d'une femme noire tatouée à la peau parfaite, portant des vêtements gothiques dorés transparents et de grandes ailes dorées, posée sereinement les yeux fermés sur un fond neutre.

Images avec photorealiste

Portrait en pied d'une femme aux cheveux roux et aux taches de rousseur portant une robe longue jaune moutarde à manches courtes à volants, debout parmi des feuilles de jungle sur un fond sombre.
Husky sibérien photoréaliste portant un équipement spec-ops camouflage neige debout dans une forêt de pins enneigée avec des reflets lumineux.
Gros plan photoréaliste d'une femme moitié humaine moitié cyborg en peignoir rouge vif tenant deux épées de samouraï dans un paysage urbain noir et enfumé des années 1940.
Photographie macro montrant des tiges de fleurs sauvages en silhouette contre un grand coucher de soleil orange avec des orbes de lumière bokeh en arrière-plan.
Silhouette d'un homme portant une couronne d'épines bioluminescente lumineuse avec des lumières violettes sur fond bleu foncé.
Illustration numérique photoréaliste d'une chambre futuriste présentant une projection holographique d'un personnage à thème spatial aux tons bleus au-dessus du lit orné, avec une femme en tenue futuriste élégante assise sur le lit dans une pièce luxueuse aux murs bleus et vue sur la ville.
Personnage de poupée creepy-charmante avec membres cousus, yeux en bouton et cheveux roses en couettes attachés par des rubans noirs, vêtue d'une tenue verte et d'un grand nœud papillon rose, tenant la main derrière la tête, se tenant devant un fond texturé turquoise et beige.
Une tasse de café Starbucks lumineuse émettant des étincelles violettes et cyan ainsi que de la vapeur dans un cadre sombre.