modele/EnvyBetterHands LoCon - beta2

EnvyBetterHands LoCon - beta2

|
5/17/2025
|
1:16:51 PM
| Discussion|
0
Portret dziewczyny z krótkimi czarnymi włosami i rogami diabła, ubranej w czarną koronkową zbroję i płynny płaszcz w monochromatycznym stylu z niebieskimi oczami i dekoracyjnym tłem.
Wróżka o srebrnych włosach w zielonej obcisłej sukience i tiarze, stojąca w mistycznym lesie pod pełnią księżyca z świecącymi żółtymi skrzydłami i krążącymi wokół niej duszkami.
Skoncentrowany, platynowowłosy mężczyzna uczony w formalnym stroju siedzi przy drewnianym biurku w rozległej bibliotece, otoczony świecącymi niebieskimi magicznymi symbolami i starożytnymi księgami, z wirującym magicznym światłem i unoszącymi się geometrycznymi kształtami.
Portret platynowej blondynki-wampirzycy o fioletowo świecących oczach i plamach z krwi, ubranej w ciemnofioletowy płaszcz i skórzany gorset, stojącej na mglistym gotyckim cmentarzu pod czerwonym księżycem z latającymi nietoperzami.
Portret zdeterminowanego dowódcy wojskowego o rudych włosach i niebieskich oczach, ubranego w elegancki granatowy mundur ze złotymi akcentami, łączący styl epoki napoleońskiej i cyberpunk, stojącego w zadymionej miejskiej twierdzy.
Szczegółowy portret kobiety wampira z kapturem, piegami, jadowitymi oczami i zaplecionymi jasnobrązowymi włosami stojącej na mglistym, księżycowym cmentarzu z upiorną atmosferą.
Szczegółowy portret pieprzniętej elfiej hemomancerki ubranej w szkarłatny kaptur i szaty, z krwistoczerwonymi oczami i skomplikowanymi magicznymi symbolami wirującymi w ciemnej jaskini leśnej.
Mityczna atlantycka kobieta o srebrnych włosach i misternym wodnym pancerzu unosi się z gracją pod wodą, otoczona rafami koralowymi, luminescencyjnym życiem morskim i mistycznymi głębinami oceanu.
Ilustracja mrocznej fantasy przedstawiająca psychiczną kobietę o ciemnobrązowych włosach i zamkniętych oczach, trzymającą świecące niebieskie kule magicznej energii z mistycznym trzecim okiem na czole oraz skomplikowanymi tatuażami, na tle eterycznej atmosfery.
Portret z profilu techno-warlocka z srebrnymi włosami, szaro-niebieskimi oczami, ubranym w ciemne, podarte szaty maga i gogle sci-fi na gotyckim, upiornym tle.
Portret magicznej księżycowej kapłanki z białymi włosami, świecącymi niebieskimi oczami, misterną niebieską zbroją i tłem lunarnym obserwatorium pod pełnią księżyca.
Męski mężczyzna o białych włosach w misternym gotyckim stroju wojownika stoi pod świetlistym księżycowym niebem, trzymając świecący niebieski symbol księżyca.

Zalecane podpowiedzi

nice hands,perfect hands,beautiful hands,fingernails

(masterpiece,best quality:1.3),nice hands

Zalecane negatywne podpowiedzi

extra fingers,deformed hands,polydactyl:1.5,worst quality, low quality, poor quality, bad quality:1.35

deformed hands,polydactyl:1.3),(worst quality,low quality,poor quality,bad quality:1.35)

Zalecane parametry

samplers

DPM++ 2M Karras

steps

32 - 60

cfg

9.5 - 15

resolution

512x768

vae

vae-ft-mse-840000-ema-pruned.vae

other models

7th_anime_v3_B (b000309cca), revAnimated_v12 (02aecf0c7d), EnvyCuteMix01, EnvyMix_V11 (c0c4ed6b84), EnvyMix_v1 (53c86ec36e), theovercomer8sContrastFix_sd15, applesugarJam_applesugarJamV10 (3c5afac440)

Zalecane parametry wysokiej rozdzielczości

upscaler

4x-AnimeSharp

upscale

2

steps

13 - 18

denoising strength

0.44

Wskazówki

Siła powinna być ustawiona około 1.0.

Dowolnie mieszaj z innymi LoRA dla lepszych wyników.

Unikaj używania negatywnych osadzeń takich jak badhandv4 do poprawy rąk.

Eksperymentuj z dynamicznym thresholdingiem dla lepszych efektów.

Najważniejsze informacje o wersji

Rozpoczęto trening od nowa, ponieważ okazuje się, że trening na vanilla 1.5 jest lepszy pod względem tworzenia modeli, które nie przesadzają z efektami i nie zmieniają stylu tak bardzo. Ta nowa wersja nadal wymaga więcej treningu, więc nie jest jeszcze tak skuteczna jak stara, ale na ogół poprawia efekty i działa z wieloma modelami, nie zmieniając stylu, więc myślę, że to właściwy kierunek. Będę eksperymentować z promptami i zaktualizuję główny opis o porady.

Sponsorzy twórcy

Używam Lora Block Weight. Sądzę, że można również korzystać z Additional Networks oraz SD Webui Lycoris.

Ten model to LoCon. MUSISZ zainstalować rozszerzenie Lycoris, aby go załadować.

Używam Lora Block Weight. Wierzę, że można też użyć Additional Networks oraz SD Webui Lycoris.

AKTUALIZACJA 27.04.2023: Osiągnąłem plateau w treningu, więc dodaję do zestawu danych więcej obrazów, w tym trudniejsze takie jak splecione palce. Prawdopodobnie będę musiał jeszcze bardziej obniżyć współczynnik uczenia, więc od teraz proces może być wolniejszy. Będę informować na bieżąco o postępach.

Wskazówki dotyczące promptów dla beta 2:

  • To całkowicie nowy trening oparty na vanilla Stable Diffusion 1.5. Zrobiłem to na podstawie rady innego entuzjasty i jest zaskakująco bardziej kompatybilny z różnymi modelami. Nie zmienia stylu twojego modelu wcale, jak dotąd mogę stwierdzić, i naprawdę wpływa tylko na ręce, czasem na ramiona, pozostawiając resztę nienaruszoną.

  • Najlepiej działa przy sile 1, choć zwiększenie jej powyżej (1.5, 2 itd.) może pomóc na niektórych obrazach kosztem pogorszenia innych. Nie ma potrzeby zmieniać skali CFG, bo nie powoduje przegrzewania wyników na tych poziomach.

  • Można dowolnie mieszać go z innymi LoRA.

  • Najlepsze efekty uzyskałem dodając "ładne ręce, idealne ręce" do promptu pozytywnego (zwiększanie wagi pogarsza efekty) oraz "(dodatkowe palce, zdeformowane ręce, polidaktylia:1.5)" do promptu negatywnego. Dotyczy to EnvyMix v1 (i prawdopodobnie RevAnimated), ale efekty mogą się różnić przy innych modelach.

  • Negatywne osadzenia „Bad hands” wydają się pogarszać efekt, choć nie testowałem tego dokładnie.

  • Jak zwykle, to nie zdziała cudów, ale zauważyłem, że na dużej liczbie obrazów ogólnie poprawia jakość. Mam nadzieję, że poprawi się to jeszcze po kilku kolejnych nocach treningu.

Wskazówki dotyczące promptów dla alpha 3 i beta 1:

  • Ta rada jest dla RevAnimated 1.2. Efekty mogą się różnić z innymi modelami.

  • Nadmiernie wzmacnia niektóre elementy, ale siła powinna być ustawiona na 1.0, aby działało dobrze. Można to obejść zmniejszając CFG do około 5 lub 6. Miałem dobry efekt używając rozszerzenia dynamic thresholding i ustawiając je na mimic CFG 5, a następnie CFG do 9 lub 10 i efekt jest dobry.

  • Próbowałem użyć tego modelu z inną LoRA i uzyskałem dziwne wyniki, więc tu efekt może się różnić. Obecnie próbuję, aby działało stabilnie w prostych zastosowaniach.

  • Dziwnie, ale wydaje mi się, że jest trochę gorzej z rękami w neutralnych pozycjach, ale zauważalnie lepiej w bardziej skomplikowanych interakcjach, jak trzymanie przedmiotów (stąd wiele zdjęć kowali i bibliotekarzy na przykładach).

  • Zachowaj proste prompt, wtedy efekty są lepsze.

  • W RevAnimated zwykle uzyskuję 1-2 użyteczne obrazy na każde 8, a reszta jest bliska i często można ją poprawić inpaintingiem.

Wskazówki dotyczące promptów dla alpha 2:

  • Model zyskuje na sile i najlepiej działa około siły 1. Ustawienie na 1.3 jak w poprzedniej wersji powoduje pogorszenie efektów.

  • Mój prompt negatywny to nadal "(dodatkowe palce, zdeformowane ręce:1.15), (najgorsza jakość, niska jakość, słaba jakość, zła jakość:1.35)"

  • Dobry efekt miałem, wpisując po prostu "ładne ręce" w głównym prompt.

Wskazówki dotyczące promptów dla alpha 1:

  • W twoim prompcie powinny się znaleźć słowa: "piękne ręce, idealne ręce, paznokcie". Najlepsze efekty miałem, gdy były gdzieś w środku i bez specjalnego podkreślenia.

  • LoCon alpha1 działa najlepiej przy sile około 1.3 (testowałem na RevAnimated 1.1, efekty mogą się różnić dla innych modeli)

  • Nie używaj negatywnych osadzeń do poprawy rąk. Po usunięciu badhandv4 z promptu negatywnego wyraźnie się poprawiło. Możesz spróbować bez żadnych negatywnych osadzeń. Nie korzystam z nich już od jakiegoś czasu.

  • Mój prompt negatywny to: "(dodatkowe palce, zdeformowane ręce:1.15), (najgorsza jakość, niska jakość, słaba jakość, zła jakość:1.35)", uzyskany po wielu eksperymentach z indywidualnym dostosowaniem sił i terminów. Powinno to dobrze działać.

  • Daje mi to nadzieję, że istnieje realna szansa na rozwiązanie problemu rąk w SD 1.5. Nawet przy dobrym promptowaniu rezultaty nie są idealne, ale bardzo bliskie. Uważam to za zakończone, gdy będzie tworzyć poprawne ręce bez dodawania czegokolwiek do promptu pozytywnego czy negatywnego.

Wracając do standardowego pliku readme...

Testuję teorię, że powodem, dla którego ręce w MidJourney są teraz dużo lepsze, jest to, iż poświęcili czas na specyficzne wytrenowanie sieci na wysokiej jakości zestawie zdjęć rąk, a nikt inny tego nie próbował. Ta LoRA zdecydowanie nie osiąga jeszcze poziomu MidJourney, ale trenuję ją od kilku nocy i dodaję do zestawu dane, tam gdzie jest to potrzebne, a jakość widocznie się poprawia. Dlatego publikuję to już teraz, aby ludzie mogli zacząć używać. Uważaj to jako wczesną alfę – przestanę aktualizować, gdy się przestanie poprawiać.

Przykładowe obrazy są wyselekcjonowane. Nie oczekuj, że ten model poprawi wszystkie wygenerowane ręce. Może nawet pogorszyć niektóre, więc oceniaj jego użyteczność na dużej liczbie obrazów, a nie na pojedynczym. Jeśli u ciebie działa jak u mnie, wiele wyników będzie tej samej albo lepszej jakości (niektóre jednak będą po prostu złe na różne sposoby).

Poprzedni
Dodaj więcej szczegółów Detail Enhancer Tweaker LoRA - v10
Następny
EasyNegative - EasyNegative

Szczegóły modelu

Typ modelu

LoCon

Model bazowy

SD 1.5

Wersja modelu

beta2

Hash modelu

ba43b0efee

Twórca

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa EnvyBetterHands LoCon - beta2

Portret dziewczyny z krótkimi czarnymi włosami i rogami diabła, ubranej w czarną koronkową zbroję i płynny płaszcz w monochromatycznym stylu z niebieskimi oczami i dekoracyjnym tłem.
Wróżka o srebrnych włosach w zielonej obcisłej sukience i tiarze, stojąca w mistycznym lesie pod pełnią księżyca z świecącymi żółtymi skrzydłami i krążącymi wokół niej duszkami.
Skoncentrowany, platynowowłosy mężczyzna uczony w formalnym stroju siedzi przy drewnianym biurku w rozległej bibliotece, otoczony świecącymi niebieskimi magicznymi symbolami i starożytnymi księgami, z wirującym magicznym światłem i unoszącymi się geometrycznymi kształtami.
Portret platynowej blondynki-wampirzycy o fioletowo świecących oczach i plamach z krwi, ubranej w ciemnofioletowy płaszcz i skórzany gorset, stojącej na mglistym gotyckim cmentarzu pod czerwonym księżycem z latającymi nietoperzami.
Portret zdeterminowanego dowódcy wojskowego o rudych włosach i niebieskich oczach, ubranego w elegancki granatowy mundur ze złotymi akcentami, łączący styl epoki napoleońskiej i cyberpunk, stojącego w zadymionej miejskiej twierdzy.
Szczegółowy portret kobiety wampira z kapturem, piegami, jadowitymi oczami i zaplecionymi jasnobrązowymi włosami stojącej na mglistym, księżycowym cmentarzu z upiorną atmosferą.
Szczegółowy portret pieprzniętej elfiej hemomancerki ubranej w szkarłatny kaptur i szaty, z krwistoczerwonymi oczami i skomplikowanymi magicznymi symbolami wirującymi w ciemnej jaskini leśnej.
Mityczna atlantycka kobieta o srebrnych włosach i misternym wodnym pancerzu unosi się z gracją pod wodą, otoczona rafami koralowymi, luminescencyjnym życiem morskim i mistycznymi głębinami oceanu.
Ilustracja mrocznej fantasy przedstawiająca psychiczną kobietę o ciemnobrązowych włosach i zamkniętych oczach, trzymającą świecące niebieskie kule magicznej energii z mistycznym trzecim okiem na czole oraz skomplikowanymi tatuażami, na tle eterycznej atmosfery.
Portret z profilu techno-warlocka z srebrnymi włosami, szaro-niebieskimi oczami, ubranym w ciemne, podarte szaty maga i gogle sci-fi na gotyckim, upiornym tle.
Portret magicznej księżycowej kapłanki z białymi włosami, świecącymi niebieskimi oczami, misterną niebieską zbroją i tłem lunarnym obserwatorium pod pełnią księżyca.
Męski mężczyzna o białych włosach w misternym gotyckim stroju wojownika stoi pod świetlistym księżycowym niebem, trzymając świecący niebieski symbol księżyca.

Obrazy z concept

Portret cyborg dziewczyny o różowej skórze, żółtych oczach z czarną twardówką, ubranej w steampunkowy mechaniczny strój z trybikami, kółkami zębatymi i mechaniczną kończyną, na tle antycznego cyferblatu zegara.
Tajemnicza kobieta z płynącymi czarnymi włosami i ciemną suknią zdobioną koronką stoi na polu kwiatów, skąpana w eterycznym blasku futurystycznego zachodu słońca i otoczona świecącymi iskrami.

Obrazy z ręce

Spokojna futurystyczna androidka z lśniącym chromowanym cybernetycznym ramieniem siedzi elegancko na pluszowym czerwonym skórzanym siedzeniu luksusowego Rolls-Royce, oświetlona neonowymi światłami miasta.
Zbliżenie abstrakcyjnego portretu młodej kobiety z geometrycznymi przezroczystymi kwadratami nakładającymi się na twarz, łączącymi stonowane ciemne i chłodne tony z wielowarstwowymi pociągnięciami pędzla.
Zbliżenie 3D portretu cyberpunkowej gejszy z neonowym makijażem, holograficznym hełmem z czaszek, czerwono-złotymi futurystycznymi elementami oraz szczegółową grafiką liniową.
Hiperrealistyczna, szczegółowa ilustracja mongołskiej księżniczki wojowniczki w białej skórzanej zbroi z misternymi wzorami i futrzanym kołnierzem, klęczącej w czerwonej pelerynie na rozległych mongolskich polach z górami w tle.
Skomplikowana monochromatyczna ilustracja linii siedzącej kobiety w stylu Adama Hughesa, z kwiatowymi akcentami i psychodeliczną, medytacyjną atmosferą.
Dziewczyna cyborg z mechanicznymi ramionami i nogami schodzi z żółtego szkolnego autobusu w cichej miejscowości na Środkowym Zachodzie, otoczona złotymi polami kukurydzy i bursztynowymi dębami.
Dorosły mężczyzna z zaczesanymi do tyłu włosami, noszący okulary przeciwsłoneczne i różową hawajską koszulę w kwiaty, siedzący wewnątrz przy stole w kawiarni, trzymający szklankę soku pomarańczowego i uśmiechający się chytrze.
Pełnoplastrowy cyborg bez twarzy w eleganckiej czarno-srebrnej zbroi podświetlonej niebieskimi diodami LED w ciemnym cyberpunkowym otoczeniu.
Symetryczny portret zbliżeniowy futurystycznej gejszy z elementami robota i zbroją z żelaza w stylu grunge, w detalicznej linii z hiperrealistycznymi cechami i niebieskimi tonami o niskiej saturacji.
Wysoce szczegółowa ilustracja wytatuowanej czarnoskórej kobiety z perfekcyjną skórą, ubranej w przezroczystą, złotą gotycką odzież i duże złote skrzydła, pozującej spokojnie z zamkniętymi oczami na neutralnym tle.

Obrazy z fotorealistyczny

Portret całej sylwetki kobiety o rudych włosach i piegach, ubranej w musztardową długą sukienkę z krótkimi falbanianymi rękawami, stojącej pośród liści dżungli na ciemnym tle.
Fotorealistyczny syberyjski husky w śnieżnym kamuflażu spec-ops stojący w zaśnieżonym sosnowym lesie z błyskami światła.
Fotorealistyczne zbliżenie pół-człowieka pół-cyborga w żywym czerwonym szlafroku trzymającej dwa miecze samurajskie w ciemnym, zadymionym noir mieście lat 40.
Fotografia makro pokazująca sylwetki łodyg dzikich kwiatów na tle dużego pomarańczowego zachodu słońca z kulistymi światłami bokeh w tle.
Sylwetka mężczyzny noszącego świecącą, bioluminescencyjną koronę cierniową z fioletowymi światłami na ciemnoniebieskim tle.
Fotorealistyczna cyfrowa ilustracja futurystycznej sypialni z projekcją holograficzną niebieskotonowej postaci o kosmicznej tematyce nad ozdobnym łóżkiem, z kobietą w eleganckim futurystycznym stroju siedzącą na łóżku w luksusowym pokoju z niebieskimi ścianami i widokiem na panoramę miasta.
Postać straszno-uroczej lalki z przeszywanymi kończynami, guzikowymi oczami i różowymi koczkami związanymi czarnymi wstążkami, ubrana w zielony strój i dużą różową muchę, trzyma dłonią za głową, stojąc na teksturowanym tle w kolorach niebiesko-zielonym i beżowym.
Świecący kubek Starbucks emitujący fioletowe i cyjanowe iskry oraz parę w ciemnym otoczeniu.