Eksperyment Araminta (SDXL+Flux) - Fv5
Zalecane negatywne podpowiedzi
big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb
Zalecane parametry
samplers
steps
cfg
Wskazówki
Używaj DPM++ 2/3M SDE z samplerami Karras lub Exponential i ponad 25 kroków oraz CFG około 5-7, aby uzyskać najlepsze wyniki z SDXL.
Wypróbuj DPM++ SDE Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) dla alternatywnych stylów.
Samplery Euler Ancestral / Normal dają mniej szczegółowe wyniki, które mogą być pożądane przy modelu Fv6 w celu redukcji szumu.
Domyślne CLIP Skip to 2, ale wypróbowanie 1 może zwiększyć dopasowanie do promptu, a 3-4 ulepszyć skupienie na konceptach.
Dla modeli Flux preferowane są samplery takie jak DPM++ 2M beta lub sgm_uniform.
Ustawienia CFG mają ogromny wpływ na jakość obrazów; niższe CFG (1.5-2.5) zapobiega efektowi plastikowej skóry na zdjęciach, podczas gdy dla stylów ilustracji może być wymagane wyższe CFG (3-6+).
Niewłaściwe ustawienia CFG lub liczby kroków często powodują rozmyte lub zdeformowane obrazy, konieczne mogą być dostosowania zależnie od stylu.
Najważniejsze informacje o wersji
Oparty na Fv4 z połączeniem wcześniejszych wersji moich modeli oraz BigLove_XL2, aby dalej posunąć realizm.
W efekcie Fv5 jest moją najbardziej fotorealistyczną wersją do tej pory, z bardziej precyzyjnymi i subtelnymi obrazami w porównaniu do F4, ale wraz z rosnącym realizmem model jest coraz mniej zdolny do tworzenia stylizowanych obrazów, zwłaszcza ilustracji: niedługo pojawi się nowa wersja serii G do takich zastosowań :)
Co do ustawień, DPM++ 2/3M SDE / Karras lub Exponential zawsze są dobrym wyborem przy 25+ krokach i CFG około 5-7. Ale DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) jest warte spróbowania. Domyślne CLIP SKIP o wartości 2 jest również dobrym wyborem, ale warto próbować też 1 lub 3-4.
Sponsorzy twórcy
Jeśli podobają Ci się moje wkłady w tę społeczność, śmiało kup mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę stworzyć 😅
Jeśli podobają Ci się moje wkłady w tę społeczność, śmiało kup mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę stworzyć 😅
Galeria porównawcza tutaj: Fv6-Fv5 oraz porównanie ilustracji NSFW między Gv1-Cv6-Fv2.

Aktualny model SOTA w moim eksperymencie:
Model bazowy SDXL: Gv4 to najbardziej zbalansowany model pozwalający na realistyczne i stylizowane obrazy NSFW i SFW. Lepsza estetyka niż Fv6, ale mniej fotorealistyczny.
Model fotorealistyczny SDXL (SFW i NSFW): Fv6 to wybór dla hiperrealizmu, w tym realistycznych obrazów NSFW, ale brakuje mu w dużej mierze możliwości stylizacji Gv4.
Ilustracja SDXL: Gv4 (SFW i NSFW). Cv6 jednak nadal warto wypróbować, jeśli nie interesują Cię obrazy NSFW.
Model Flux: Flux1-A1
Ustawienia generowania obrazów dla modeli SDXL
DPM++ 2/3M SDE / Karras lub Exponential są zawsze dobrym wyborem przy 25+ krokach i CFG około 5-7. Ale DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) jest warte wypróbowania, podobnie jak Euler Ancestral / Normal dla mniej szczegółowego wyniku, co może być interesujące w przypadku modelu Fv6, by uzyskać coś mniej „szumnego”.
Domyślny CLIP Skip o wartości 2 jest także dobrym wyborem, ale warto wypróbować 1 lub 3-4: 1 zwiększa dopasowanie do promptu, a 3-4 czasem dają lepszy efekt niż domyślny, skupiając się bardziej na „koncepcjach”.
Ustawienia generowania obrazów dla modeli Flux
Moje preferowane ustawienia to DPM++ 2M / beta lub sgm_uniform lub DDEIS / normal jako sampler / scheduler, gdzie beta daje bardziej wyrazisty i mocniejszy obraz. Dla bardziej subtelnego obrazu Euler / simple lub beta wydają się dobrym wyborem.
CFG ma ogromny wpływ na ostateczny obraz i jest bardzo czułe nawet na drobne zmiany.
Dla zdjęć CFG powinno pozostać niskie (1.5-2.5), by uniknąć efektu plastikowej skóry.
Dla dzieł sztuki i ilustracji jest to bardziej skomplikowane, bo zależy od medium. Dla „szorstkich” stylów (malarstwo, akwarele itp.) CFG powinno być dość niskie w zakresie 1.5-2.5, ale dla stylu anime lub komiksowego często trzeba je podnieść, by osiągnąć pożądany efekt (3-6 lub więcej).
Jeśli obraz jest niechlujny / zdeformowany lub rozmazany, często wynika to z niewłaściwego CFG/liczby kroków, ale nie zawsze łatwo określić, czy CFG/kroki należy zwiększyć czy zmniejszyć (przynajmniej dla mnie 😊).
Na pewno jest dużo do poznania odnośnie zachowania Flux, które jest dość inne niż SDXL i musimy się dostosować.
Workflow
Wszystkie moje obrazy są przesyłane z osadzonym workflow ComfyUI, który niestety jest niekompatybilny z przetwarzaniem CivitAI i najczęściej nie można odzyskać promptu. Możesz jednak pobrać oryginalny obraz PNG z dołączonym workflow, klikając ikonę „DOWNLOAD” w przeglądarce obrazów.
Dlaczego staram się publikować głównie obrazy prosto z mojego modelu z ewentualnym dodatkiem Lory (mojej lub wzmacniacza detali), czasem używam także Controlnet, aby łatwiej uzyskać lepsze, bardziej szczegółowe kompozycje: w tym przypadku obraz źródłowy oczywiście nie jest we workflow, ale przypuszczam, że nadal możesz użyć opublikowanego przeze mnie obrazu jako źródła, jeśli chcesz zrobić wariację :)
Przeszłość
Począwszy od serii E, modele ewoluują czasem poprzez łączenie się z innymi modelami (dzięki innym współtwórcom!), ale przede wszystkim przez trening na moim własnym zbiorze danych: skromny zbiór (~2000 obrazów obecnie), staram się jednak jakością i oryginalnością to jakoś zrekompensować.
Od Fv1 włączyłem wiele syntetycznych obrazów stworzonych za pomocą wcześniejszych wersji: mocno operując na promptach i retuszując w Photoshopie, gdy było to potrzebne, by mieć zbiór z wieloma oryginalnymi obrazami.
Główną ideą tego modelu było stworzenie wszechstronnego narzędzia przez połączenie najlepszych istniejących modeli odpowiadających mojemu gustowi (fotografia i fantastyka artystyczna, by to uprościć). Moje główne cele to:
Fotorealizm: Zdolność do tworzenia oszałamiająco realistycznych obrazów zarówno postaci, jak i obiektów/natury.
Elastyczność: Zdolność do tworzenia wysoce stylizowanych obrazów, umożliwiając wyraz artystyczny przez różne style i kombinacje artystów. Pochodzę z starszego pokolenia i Europy, więc „styl” nie oznacza dla mnie „japońskie kawaii anime z biustem” czy „DC Comics z mnóstwem superbohaterów i bujnymi blondynkami”, lecz bardziej świat Franka Frazetty, Milo Manary, Borisa Vallejo, H.R. Gigera, Wojtka Siudmaka i takich mistrzów sztuki fantastycznej: na pewno są tam piersi, ale styl jest nieco inny :P
Ponieważ nie lubię być ograniczany w eksploracji ludzkiego ciała, zamysł to również mieć całkiem zdolny model NSFW. Jednak ze względu na charakter dostępnych obrazów treningowych w zestawach danych, NSFW często ma silne uprzedzenie ku zdjęciom pornograficznym lub japońskiej pornograficznej anime i wpływa to na elastyczność (zazwyczaj gdy używasz słowa „sexy” w prompt, musisz uwzględnić styl). Ten punkt NIE jest więc priorytetem dla modelu bazowego, lecz jest rozwijany w modelu NSFW.
Szczegóły modelu
Dyskusja
Proszę się log in, aby dodać komentarz.
