modele/Eksperyment Araminta (SDXL+Flux) - Fv5

Eksperyment Araminta (SDXL+Flux) - Fv5

12/4/2025

1:02:37 PM

Powiązane słowa kluczowe i tagi

uniwersalny,aramintastudio,model bazowy,checkpoint,elastyczność,flux1-a1,fv5,fv6,nsfw,generowanie obrazów NSFW,fotorealizm,fotorealistyczny,realistyczny,sdxl 1.0,podstawowy model sdxl gv4,model stable diffusion,eksperyment araminta (sdxl+flux),kobieta

Czarno-biała żyrafa stoi, kontemplując olbrzymi mniszek lekarski na zaśnieżonym wzgórzu pod wietrznym niebem rozsiewającym nasiona mniszka w monochromatycznych tonach.

Zalecane negatywne podpowiedzi

big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Zalecane parametry

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, DPM++ 2M beta, sgm_uniform, DDEIS, normal, simple, beta, dpmpp_3m_sde, dpmpp_3m_sde_gpu

steps

12 - 25

cfg

1.5 - 11

Wskazówki

Używaj DPM++ 2/3M SDE z samplerami Karras lub Exponential i ponad 25 kroków oraz CFG około 5-7, aby uzyskać najlepsze wyniki z SDXL.

Wypróbuj DPM++ SDE Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) dla alternatywnych stylów.

Samplery Euler Ancestral / Normal dają mniej szczegółowe wyniki, które mogą być pożądane przy modelu Fv6 w celu redukcji szumu.

Domyślne CLIP Skip to 2, ale wypróbowanie 1 może zwiększyć dopasowanie do promptu, a 3-4 ulepszyć skupienie na konceptach.

Dla modeli Flux preferowane są samplery takie jak DPM++ 2M beta lub sgm_uniform.

Ustawienia CFG mają ogromny wpływ na jakość obrazów; niższe CFG (1.5-2.5) zapobiega efektowi plastikowej skóry na zdjęciach, podczas gdy dla stylów ilustracji może być wymagane wyższe CFG (3-6+).

Niewłaściwe ustawienia CFG lub liczby kroków często powodują rozmyte lub zdeformowane obrazy, konieczne mogą być dostosowania zależnie od stylu.

Najważniejsze informacje o wersji

Oparty na Fv4 z połączeniem wcześniejszych wersji moich modeli oraz BigLove_XL2, aby dalej posunąć realizm.

W efekcie Fv5 jest moją najbardziej fotorealistyczną wersją do tej pory, z bardziej precyzyjnymi i subtelnymi obrazami w porównaniu do F4, ale wraz z rosnącym realizmem model jest coraz mniej zdolny do tworzenia stylizowanych obrazów, zwłaszcza ilustracji: niedługo pojawi się nowa wersja serii G do takich zastosowań :)

Co do ustawień, DPM++ 2/3M SDE / Karras lub Exponential zawsze są dobrym wyborem przy 25+ krokach i CFG około 5-7. Ale DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) jest warte spróbowania. Domyślne CLIP SKIP o wartości 2 jest również dobrym wyborem, ale warto próbować też 1 lub 3-4.

Sponsorzy twórcy

Jeśli podobają Ci się moje wkłady w tę społeczność, śmiało kup mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę stworzyć 😅

Galeria porównawcza tutaj: Fv6-Fv5 oraz porównanie ilustracji NSFW między Gv1-Cv6-Fv2.

Aktualny model SOTA w moim eksperymencie:

Model bazowy SDXL: Gv4 to najbardziej zbalansowany model pozwalający na realistyczne i stylizowane obrazy NSFW i SFW. Lepsza estetyka niż Fv6, ale mniej fotorealistyczny.
Model fotorealistyczny SDXL (SFW i NSFW): Fv6 to wybór dla hiperrealizmu, w tym realistycznych obrazów NSFW, ale brakuje mu w dużej mierze możliwości stylizacji Gv4.
Ilustracja SDXL: Gv4 (SFW i NSFW). Cv6 jednak nadal warto wypróbować, jeśli nie interesują Cię obrazy NSFW.

Model Flux: Flux1-A1

Ustawienia generowania obrazów dla modeli SDXL

DPM++ 2/3M SDE / Karras lub Exponential są zawsze dobrym wyborem przy 25+ krokach i CFG około 5-7. Ale DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) jest warte wypróbowania, podobnie jak Euler Ancestral / Normal dla mniej szczegółowego wyniku, co może być interesujące w przypadku modelu Fv6, by uzyskać coś mniej „szumnego”.

Domyślny CLIP Skip o wartości 2 jest także dobrym wyborem, ale warto wypróbować 1 lub 3-4: 1 zwiększa dopasowanie do promptu, a 3-4 czasem dają lepszy efekt niż domyślny, skupiając się bardziej na „koncepcjach”.

Ustawienia generowania obrazów dla modeli Flux

Moje preferowane ustawienia to DPM++ 2M / beta lub sgm_uniform lub DDEIS / normal jako sampler / scheduler, gdzie beta daje bardziej wyrazisty i mocniejszy obraz. Dla bardziej subtelnego obrazu Euler / simple lub beta wydają się dobrym wyborem.

CFG ma ogromny wpływ na ostateczny obraz i jest bardzo czułe nawet na drobne zmiany.

Dla zdjęć CFG powinno pozostać niskie (1.5-2.5), by uniknąć efektu plastikowej skóry.
Dla dzieł sztuki i ilustracji jest to bardziej skomplikowane, bo zależy od medium. Dla „szorstkich” stylów (malarstwo, akwarele itp.) CFG powinno być dość niskie w zakresie 1.5-2.5, ale dla stylu anime lub komiksowego często trzeba je podnieść, by osiągnąć pożądany efekt (3-6 lub więcej).

Jeśli obraz jest niechlujny / zdeformowany lub rozmazany, często wynika to z niewłaściwego CFG/liczby kroków, ale nie zawsze łatwo określić, czy CFG/kroki należy zwiększyć czy zmniejszyć (przynajmniej dla mnie 😊).

Na pewno jest dużo do poznania odnośnie zachowania Flux, które jest dość inne niż SDXL i musimy się dostosować.

Workflow

Wszystkie moje obrazy są przesyłane z osadzonym workflow ComfyUI, który niestety jest niekompatybilny z przetwarzaniem CivitAI i najczęściej nie można odzyskać promptu. Możesz jednak pobrać oryginalny obraz PNG z dołączonym workflow, klikając ikonę „DOWNLOAD” w przeglądarce obrazów.

Dlaczego staram się publikować głównie obrazy prosto z mojego modelu z ewentualnym dodatkiem Lory (mojej lub wzmacniacza detali), czasem używam także Controlnet, aby łatwiej uzyskać lepsze, bardziej szczegółowe kompozycje: w tym przypadku obraz źródłowy oczywiście nie jest we workflow, ale przypuszczam, że nadal możesz użyć opublikowanego przeze mnie obrazu jako źródła, jeśli chcesz zrobić wariację :)

Przeszłość

Począwszy od serii E, modele ewoluują czasem poprzez łączenie się z innymi modelami (dzięki innym współtwórcom!), ale przede wszystkim przez trening na moim własnym zbiorze danych: skromny zbiór (~2000 obrazów obecnie), staram się jednak jakością i oryginalnością to jakoś zrekompensować.

Od Fv1 włączyłem wiele syntetycznych obrazów stworzonych za pomocą wcześniejszych wersji: mocno operując na promptach i retuszując w Photoshopie, gdy było to potrzebne, by mieć zbiór z wieloma oryginalnymi obrazami.

Główną ideą tego modelu było stworzenie wszechstronnego narzędzia przez połączenie najlepszych istniejących modeli odpowiadających mojemu gustowi (fotografia i fantastyka artystyczna, by to uprościć). Moje główne cele to:

Fotorealizm: Zdolność do tworzenia oszałamiająco realistycznych obrazów zarówno postaci, jak i obiektów/natury.
Elastyczność: Zdolność do tworzenia wysoce stylizowanych obrazów, umożliwiając wyraz artystyczny przez różne style i kombinacje artystów. Pochodzę z starszego pokolenia i Europy, więc „styl” nie oznacza dla mnie „japońskie kawaii anime z biustem” czy „DC Comics z mnóstwem superbohaterów i bujnymi blondynkami”, lecz bardziej świat Franka Frazetty, Milo Manary, Borisa Vallejo, H.R. Gigera, Wojtka Siudmaka i takich mistrzów sztuki fantastycznej: na pewno są tam piersi, ale styl jest nieco inny :P
Ponieważ nie lubię być ograniczany w eksploracji ludzkiego ciała, zamysł to również mieć całkiem zdolny model NSFW. Jednak ze względu na charakter dostępnych obrazów treningowych w zestawach danych, NSFW często ma silne uprzedzenie ku zdjęciom pornograficznym lub japońskiej pornograficznej anime i wpływa to na elastyczność (zazwyczaj gdy używasz słowa „sexy” w prompt, musisz uwzględnić styl). Ten punkt NIE jest więc priorytetem dla modelu bazowego, lecz jest rozwijany w modelu NSFW.

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

ICBINP XL - v4

Następny

MonsterCoffeeBang! Mix - v1.1 No VAE

Użyj tego modelu