modele/The Araminta Experiment (SDXL+Flux) - Fv3

The Araminta Experiment (SDXL+Flux) - Fv3

10/14/2025

1:04:04 AM

Powiązane słowa kluczowe i tagi

uniwersalny,aramintastudio,model bazowy,checkpoint,flux1-a1,fv3,gv4,nsfw,fotorealistyczny,realistyczny,sdxl 1.0,sdxl ilustracja,sdxl fotorealistyczny,stable diffusion xl,eksperyment araminta (sdxl+flux),kobieta

Młoda kobieta ze skrzydłami owada i czerwonymi uszami kota szybko jeździ na wrotkach przez rozmytą ulicę miasta, ubrana w gorset, spódnicę z nadrukiem i karmazynowe kozaki na wysokim obcasie.

Zalecane podpowiedzi

(photography by Jimmy Nelson and Sally Mann:1.0), (anus gaping), eye contact, (petite-bodied African) girl with her ass spread apart, hairy asshole, rear view, beautiful out of focus background

Zalecane negatywne podpowiedzi

child, big boobs, ((watermark)), ((make-up)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Zalecane parametry

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, dpmpp_3m_sde, dpmpp_3m_sde_gpu, DPM++ 3M SDE Exponential

steps

12 - 25

cfg

4 - 11

Wskazówki

Dla modeli SDXL używaj 25+ kroków i CFG około 5-7 z samplerami takimi jak DPM++ 2/3M SDE Karras lub Exponential.

Wypróbuj DPM++ SDE Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) dla różnych efektów.

Sampler Euler Ancestral / Normal może dawać mniej szczegółowe wyniki, przydatne z Fv6 dla mniej zaszumionych obrazów.

Domyślny CLIP Skip to 2; 1 zwiększa zgodność z promptem, 3-4 czasem poprawia skupienie na koncepcjach.

CFG modelu Flux jest wrażliwy; dla zdjęć utrzymuj niskie CFG (1.5-2.5), aby uniknąć efektu plastikowej skóry.

Dla surowych stylów w Flux utrzymuj CFG niskie (1.5-2.5); dla stylu anime/komiks wyższe CFG (3-6+) jest zalecane.

Najważniejsze informacje o wersji

Ulepszona wersja F z bardziej realistycznym przedstawieniem NSFW: ulepszone rozumienie koncepcji i lepsza tekstura skóry (zobacz obrazy porównawcze)

Opiera się na Fv2 z połączeniem batchXLPHOTOREAL_v1 oraz kilku osobiście wytrenowanych Lor.

Sponsorzy twórcy

Jeśli podoba Ci się mój wkład w tę społeczność, możesz postawić mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę tworzyć 😅

Galeria porównawcza tutaj: Fv6-Fv5 oraz porównanie ilustracji NSFW pomiędzy Gv1-Cv6-Fv2.

Aktualny model SOTA w moim eksperymencie:

Model bazowy SDXL: Gv4 to najbardziej zrównoważony model pozwalający na realistyczne i stylizowane obrazy NSFW i SFW. Lepsza estetyka niż Fv6, ale mniej fotorealistyczny.
Model fotorealistyczny SDXL (SFW i NSFW): Fv6 to wybór dla hiperrealizmu, w tym realistycznych obrazów NSFW, jednak z mniejszymi możliwościami stylizacji niż Gv4.
Ilustracja SDXL : Gv4 (SFW i NSFW). Cv6 jest jednak wciąż wart wypróbowania, jeśli nie interesują Cię obrazy NSFW.

Model Flux: Flux1-A1

Ustawienia generowania obrazów dla modeli SDXL

DPM++ 2/3M SDE / Karras lub Exponential są zawsze dobrym wyborem przy 25+ krokach i CFG około 5-7. Jednak DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) warto wypróbować, podobnie jak Euler Ancestral / Normal dla mniej szczegółowego efektu, który może być interesujący z modelem takim jak Fv6, by uzyskać coś mniej "zaszumionego".

Domyślny CLIP Skip o wartości 2 to także dobry wybór, ale warto spróbować użyć 1 lub 3-4: 1 bardziej wymusza zgodność z promptem, a 3-4 dają czasem lepszy efekt niż domyślny, skupiając się na "koncepcjach".

Ustawienia generowania obrazów dla modeli Flux

Moje preferowane ustawienia to DPM++ 2M / beta lub sgm_uniform lub DDEIS / normal dla samplera / scheduler'a, beta daje bardziej odważny, mocniejszy obraz. Dla bardziej subtelnego obrazu Euler / simple lub beta wydają się dobrym wyborem.

CFG ma duży wpływ na ostateczny obraz i jest bardzo wrażliwy nawet na małe zmiany.

Dla zdjęć CFG powinno być niskie (1.5-2.5), aby uniknąć efektu plastikowej skóry.
Dla sztuki i ilustracji jest to bardziej skomplikowane, ponieważ zależy od medium. Dla stylów „surowych” (malarstwo, akwarele itd.) CFG powinno pozostać niskie w zakresie 1.5-2.5, ale dla stylu anime lub komiksu CFG często trzeba podnieść, by osiągnąć pożądany styl (3-6 lub więcej).

Jeśli obraz jest chaotyczny/niewyraźny, często wynika to z nieodpowiednich ustawień CFG/kroków dla tego obrazu, ale nie zawsze łatwo jest stwierdzić, czy należy je zwiększyć czy zmniejszyć (przynajmniej dla mnie 😊).

Na pewno jest dużo do nauczenia się o zachowaniu Flux, które różni się od SDXL i będziemy musieli się dostosować.

Workflow

Wszystkie moje obrazy są przesyłane z osadzonym workflows ComfyUI, który niestety jest niekompatybilny z przetwarzaniem CivitAI i najczęściej prompt nie jest możliwy do odzyskania. Można jednak pobrać oryginalny obraz PNG z dołączonym workflow, klikając ikonę "DOWNLOAD" w przeglądarce obrazów.

Dlaczego staram się publikować głównie obrazy prosto z mojego modelu z ewentualnym dodatkiem Lory (mojej lub jakiegoś wzmacniacza detali), czasem też używam Controlnet, aby łatwiej uzyskać lepsze, bardziej szczegółowe kompozycje: w tym przypadku obraz źródłowy oczywiście nie jest w workflow, ale myślę, że możecie użyć obrazu, który publikuję jako źródła, jeśli chcecie zrobić wariację :)

Przeszłość

Od serii E modele ewoluują czasem przez łączenie z innymi modelami (dzięki innym współtwórcom!), ale głównie poprzez trening na moim własnym zbiorze danych: skromnym zbiorze (~2000 obrazów obecnie), staram się jakoś rekompensować to jakością i oryginalnością.

Począwszy od Fv1, dołączyłem wiele syntetycznych obrazów stworzonych przy użyciu poprzednich wersji: eksperymentując z promptem i retuszuąc w Photoshopie rezultat w razie potrzeby, aby mieć zbiór danych zawierający wiele oryginalnych obrazów.

Główną ideą tego modelu było stworzenie wszechstronnego narzędzia poprzez połączenie najlepszych istniejących modeli odpowiadających moim osobistym gustom (fotografia i sztuka fantastyczna, upraszczając). Moje główne cele to:

Fotorealizm: Możliwość tworzenia zachwycająco realistycznych obrazów zarówno ludzi, jak i obiektów/przyrody.
Elastyczność: Możliwość tworzenia wysoce stylizowanych obrazów, pozwalających na artystyczną ekspresję poprzez różne style i kombinacje artystów. Pochodzę z starszego pokolenia i Europy, więc „styl” nie oznacza dla mnie „japońskie kawaii anime z dużymi piersiami” czy „DC Comics z mnóstwem superbohaterów i krągłymi blond pięknościami”, ale raczej uniwersum Franka Frazetty, Milo Manary, Borisa Vallejo, H.R. Gigera, Wojtka Siudmaka i mistrzów fantastycznej sztuki: piersi się pojawiają, ale styl jest trochę inny :P
Ponieważ nie lubię być ograniczany w eksploracji ludzkiego ciała, pomysł to także posiadanie dość zdolnego modelu NSFW. Jednak ze względu na naturę dostępnych obrazów treningowych w zbiorach danych, NSFW często wiąże się z silnym uprzedzeniem ku pornograficznym zdjęciom lub japońskiemu porno-anime, co wpływa na elastyczność (zwykle gdy używasz słowa „sexy” w prompt, musisz uwzględnić styl). Ten punkt nie jest priorytetem dla modelu bazowego, ale jest rozwijany w modelu NSFW.

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

YFG Zaokrąglona Architektura i Pojazdy [Flux] - v1.0

Następny

(O.D.O.R.) - feet_anime_flux - v1

Użyj tego modelu