modele/The Araminta Experiment (SDXL+Flux) - Fv3

The Araminta Experiment (SDXL+Flux) - Fv3

|
10/14/2025
|
1:04:04 AM
| Discussion|
0
Młoda kobieta ze skrzydłami owada i czerwonymi uszami kota szybko jeździ na wrotkach przez rozmytą ulicę miasta, ubrana w gorset, spódnicę z nadrukiem i karmazynowe kozaki na wysokim obcasie.

Zalecane podpowiedzi

(photography by Jimmy Nelson and Sally Mann:1.0), (anus gaping), eye contact, (petite-bodied African) girl with her ass spread apart, hairy asshole, rear view, beautiful out of focus background

Zalecane negatywne podpowiedzi

child, big boobs, ((watermark)), ((make-up)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Zalecane parametry

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, dpmpp_3m_sde, dpmpp_3m_sde_gpu, DPM++ 3M SDE Exponential

steps

12 - 25

cfg

4 - 11

Wskazówki

Dla modeli SDXL używaj 25+ kroków i CFG około 5-7 z samplerami takimi jak DPM++ 2/3M SDE Karras lub Exponential.

Wypróbuj DPM++ SDE Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) dla różnych efektów.

Sampler Euler Ancestral / Normal może dawać mniej szczegółowe wyniki, przydatne z Fv6 dla mniej zaszumionych obrazów.

Domyślny CLIP Skip to 2; 1 zwiększa zgodność z promptem, 3-4 czasem poprawia skupienie na koncepcjach.

CFG modelu Flux jest wrażliwy; dla zdjęć utrzymuj niskie CFG (1.5-2.5), aby uniknąć efektu plastikowej skóry.

Dla surowych stylów w Flux utrzymuj CFG niskie (1.5-2.5); dla stylu anime/komiks wyższe CFG (3-6+) jest zalecane.

Najważniejsze informacje o wersji

Ulepszona wersja F z bardziej realistycznym przedstawieniem NSFW: ulepszone rozumienie koncepcji i lepsza tekstura skóry (zobacz obrazy porównawcze)

Opiera się na Fv2 z połączeniem batchXLPHOTOREAL_v1 oraz kilku osobiście wytrenowanych Lor.

Sponsorzy twórcy

Jeśli podoba Ci się mój wkład w tę społeczność, możesz postawić mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę tworzyć 😅

Jeśli podoba Ci się mój wkład w tę społeczność, możesz postawić mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę tworzyć 😅

Galeria porównawcza tutaj: Fv6-Fv5 oraz porównanie ilustracji NSFW pomiędzy Gv1-Cv6-Fv2.

Aktualny model SOTA w moim eksperymencie:

  • Model bazowy SDXL: Gv4 to najbardziej zrównoważony model pozwalający na realistyczne i stylizowane obrazy NSFW i SFW. Lepsza estetyka niż Fv6, ale mniej fotorealistyczny.

  • Model fotorealistyczny SDXL (SFW i NSFW): Fv6 to wybór dla hiperrealizmu, w tym realistycznych obrazów NSFW, jednak z mniejszymi możliwościami stylizacji niż Gv4.

  • Ilustracja SDXL : Gv4 (SFW i NSFW). Cv6 jest jednak wciąż wart wypróbowania, jeśli nie interesują Cię obrazy NSFW.

  • Model Flux: Flux1-A1

Ustawienia generowania obrazów dla modeli SDXL

DPM++ 2/3M SDE / Karras lub Exponential są zawsze dobrym wyborem przy 25+ krokach i CFG około 5-7. Jednak DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) warto wypróbować, podobnie jak Euler Ancestral / Normal dla mniej szczegółowego efektu, który może być interesujący z modelem takim jak Fv6, by uzyskać coś mniej "zaszumionego".

Domyślny CLIP Skip o wartości 2 to także dobry wybór, ale warto spróbować użyć 1 lub 3-4: 1 bardziej wymusza zgodność z promptem, a 3-4 dają czasem lepszy efekt niż domyślny, skupiając się na "koncepcjach".

Ustawienia generowania obrazów dla modeli Flux

Moje preferowane ustawienia to DPM++ 2M / beta lub sgm_uniform lub DDEIS / normal dla samplera / scheduler'a, beta daje bardziej odważny, mocniejszy obraz. Dla bardziej subtelnego obrazu Euler / simple lub beta wydają się dobrym wyborem.

CFG ma duży wpływ na ostateczny obraz i jest bardzo wrażliwy nawet na małe zmiany.

  • Dla zdjęć CFG powinno być niskie (1.5-2.5), aby uniknąć efektu plastikowej skóry.

  • Dla sztuki i ilustracji jest to bardziej skomplikowane, ponieważ zależy od medium. Dla stylów „surowych” (malarstwo, akwarele itd.) CFG powinno pozostać niskie w zakresie 1.5-2.5, ale dla stylu anime lub komiksu CFG często trzeba podnieść, by osiągnąć pożądany styl (3-6 lub więcej).

Jeśli obraz jest chaotyczny/niewyraźny, często wynika to z nieodpowiednich ustawień CFG/kroków dla tego obrazu, ale nie zawsze łatwo jest stwierdzić, czy należy je zwiększyć czy zmniejszyć (przynajmniej dla mnie 😊).

Na pewno jest dużo do nauczenia się o zachowaniu Flux, które różni się od SDXL i będziemy musieli się dostosować.

Workflow

Wszystkie moje obrazy są przesyłane z osadzonym workflows ComfyUI, który niestety jest niekompatybilny z przetwarzaniem CivitAI i najczęściej prompt nie jest możliwy do odzyskania. Można jednak pobrać oryginalny obraz PNG z dołączonym workflow, klikając ikonę "DOWNLOAD" w przeglądarce obrazów.

Dlaczego staram się publikować głównie obrazy prosto z mojego modelu z ewentualnym dodatkiem Lory (mojej lub jakiegoś wzmacniacza detali), czasem też używam Controlnet, aby łatwiej uzyskać lepsze, bardziej szczegółowe kompozycje: w tym przypadku obraz źródłowy oczywiście nie jest w workflow, ale myślę, że możecie użyć obrazu, który publikuję jako źródła, jeśli chcecie zrobić wariację :)

Przeszłość


Od serii E modele ewoluują czasem przez łączenie z innymi modelami (dzięki innym współtwórcom!), ale głównie poprzez trening na moim własnym zbiorze danych: skromnym zbiorze (~2000 obrazów obecnie), staram się jakoś rekompensować to jakością i oryginalnością.

Począwszy od Fv1, dołączyłem wiele syntetycznych obrazów stworzonych przy użyciu poprzednich wersji: eksperymentując z promptem i retuszuąc w Photoshopie rezultat w razie potrzeby, aby mieć zbiór danych zawierający wiele oryginalnych obrazów.


Główną ideą tego modelu było stworzenie wszechstronnego narzędzia poprzez połączenie najlepszych istniejących modeli odpowiadających moim osobistym gustom (fotografia i sztuka fantastyczna, upraszczając). Moje główne cele to:

  1. Fotorealizm: Możliwość tworzenia zachwycająco realistycznych obrazów zarówno ludzi, jak i obiektów/przyrody.

  2. Elastyczność: Możliwość tworzenia wysoce stylizowanych obrazów, pozwalających na artystyczną ekspresję poprzez różne style i kombinacje artystów. Pochodzę z starszego pokolenia i Europy, więc „styl” nie oznacza dla mnie „japońskie kawaii anime z dużymi piersiami” czy „DC Comics z mnóstwem superbohaterów i krągłymi blond pięknościami”, ale raczej uniwersum Franka Frazetty, Milo Manary, Borisa Vallejo, H.R. Gigera, Wojtka Siudmaka i mistrzów fantastycznej sztuki: piersi się pojawiają, ale styl jest trochę inny :P

  3. Ponieważ nie lubię być ograniczany w eksploracji ludzkiego ciała, pomysł to także posiadanie dość zdolnego modelu NSFW. Jednak ze względu na naturę dostępnych obrazów treningowych w zbiorach danych, NSFW często wiąże się z silnym uprzedzeniem ku pornograficznym zdjęciom lub japońskiemu porno-anime, co wpływa na elastyczność (zwykle gdy używasz słowa „sexy” w prompt, musisz uwzględnić styl). Ten punkt nie jest priorytetem dla modelu bazowego, ale jest rozwijany w modelu NSFW.

Poprzedni
YFG Zaokrąglona Architektura i Pojazdy [Flux] - v1.0
Następny
(O.D.O.R.) - feet_anime_flux - v1

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

SDXL 1.0

Wersja modelu

Fv3

Hash modelu

cc103f3491

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa The Araminta Experiment (SDXL+Flux) - Fv3

Młoda kobieta ze skrzydłami owada i czerwonymi uszami kota szybko jeździ na wrotkach przez rozmytą ulicę miasta, ubrana w gorset, spódnicę z nadrukiem i karmazynowe kozaki na wysokim obcasie.

Obrazy z model bazowy

Fotorealistyczna scena postaci nieumarłych, w tym zombie i szkieletów, spacerujących przez upiorny cmentarz oświetlony świecącymi lampionami jack-o'-lantern pod ciemnym, złowrogim niebem.

Obrazy z nsfw

Elegancka młoda kobieta ubrana w żywy czerwony kombinezon z czarnym kołnierzem, siedząca elegancko na czerwonym tapicerowanym drewnianym fotelu, z prostymi ciemnymi włosami i szczegółową twarzą.
Widok z profilu cyberpunkowej wojowniczki z długimi, różowymi, zaplecionymi włosami, tatuażami na ramieniu, ubraną w turkusową zbroję na tors i trzymającą katanę na tle neonowo oświetlonego przemysłowego krajobrazu.
Ilustracja w stylu anime przedstawiająca dziewczynę o blond włosach i niebieskich oczach, ubraną w czerwone bikini, pozującą pewnie na plaży z kroplami wody na skórze i falami w tle.
Szczegółowy cyfrowy obraz walecznej kobiety wojownika z długimi czerwonymi włosami, kucającej na kamiennym piedestale na cmentarzu, trzymającej miecz na plecach. Ma na sobie ciemną zbroję i turkusowy płaszcz, oświetlony mistycznymi błyskawicami na nocnym niebie.
Młoda kobieta w słomkowym kapeluszu i sukience stoi z rowerem na wiejskiej ścieżce otoczonej dzikimi kwiatami, obserwując zachód słońca nad wioską i pagórkami.
Portret z bliska wojowniczej księżniczki Wikingów z białym mohawkiem, niebieskimi oczami, misterną biżuterią, futrzanym ubraniem i tatuażami, na tle nocnego nieba z mgławicą i gwiazdami.
Steampunkowa kobieta z zaplecionymi włosami i goglami na głowie, z przezroczystym mechanicznym tułowiem zegarowym z widocznymi zębatkami i tłokami, pozuje pewnie na tle mechanicznego miasta.
Zbliżenie na drobną kobietę w okularach przeciwsłonecznych i skórzanej kurtce, oświetloną neonami w futurystycznym nocnym mieście w stylu retro synthwave z lat 80.
Cyberpunkowa kobieta cyborg z czerwonymi rogami oni i czarnymi włosami, nosząca czarną maskę i mechaniczne niebieskie ramiona, trzymająca świecący niebieski miecz katana w ciemnym futurystycznym korytarzu.
Cyberpunkowa dziewczyna o krótkich czarnych włosach, ubrana w żółty top i czarne spodnie z wysokim stanem, trzymająca futurystyczną broń, stojąca przed dużym mecha czołgiem i przemysłowym tłem.

Obrazy z fotorealistyczny

Blondynka z piegami i uśmiechem siedząca na dworze w bordowej koszulce z dekoltem w serek i kwiecistej mikroskopowej spódniczce w naturalnym świetle
Hiperrealistyczny szmaragdowo-zielony wąż zwinięty na pokrytej mchem gałęzi drzewa, z szeroko otwartą paszczą, ukazującą jadowite kły ociekające jadem, otoczony bujną tropikalną roślinnością i miękkim światłem słonecznym.
Zbliżenie fotorealistycznej głowy reptilian humanoida z bardzo szczegółową, teksturowaną łuskowatą skórą oświetloną dramatycznym ciepłym światłem.
Portret niskiej średniowiecznej damy noszącej wzmocnioną zbroję brigandine z metalową napierśnikiem i naramiennikami na ramionach, stojącej na średniowiecznym rynku z żółtymi oczami i krótkimi czarnymi włosami.
Fotorealistyczny obraz modelki ze skrzydłami pozującej dramatycznie w szpilkach, w dymnym, vintage'owym stylu filmu podczas pokazu mody.
Portret całej sylwetki kobiety o rudych włosach i piegach, ubranej w musztardową długą sukienkę z krótkimi falbanianymi rękawami, stojącej pośród liści dżungli na ciemnym tle.
Fotorealistyczny syberyjski husky w śnieżnym kamuflażu spec-ops stojący w zaśnieżonym sosnowym lesie z błyskami światła.
Fotorealistyczne zbliżenie pół-człowieka pół-cyborga w żywym czerwonym szlafroku trzymającej dwa miecze samurajskie w ciemnym, zadymionym noir mieście lat 40.
Fotografia makro pokazująca sylwetki łodyg dzikich kwiatów na tle dużego pomarańczowego zachodu słońca z kulistymi światłami bokeh w tle.

Obrazy z realistyczny

Stylizowany portret dziewczyny kota z niebieską skórą, świecącymi czerwonymi oczami, białymi włosami i futurystycznym makijażem w czarnym stroju przypominającym zbroję na tle intensywnego czerwono-niebieskiego tła z neonowym oświetleniem i czerwonym dymem.
Animowany portret Lois Lane w fioletowej marynarce i czarnej spódnicy, stojącej na miejskiej ulicy z drapaczami chmur w tle, trzymającej fioletową torebkę i uśmiechającej się.
Młoda dziewczyna z długimi białymi włosami, ubrana w czarny strój Iron Mana i futurystyczną czarną maskę gazową, stojąca przed czarnoskórym kosmitą z czerwonymi świecącymi oczami w ciemnym statku kosmicznym.
Realistyczny mężczyzna w zaawansowanej technologicznie scifi power armor z zarostem i niebieskimi oczami, stojący w miejskim otoczeniu z rozmytym tłem.
Zbliżony portret blondynki w szczegółowej, refleksyjnej metalowej zbroi z naramiennikami i napierśnikiem, na tle rozmytych starożytnych kamiennych kolumn.
3D renderowana umięśniona kobieta z piegami i czarnymi włosami w błyszczącym kombinezonie, pozująca na prostym czerwonym tle z kinowym oświetleniem i stylem atompunk.
Cyberpunkowy futurystyczny żołnierz w zaawansowanej zbroi i hełmie, trzymający dwie bronie, stojący na prostym białym tle z żywymi neonowymi akcentami.
Szerokie ujęcie futurystycznych ruin sci-fi owianych mgłą i chmurami pod pochmurnym niebem, z wysokimi konstrukcjami i mrocznym, klimatycznym nastrojem.
Ogromny rozbity statek kosmiczny góruje nad martwym bagnem z płonącym ogniem i gęstą mgłą pod żółto-pomarańczowym niebem, z dramatycznym, złowieszczym oświetleniem i szczegółowymi elementami sci-fi.

Obrazy z kobieta

Elfka ze srebrnymi włosami w futurystycznej zbroi stoi na tle wirującego, kolorowego nieba z chmurami, ukazana w żywym cyberpunkowym stylu obrazu olejnego.
Animowany portret Lois Lane w fioletowej marynarce i czarnej spódnicy, stojącej na miejskiej ulicy z drapaczami chmur w tle, trzymającej fioletową torebkę i uśmiechającej się.
Portret całej postaci kobiety z piegami i długimi rudymi włosami w żywej, wielokolorowej, płynącej sukni w odcieniach pomarańczowego, fioletu i niebieskiego.
Kobieta trzymająca zapaloną świecę na całkowicie czarnym, ciemnym tle, oświetlająca połowę jej twarzy ciepłym światłem świecy.
Portret kobiety o platynowo blond włosach i fioletowych oczach, ubranej w czarny crop top z odsłoniętymi ramionami, stojącej na tle żółtawo-brązowej, teksturowanej ściany, z tatuażem na górnej części ramienia i umięśnioną sylwetką.
3D renderowana umięśniona kobieta z piegami i czarnymi włosami w błyszczącym kombinezonie, pozująca na prostym czerwonym tle z kinowym oświetleniem i stylem atompunk.
Zbliżenie portretu kobiety o zielonych oczach leżącej na łóżku, oświetlonej ciepłym światłem złotej godziny wewnątrz.
Zbliżony portret kobiety ze średnio nieuczesanymi włosami i ciepłym światłem na ustach, oprawiony przez vintage okno z częściowym cieniem i odbiciem Wieży Eiffla.
Kobieta w stylu anime z zielonymi wężowymi włosami siedząca na niebieskim krześle biurowym przy biurku, ubrana w strój biznesowy i czarne szpilki.
Kobieta przypominająca Meduzę z zielonymi wężami zamiast włosów, w okularach i czerwonej sukience, machająca do widza z dużymi zielonymi oczami.