The Araminta Experiment (SDXL+Flux) - Fv3
Zalecane podpowiedzi
(photography by Jimmy Nelson and Sally Mann:1.0), (anus gaping), eye contact, (petite-bodied African) girl with her ass spread apart, hairy asshole, rear view, beautiful out of focus background
Zalecane negatywne podpowiedzi
child, big boobs, ((watermark)), ((make-up)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb
Zalecane parametry
samplers
steps
cfg
Wskazówki
Dla modeli SDXL używaj 25+ kroków i CFG około 5-7 z samplerami takimi jak DPM++ 2/3M SDE Karras lub Exponential.
Wypróbuj DPM++ SDE Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) dla różnych efektów.
Sampler Euler Ancestral / Normal może dawać mniej szczegółowe wyniki, przydatne z Fv6 dla mniej zaszumionych obrazów.
Domyślny CLIP Skip to 2; 1 zwiększa zgodność z promptem, 3-4 czasem poprawia skupienie na koncepcjach.
CFG modelu Flux jest wrażliwy; dla zdjęć utrzymuj niskie CFG (1.5-2.5), aby uniknąć efektu plastikowej skóry.
Dla surowych stylów w Flux utrzymuj CFG niskie (1.5-2.5); dla stylu anime/komiks wyższe CFG (3-6+) jest zalecane.
Najważniejsze informacje o wersji
Ulepszona wersja F z bardziej realistycznym przedstawieniem NSFW: ulepszone rozumienie koncepcji i lepsza tekstura skóry (zobacz obrazy porównawcze)
Opiera się na Fv2 z połączeniem batchXLPHOTOREAL_v1 oraz kilku osobiście wytrenowanych Lor.
Sponsorzy twórcy
Jeśli podoba Ci się mój wkład w tę społeczność, możesz postawić mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę tworzyć 😅
Jeśli podoba Ci się mój wkład w tę społeczność, możesz postawić mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę tworzyć 😅
Galeria porównawcza tutaj: Fv6-Fv5 oraz porównanie ilustracji NSFW pomiędzy Gv1-Cv6-Fv2.

Aktualny model SOTA w moim eksperymencie:
Model bazowy SDXL: Gv4 to najbardziej zrównoważony model pozwalający na realistyczne i stylizowane obrazy NSFW i SFW. Lepsza estetyka niż Fv6, ale mniej fotorealistyczny.
Model fotorealistyczny SDXL (SFW i NSFW): Fv6 to wybór dla hiperrealizmu, w tym realistycznych obrazów NSFW, jednak z mniejszymi możliwościami stylizacji niż Gv4.
Ilustracja SDXL : Gv4 (SFW i NSFW). Cv6 jest jednak wciąż wart wypróbowania, jeśli nie interesują Cię obrazy NSFW.
Model Flux: Flux1-A1
Ustawienia generowania obrazów dla modeli SDXL
DPM++ 2/3M SDE / Karras lub Exponential są zawsze dobrym wyborem przy 25+ krokach i CFG około 5-7. Jednak DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) warto wypróbować, podobnie jak Euler Ancestral / Normal dla mniej szczegółowego efektu, który może być interesujący z modelem takim jak Fv6, by uzyskać coś mniej "zaszumionego".
Domyślny CLIP Skip o wartości 2 to także dobry wybór, ale warto spróbować użyć 1 lub 3-4: 1 bardziej wymusza zgodność z promptem, a 3-4 dają czasem lepszy efekt niż domyślny, skupiając się na "koncepcjach".
Ustawienia generowania obrazów dla modeli Flux
Moje preferowane ustawienia to DPM++ 2M / beta lub sgm_uniform lub DDEIS / normal dla samplera / scheduler'a, beta daje bardziej odważny, mocniejszy obraz. Dla bardziej subtelnego obrazu Euler / simple lub beta wydają się dobrym wyborem.
CFG ma duży wpływ na ostateczny obraz i jest bardzo wrażliwy nawet na małe zmiany.
Dla zdjęć CFG powinno być niskie (1.5-2.5), aby uniknąć efektu plastikowej skóry.
Dla sztuki i ilustracji jest to bardziej skomplikowane, ponieważ zależy od medium. Dla stylów „surowych” (malarstwo, akwarele itd.) CFG powinno pozostać niskie w zakresie 1.5-2.5, ale dla stylu anime lub komiksu CFG często trzeba podnieść, by osiągnąć pożądany styl (3-6 lub więcej).
Jeśli obraz jest chaotyczny/niewyraźny, często wynika to z nieodpowiednich ustawień CFG/kroków dla tego obrazu, ale nie zawsze łatwo jest stwierdzić, czy należy je zwiększyć czy zmniejszyć (przynajmniej dla mnie 😊).
Na pewno jest dużo do nauczenia się o zachowaniu Flux, które różni się od SDXL i będziemy musieli się dostosować.
Workflow
Wszystkie moje obrazy są przesyłane z osadzonym workflows ComfyUI, który niestety jest niekompatybilny z przetwarzaniem CivitAI i najczęściej prompt nie jest możliwy do odzyskania. Można jednak pobrać oryginalny obraz PNG z dołączonym workflow, klikając ikonę "DOWNLOAD" w przeglądarce obrazów.
Dlaczego staram się publikować głównie obrazy prosto z mojego modelu z ewentualnym dodatkiem Lory (mojej lub jakiegoś wzmacniacza detali), czasem też używam Controlnet, aby łatwiej uzyskać lepsze, bardziej szczegółowe kompozycje: w tym przypadku obraz źródłowy oczywiście nie jest w workflow, ale myślę, że możecie użyć obrazu, który publikuję jako źródła, jeśli chcecie zrobić wariację :)
Przeszłość
Od serii E modele ewoluują czasem przez łączenie z innymi modelami (dzięki innym współtwórcom!), ale głównie poprzez trening na moim własnym zbiorze danych: skromnym zbiorze (~2000 obrazów obecnie), staram się jakoś rekompensować to jakością i oryginalnością.
Począwszy od Fv1, dołączyłem wiele syntetycznych obrazów stworzonych przy użyciu poprzednich wersji: eksperymentując z promptem i retuszuąc w Photoshopie rezultat w razie potrzeby, aby mieć zbiór danych zawierający wiele oryginalnych obrazów.
Główną ideą tego modelu było stworzenie wszechstronnego narzędzia poprzez połączenie najlepszych istniejących modeli odpowiadających moim osobistym gustom (fotografia i sztuka fantastyczna, upraszczając). Moje główne cele to:
Fotorealizm: Możliwość tworzenia zachwycająco realistycznych obrazów zarówno ludzi, jak i obiektów/przyrody.
Elastyczność: Możliwość tworzenia wysoce stylizowanych obrazów, pozwalających na artystyczną ekspresję poprzez różne style i kombinacje artystów. Pochodzę z starszego pokolenia i Europy, więc „styl” nie oznacza dla mnie „japońskie kawaii anime z dużymi piersiami” czy „DC Comics z mnóstwem superbohaterów i krągłymi blond pięknościami”, ale raczej uniwersum Franka Frazetty, Milo Manary, Borisa Vallejo, H.R. Gigera, Wojtka Siudmaka i mistrzów fantastycznej sztuki: piersi się pojawiają, ale styl jest trochę inny :P
Ponieważ nie lubię być ograniczany w eksploracji ludzkiego ciała, pomysł to także posiadanie dość zdolnego modelu NSFW. Jednak ze względu na naturę dostępnych obrazów treningowych w zbiorach danych, NSFW często wiąże się z silnym uprzedzeniem ku pornograficznym zdjęciom lub japońskiemu porno-anime, co wpływa na elastyczność (zwykle gdy używasz słowa „sexy” w prompt, musisz uwzględnić styl). Ten punkt nie jest priorytetem dla modelu bazowego, ale jest rozwijany w modelu NSFW.
Szczegóły modelu
Dyskusja
Proszę się log in, aby dodać komentarz.
