Czarno-biała żyrafa stoi, kontemplując olbrzymi mniszek lekarski na zaśnieżonym wzgórzu pod wietrznym niebem rozsiewającym nasiona mniszka w monochromatycznych tonach.

Zalecane negatywne podpowiedzi

big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Zalecane parametry

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, DPM++ 2M beta, sgm_uniform, DDEIS, normal, simple, beta, dpmpp_3m_sde, dpmpp_3m_sde_gpu

steps

12 - 25

cfg

1.5 - 11

Wskazówki

Używaj DPM++ 2/3M SDE z samplerami Karras lub Exponential i ponad 25 kroków oraz CFG około 5-7, aby uzyskać najlepsze wyniki z SDXL.

Wypróbuj DPM++ SDE Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) dla alternatywnych stylów.

Samplery Euler Ancestral / Normal dają mniej szczegółowe wyniki, które mogą być pożądane przy modelu Fv6 w celu redukcji szumu.

Domyślne CLIP Skip to 2, ale wypróbowanie 1 może zwiększyć dopasowanie do promptu, a 3-4 ulepszyć skupienie na konceptach.

Dla modeli Flux preferowane są samplery takie jak DPM++ 2M beta lub sgm_uniform.

Ustawienia CFG mają ogromny wpływ na jakość obrazów; niższe CFG (1.5-2.5) zapobiega efektowi plastikowej skóry na zdjęciach, podczas gdy dla stylów ilustracji może być wymagane wyższe CFG (3-6+).

Niewłaściwe ustawienia CFG lub liczby kroków często powodują rozmyte lub zdeformowane obrazy, konieczne mogą być dostosowania zależnie od stylu.

Najważniejsze informacje o wersji

Oparty na Fv4 z połączeniem wcześniejszych wersji moich modeli oraz BigLove_XL2, aby dalej posunąć realizm.

W efekcie Fv5 jest moją najbardziej fotorealistyczną wersją do tej pory, z bardziej precyzyjnymi i subtelnymi obrazami w porównaniu do F4, ale wraz z rosnącym realizmem model jest coraz mniej zdolny do tworzenia stylizowanych obrazów, zwłaszcza ilustracji: niedługo pojawi się nowa wersja serii G do takich zastosowań :)

Co do ustawień, DPM++ 2/3M SDE / Karras lub Exponential zawsze są dobrym wyborem przy 25+ krokach i CFG około 5-7. Ale DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) jest warte spróbowania. Domyślne CLIP SKIP o wartości 2 jest również dobrym wyborem, ale warto próbować też 1 lub 3-4.

Sponsorzy twórcy

Jeśli podobają Ci się moje wkłady w tę społeczność, śmiało kup mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę stworzyć 😅

Jeśli podobają Ci się moje wkłady w tę społeczność, śmiało kup mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę stworzyć 😅

Galeria porównawcza tutaj: Fv6-Fv5 oraz porównanie ilustracji NSFW między Gv1-Cv6-Fv2.

Aktualny model SOTA w moim eksperymencie:

  • Model bazowy SDXL: Gv4 to najbardziej zbalansowany model pozwalający na realistyczne i stylizowane obrazy NSFW i SFW. Lepsza estetyka niż Fv6, ale mniej fotorealistyczny.

  • Model fotorealistyczny SDXL (SFW i NSFW): Fv6 to wybór dla hiperrealizmu, w tym realistycznych obrazów NSFW, ale brakuje mu w dużej mierze możliwości stylizacji Gv4.

  • Ilustracja SDXL: Gv4 (SFW i NSFW). Cv6 jednak nadal warto wypróbować, jeśli nie interesują Cię obrazy NSFW.

  • Model Flux: Flux1-A1

Ustawienia generowania obrazów dla modeli SDXL

DPM++ 2/3M SDE / Karras lub Exponential są zawsze dobrym wyborem przy 25+ krokach i CFG około 5-7. Ale DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) jest warte wypróbowania, podobnie jak Euler Ancestral / Normal dla mniej szczegółowego wyniku, co może być interesujące w przypadku modelu Fv6, by uzyskać coś mniej „szumnego”.

Domyślny CLIP Skip o wartości 2 jest także dobrym wyborem, ale warto wypróbować 1 lub 3-4: 1 zwiększa dopasowanie do promptu, a 3-4 czasem dają lepszy efekt niż domyślny, skupiając się bardziej na „koncepcjach”.

Ustawienia generowania obrazów dla modeli Flux

Moje preferowane ustawienia to DPM++ 2M / beta lub sgm_uniform lub DDEIS / normal jako sampler / scheduler, gdzie beta daje bardziej wyrazisty i mocniejszy obraz. Dla bardziej subtelnego obrazu Euler / simple lub beta wydają się dobrym wyborem.

CFG ma ogromny wpływ na ostateczny obraz i jest bardzo czułe nawet na drobne zmiany.

  • Dla zdjęć CFG powinno pozostać niskie (1.5-2.5), by uniknąć efektu plastikowej skóry.

  • Dla dzieł sztuki i ilustracji jest to bardziej skomplikowane, bo zależy od medium. Dla „szorstkich” stylów (malarstwo, akwarele itp.) CFG powinno być dość niskie w zakresie 1.5-2.5, ale dla stylu anime lub komiksowego często trzeba je podnieść, by osiągnąć pożądany efekt (3-6 lub więcej).

Jeśli obraz jest niechlujny / zdeformowany lub rozmazany, często wynika to z niewłaściwego CFG/liczby kroków, ale nie zawsze łatwo określić, czy CFG/kroki należy zwiększyć czy zmniejszyć (przynajmniej dla mnie 😊).

Na pewno jest dużo do poznania odnośnie zachowania Flux, które jest dość inne niż SDXL i musimy się dostosować.

Workflow

Wszystkie moje obrazy są przesyłane z osadzonym workflow ComfyUI, który niestety jest niekompatybilny z przetwarzaniem CivitAI i najczęściej nie można odzyskać promptu. Możesz jednak pobrać oryginalny obraz PNG z dołączonym workflow, klikając ikonę „DOWNLOAD” w przeglądarce obrazów.

Dlaczego staram się publikować głównie obrazy prosto z mojego modelu z ewentualnym dodatkiem Lory (mojej lub wzmacniacza detali), czasem używam także Controlnet, aby łatwiej uzyskać lepsze, bardziej szczegółowe kompozycje: w tym przypadku obraz źródłowy oczywiście nie jest we workflow, ale przypuszczam, że nadal możesz użyć opublikowanego przeze mnie obrazu jako źródła, jeśli chcesz zrobić wariację :)

Przeszłość


Począwszy od serii E, modele ewoluują czasem poprzez łączenie się z innymi modelami (dzięki innym współtwórcom!), ale przede wszystkim przez trening na moim własnym zbiorze danych: skromny zbiór (~2000 obrazów obecnie), staram się jednak jakością i oryginalnością to jakoś zrekompensować.

Od Fv1 włączyłem wiele syntetycznych obrazów stworzonych za pomocą wcześniejszych wersji: mocno operując na promptach i retuszując w Photoshopie, gdy było to potrzebne, by mieć zbiór z wieloma oryginalnymi obrazami.


Główną ideą tego modelu było stworzenie wszechstronnego narzędzia przez połączenie najlepszych istniejących modeli odpowiadających mojemu gustowi (fotografia i fantastyka artystyczna, by to uprościć). Moje główne cele to:

  1. Fotorealizm: Zdolność do tworzenia oszałamiająco realistycznych obrazów zarówno postaci, jak i obiektów/natury.

  2. Elastyczność: Zdolność do tworzenia wysoce stylizowanych obrazów, umożliwiając wyraz artystyczny przez różne style i kombinacje artystów. Pochodzę z starszego pokolenia i Europy, więc „styl” nie oznacza dla mnie „japońskie kawaii anime z biustem” czy „DC Comics z mnóstwem superbohaterów i bujnymi blondynkami”, lecz bardziej świat Franka Frazetty, Milo Manary, Borisa Vallejo, H.R. Gigera, Wojtka Siudmaka i takich mistrzów sztuki fantastycznej: na pewno są tam piersi, ale styl jest nieco inny :P

  3. Ponieważ nie lubię być ograniczany w eksploracji ludzkiego ciała, zamysł to również mieć całkiem zdolny model NSFW. Jednak ze względu na charakter dostępnych obrazów treningowych w zestawach danych, NSFW często ma silne uprzedzenie ku zdjęciom pornograficznym lub japońskiej pornograficznej anime i wpływa to na elastyczność (zazwyczaj gdy używasz słowa „sexy” w prompt, musisz uwzględnić styl). Ten punkt NIE jest więc priorytetem dla modelu bazowego, lecz jest rozwijany w modelu NSFW.

Poprzedni
ICBINP XL - v4
Następny
MonsterCoffeeBang! Mix - v1.1 No VAE

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

SDXL 1.0

Wersja modelu

Fv5

Hash modelu

17b3e65f07

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa Eksperyment Araminta (SDXL+Flux) - Fv5

Czarno-biała żyrafa stoi, kontemplując olbrzymi mniszek lekarski na zaśnieżonym wzgórzu pod wietrznym niebem rozsiewającym nasiona mniszka w monochromatycznych tonach.

Obrazy z model bazowy

Fotorealistyczna scena postaci nieumarłych, w tym zombie i szkieletów, spacerujących przez upiorny cmentarz oświetlony świecącymi lampionami jack-o'-lantern pod ciemnym, złowrogim niebem.

Obrazy z nsfw

Elegancka młoda kobieta ubrana w żywy czerwony kombinezon z czarnym kołnierzem, siedząca elegancko na czerwonym tapicerowanym drewnianym fotelu, z prostymi ciemnymi włosami i szczegółową twarzą.
Widok z profilu cyberpunkowej wojowniczki z długimi, różowymi, zaplecionymi włosami, tatuażami na ramieniu, ubraną w turkusową zbroję na tors i trzymającą katanę na tle neonowo oświetlonego przemysłowego krajobrazu.
Ilustracja w stylu anime przedstawiająca dziewczynę o blond włosach i niebieskich oczach, ubraną w czerwone bikini, pozującą pewnie na plaży z kroplami wody na skórze i falami w tle.
Szczegółowy cyfrowy obraz walecznej kobiety wojownika z długimi czerwonymi włosami, kucającej na kamiennym piedestale na cmentarzu, trzymającej miecz na plecach. Ma na sobie ciemną zbroję i turkusowy płaszcz, oświetlony mistycznymi błyskawicami na nocnym niebie.
Młoda kobieta w słomkowym kapeluszu i sukience stoi z rowerem na wiejskiej ścieżce otoczonej dzikimi kwiatami, obserwując zachód słońca nad wioską i pagórkami.
Portret z bliska wojowniczej księżniczki Wikingów z białym mohawkiem, niebieskimi oczami, misterną biżuterią, futrzanym ubraniem i tatuażami, na tle nocnego nieba z mgławicą i gwiazdami.
Steampunkowa kobieta z zaplecionymi włosami i goglami na głowie, z przezroczystym mechanicznym tułowiem zegarowym z widocznymi zębatkami i tłokami, pozuje pewnie na tle mechanicznego miasta.
Zbliżenie na drobną kobietę w okularach przeciwsłonecznych i skórzanej kurtce, oświetloną neonami w futurystycznym nocnym mieście w stylu retro synthwave z lat 80.
Cyberpunkowa kobieta cyborg z czerwonymi rogami oni i czarnymi włosami, nosząca czarną maskę i mechaniczne niebieskie ramiona, trzymająca świecący niebieski miecz katana w ciemnym futurystycznym korytarzu.
Cyberpunkowa dziewczyna o krótkich czarnych włosach, ubrana w żółty top i czarne spodnie z wysokim stanem, trzymająca futurystyczną broń, stojąca przed dużym mecha czołgiem i przemysłowym tłem.

Obrazy z fotorealistyczny

Blondynka z piegami i uśmiechem siedząca na dworze w bordowej koszulce z dekoltem w serek i kwiecistej mikroskopowej spódniczce w naturalnym świetle
Hiperrealistyczny szmaragdowo-zielony wąż zwinięty na pokrytej mchem gałęzi drzewa, z szeroko otwartą paszczą, ukazującą jadowite kły ociekające jadem, otoczony bujną tropikalną roślinnością i miękkim światłem słonecznym.
Zbliżenie fotorealistycznej głowy reptilian humanoida z bardzo szczegółową, teksturowaną łuskowatą skórą oświetloną dramatycznym ciepłym światłem.
Portret niskiej średniowiecznej damy noszącej wzmocnioną zbroję brigandine z metalową napierśnikiem i naramiennikami na ramionach, stojącej na średniowiecznym rynku z żółtymi oczami i krótkimi czarnymi włosami.
Fotorealistyczny obraz modelki ze skrzydłami pozującej dramatycznie w szpilkach, w dymnym, vintage'owym stylu filmu podczas pokazu mody.
Portret całej sylwetki kobiety o rudych włosach i piegach, ubranej w musztardową długą sukienkę z krótkimi falbanianymi rękawami, stojącej pośród liści dżungli na ciemnym tle.
Fotorealistyczny syberyjski husky w śnieżnym kamuflażu spec-ops stojący w zaśnieżonym sosnowym lesie z błyskami światła.
Fotorealistyczne zbliżenie pół-człowieka pół-cyborga w żywym czerwonym szlafroku trzymającej dwa miecze samurajskie w ciemnym, zadymionym noir mieście lat 40.
Fotografia makro pokazująca sylwetki łodyg dzikich kwiatów na tle dużego pomarańczowego zachodu słońca z kulistymi światłami bokeh w tle.

Obrazy z realistyczny

Stylizowany portret dziewczyny kota z niebieską skórą, świecącymi czerwonymi oczami, białymi włosami i futurystycznym makijażem w czarnym stroju przypominającym zbroję na tle intensywnego czerwono-niebieskiego tła z neonowym oświetleniem i czerwonym dymem.
Animowany portret Lois Lane w fioletowej marynarce i czarnej spódnicy, stojącej na miejskiej ulicy z drapaczami chmur w tle, trzymającej fioletową torebkę i uśmiechającej się.
Młoda dziewczyna z długimi białymi włosami, ubrana w czarny strój Iron Mana i futurystyczną czarną maskę gazową, stojąca przed czarnoskórym kosmitą z czerwonymi świecącymi oczami w ciemnym statku kosmicznym.
Realistyczny mężczyzna w zaawansowanej technologicznie scifi power armor z zarostem i niebieskimi oczami, stojący w miejskim otoczeniu z rozmytym tłem.
Zbliżony portret blondynki w szczegółowej, refleksyjnej metalowej zbroi z naramiennikami i napierśnikiem, na tle rozmytych starożytnych kamiennych kolumn.
3D renderowana umięśniona kobieta z piegami i czarnymi włosami w błyszczącym kombinezonie, pozująca na prostym czerwonym tle z kinowym oświetleniem i stylem atompunk.
Cyberpunkowy futurystyczny żołnierz w zaawansowanej zbroi i hełmie, trzymający dwie bronie, stojący na prostym białym tle z żywymi neonowymi akcentami.
Szerokie ujęcie futurystycznych ruin sci-fi owianych mgłą i chmurami pod pochmurnym niebem, z wysokimi konstrukcjami i mrocznym, klimatycznym nastrojem.
Ogromny rozbity statek kosmiczny góruje nad martwym bagnem z płonącym ogniem i gęstą mgłą pod żółto-pomarańczowym niebem, z dramatycznym, złowieszczym oświetleniem i szczegółowymi elementami sci-fi.

Obrazy z kobieta

Elfka ze srebrnymi włosami w futurystycznej zbroi stoi na tle wirującego, kolorowego nieba z chmurami, ukazana w żywym cyberpunkowym stylu obrazu olejnego.
Animowany portret Lois Lane w fioletowej marynarce i czarnej spódnicy, stojącej na miejskiej ulicy z drapaczami chmur w tle, trzymającej fioletową torebkę i uśmiechającej się.
Portret całej postaci kobiety z piegami i długimi rudymi włosami w żywej, wielokolorowej, płynącej sukni w odcieniach pomarańczowego, fioletu i niebieskiego.
Kobieta trzymająca zapaloną świecę na całkowicie czarnym, ciemnym tle, oświetlająca połowę jej twarzy ciepłym światłem świecy.
Portret kobiety o platynowo blond włosach i fioletowych oczach, ubranej w czarny crop top z odsłoniętymi ramionami, stojącej na tle żółtawo-brązowej, teksturowanej ściany, z tatuażem na górnej części ramienia i umięśnioną sylwetką.
3D renderowana umięśniona kobieta z piegami i czarnymi włosami w błyszczącym kombinezonie, pozująca na prostym czerwonym tle z kinowym oświetleniem i stylem atompunk.
Zbliżenie portretu kobiety o zielonych oczach leżącej na łóżku, oświetlonej ciepłym światłem złotej godziny wewnątrz.
Zbliżony portret kobiety ze średnio nieuczesanymi włosami i ciepłym światłem na ustach, oprawiony przez vintage okno z częściowym cieniem i odbiciem Wieży Eiffla.
Kobieta w stylu anime z zielonymi wężowymi włosami siedząca na niebieskim krześle biurowym przy biurku, ubrana w strój biznesowy i czarne szpilki.
Kobieta przypominająca Meduzę z zielonymi wężami zamiast włosów, w okularach i czerwonej sukience, machająca do widza z dużymi zielonymi oczami.