Czarno-biała żyrafa stoi, kontemplując olbrzymi mniszek lekarski na zaśnieżonym wzgórzu pod wietrznym niebem rozsiewającym nasiona mniszka w monochromatycznych tonach.

Zalecane negatywne podpowiedzi

big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Zalecane parametry

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, DPM++ 2M beta, sgm_uniform, DDEIS, normal, simple, beta, dpmpp_3m_sde, dpmpp_3m_sde_gpu

steps

12 - 25

cfg

1.5 - 11

Wskazówki

Używaj DPM++ 2/3M SDE z samplerami Karras lub Exponential i ponad 25 kroków oraz CFG około 5-7, aby uzyskać najlepsze wyniki z SDXL.

Wypróbuj DPM++ SDE Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) dla alternatywnych stylów.

Samplery Euler Ancestral / Normal dają mniej szczegółowe wyniki, które mogą być pożądane przy modelu Fv6 w celu redukcji szumu.

Domyślne CLIP Skip to 2, ale wypróbowanie 1 może zwiększyć dopasowanie do promptu, a 3-4 ulepszyć skupienie na konceptach.

Dla modeli Flux preferowane są samplery takie jak DPM++ 2M beta lub sgm_uniform.

Ustawienia CFG mają ogromny wpływ na jakość obrazów; niższe CFG (1.5-2.5) zapobiega efektowi plastikowej skóry na zdjęciach, podczas gdy dla stylów ilustracji może być wymagane wyższe CFG (3-6+).

Niewłaściwe ustawienia CFG lub liczby kroków często powodują rozmyte lub zdeformowane obrazy, konieczne mogą być dostosowania zależnie od stylu.

Najważniejsze informacje o wersji

Oparty na Fv4 z połączeniem wcześniejszych wersji moich modeli oraz BigLove_XL2, aby dalej posunąć realizm.

W efekcie Fv5 jest moją najbardziej fotorealistyczną wersją do tej pory, z bardziej precyzyjnymi i subtelnymi obrazami w porównaniu do F4, ale wraz z rosnącym realizmem model jest coraz mniej zdolny do tworzenia stylizowanych obrazów, zwłaszcza ilustracji: niedługo pojawi się nowa wersja serii G do takich zastosowań :)

Co do ustawień, DPM++ 2/3M SDE / Karras lub Exponential zawsze są dobrym wyborem przy 25+ krokach i CFG około 5-7. Ale DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) jest warte spróbowania. Domyślne CLIP SKIP o wartości 2 jest również dobrym wyborem, ale warto próbować też 1 lub 3-4.

Sponsorzy twórcy

Jeśli podobają Ci się moje wkłady w tę społeczność, śmiało kup mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę stworzyć 😅

Jeśli podobają Ci się moje wkłady w tę społeczność, śmiało kup mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę stworzyć 😅

Galeria porównawcza tutaj: Fv6-Fv5 oraz porównanie ilustracji NSFW między Gv1-Cv6-Fv2.

Aktualny model SOTA w moim eksperymencie:

  • Model bazowy SDXL: Gv4 to najbardziej zbalansowany model pozwalający na realistyczne i stylizowane obrazy NSFW i SFW. Lepsza estetyka niż Fv6, ale mniej fotorealistyczny.

  • Model fotorealistyczny SDXL (SFW i NSFW): Fv6 to wybór dla hiperrealizmu, w tym realistycznych obrazów NSFW, ale brakuje mu w dużej mierze możliwości stylizacji Gv4.

  • Ilustracja SDXL: Gv4 (SFW i NSFW). Cv6 jednak nadal warto wypróbować, jeśli nie interesują Cię obrazy NSFW.

  • Model Flux: Flux1-A1

Ustawienia generowania obrazów dla modeli SDXL

DPM++ 2/3M SDE / Karras lub Exponential są zawsze dobrym wyborem przy 25+ krokach i CFG około 5-7. Ale DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) jest warte wypróbowania, podobnie jak Euler Ancestral / Normal dla mniej szczegółowego wyniku, co może być interesujące w przypadku modelu Fv6, by uzyskać coś mniej „szumnego”.

Domyślny CLIP Skip o wartości 2 jest także dobrym wyborem, ale warto wypróbować 1 lub 3-4: 1 zwiększa dopasowanie do promptu, a 3-4 czasem dają lepszy efekt niż domyślny, skupiając się bardziej na „koncepcjach”.

Ustawienia generowania obrazów dla modeli Flux

Moje preferowane ustawienia to DPM++ 2M / beta lub sgm_uniform lub DDEIS / normal jako sampler / scheduler, gdzie beta daje bardziej wyrazisty i mocniejszy obraz. Dla bardziej subtelnego obrazu Euler / simple lub beta wydają się dobrym wyborem.

CFG ma ogromny wpływ na ostateczny obraz i jest bardzo czułe nawet na drobne zmiany.

  • Dla zdjęć CFG powinno pozostać niskie (1.5-2.5), by uniknąć efektu plastikowej skóry.

  • Dla dzieł sztuki i ilustracji jest to bardziej skomplikowane, bo zależy od medium. Dla „szorstkich” stylów (malarstwo, akwarele itp.) CFG powinno być dość niskie w zakresie 1.5-2.5, ale dla stylu anime lub komiksowego często trzeba je podnieść, by osiągnąć pożądany efekt (3-6 lub więcej).

Jeśli obraz jest niechlujny / zdeformowany lub rozmazany, często wynika to z niewłaściwego CFG/liczby kroków, ale nie zawsze łatwo określić, czy CFG/kroki należy zwiększyć czy zmniejszyć (przynajmniej dla mnie 😊).

Na pewno jest dużo do poznania odnośnie zachowania Flux, które jest dość inne niż SDXL i musimy się dostosować.

Workflow

Wszystkie moje obrazy są przesyłane z osadzonym workflow ComfyUI, który niestety jest niekompatybilny z przetwarzaniem CivitAI i najczęściej nie można odzyskać promptu. Możesz jednak pobrać oryginalny obraz PNG z dołączonym workflow, klikając ikonę „DOWNLOAD” w przeglądarce obrazów.

Dlaczego staram się publikować głównie obrazy prosto z mojego modelu z ewentualnym dodatkiem Lory (mojej lub wzmacniacza detali), czasem używam także Controlnet, aby łatwiej uzyskać lepsze, bardziej szczegółowe kompozycje: w tym przypadku obraz źródłowy oczywiście nie jest we workflow, ale przypuszczam, że nadal możesz użyć opublikowanego przeze mnie obrazu jako źródła, jeśli chcesz zrobić wariację :)

Przeszłość


Począwszy od serii E, modele ewoluują czasem poprzez łączenie się z innymi modelami (dzięki innym współtwórcom!), ale przede wszystkim przez trening na moim własnym zbiorze danych: skromny zbiór (~2000 obrazów obecnie), staram się jednak jakością i oryginalnością to jakoś zrekompensować.

Od Fv1 włączyłem wiele syntetycznych obrazów stworzonych za pomocą wcześniejszych wersji: mocno operując na promptach i retuszując w Photoshopie, gdy było to potrzebne, by mieć zbiór z wieloma oryginalnymi obrazami.


Główną ideą tego modelu było stworzenie wszechstronnego narzędzia przez połączenie najlepszych istniejących modeli odpowiadających mojemu gustowi (fotografia i fantastyka artystyczna, by to uprościć). Moje główne cele to:

  1. Fotorealizm: Zdolność do tworzenia oszałamiająco realistycznych obrazów zarówno postaci, jak i obiektów/natury.

  2. Elastyczność: Zdolność do tworzenia wysoce stylizowanych obrazów, umożliwiając wyraz artystyczny przez różne style i kombinacje artystów. Pochodzę z starszego pokolenia i Europy, więc „styl” nie oznacza dla mnie „japońskie kawaii anime z biustem” czy „DC Comics z mnóstwem superbohaterów i bujnymi blondynkami”, lecz bardziej świat Franka Frazetty, Milo Manary, Borisa Vallejo, H.R. Gigera, Wojtka Siudmaka i takich mistrzów sztuki fantastycznej: na pewno są tam piersi, ale styl jest nieco inny :P

  3. Ponieważ nie lubię być ograniczany w eksploracji ludzkiego ciała, zamysł to również mieć całkiem zdolny model NSFW. Jednak ze względu na charakter dostępnych obrazów treningowych w zestawach danych, NSFW często ma silne uprzedzenie ku zdjęciom pornograficznym lub japońskiej pornograficznej anime i wpływa to na elastyczność (zazwyczaj gdy używasz słowa „sexy” w prompt, musisz uwzględnić styl). Ten punkt NIE jest więc priorytetem dla modelu bazowego, lecz jest rozwijany w modelu NSFW.

Poprzedni
ICBINP XL - v4
Następny
MonsterCoffeeBang! Mix - v1.1 No VAE

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

SDXL 1.0

Wersja modelu

Fv5

Hash modelu

17b3e65f07

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa Eksperyment Araminta (SDXL+Flux) - Fv5

Czarno-biała żyrafa stoi, kontemplując olbrzymi mniszek lekarski na zaśnieżonym wzgórzu pod wietrznym niebem rozsiewającym nasiona mniszka w monochromatycznych tonach.

Obrazy z model bazowy

Fotorealistyczna scena postaci nieumarłych, w tym zombie i szkieletów, spacerujących przez upiorny cmentarz oświetlony świecącymi lampionami jack-o'-lantern pod ciemnym, złowrogim niebem.

Obrazy z nsfw

Szczegółowy cyfrowy portret kobiety wojownika z długimi czarnymi włosami, czerwonymi oczami i piegami, trzymającej katanę na ramieniu na niebieskim tle.
Elegancka młoda kobieta ubrana w żywy czerwony kombinezon z czarnym kołnierzem, siedząca elegancko na czerwonym tapicerowanym drewnianym fotelu, z prostymi ciemnymi włosami i szczegółową twarzą.
Widok z profilu cyberpunkowej wojowniczki z długimi, różowymi, zaplecionymi włosami, tatuażami na ramieniu, ubraną w turkusową zbroję na tors i trzymającą katanę na tle neonowo oświetlonego przemysłowego krajobrazu.
Ilustracja w stylu anime przedstawiająca dziewczynę o blond włosach i niebieskich oczach, ubraną w czerwone bikini, pozującą pewnie na plaży z kroplami wody na skórze i falami w tle.
Szczegółowy cyfrowy obraz walecznej kobiety wojownika z długimi czerwonymi włosami, kucającej na kamiennym piedestale na cmentarzu, trzymającej miecz na plecach. Ma na sobie ciemną zbroję i turkusowy płaszcz, oświetlony mistycznymi błyskawicami na nocnym niebie.
Młoda kobieta w słomkowym kapeluszu i sukience stoi z rowerem na wiejskiej ścieżce otoczonej dzikimi kwiatami, obserwując zachód słońca nad wioską i pagórkami.
Portret z bliska wojowniczej księżniczki Wikingów z białym mohawkiem, niebieskimi oczami, misterną biżuterią, futrzanym ubraniem i tatuażami, na tle nocnego nieba z mgławicą i gwiazdami.
Steampunkowa kobieta z zaplecionymi włosami i goglami na głowie, z przezroczystym mechanicznym tułowiem zegarowym z widocznymi zębatkami i tłokami, pozuje pewnie na tle mechanicznego miasta.
Zbliżenie na drobną kobietę w okularach przeciwsłonecznych i skórzanej kurtce, oświetloną neonami w futurystycznym nocnym mieście w stylu retro synthwave z lat 80.
Cyberpunkowa kobieta cyborg z czerwonymi rogami oni i czarnymi włosami, nosząca czarną maskę i mechaniczne niebieskie ramiona, trzymająca świecący niebieski miecz katana w ciemnym futurystycznym korytarzu.

Obrazy z fotorealistyczny

Sylwetka cybernetycznego człowieka ze skrzydłami i długimi, smukłymi nogami wypełniona fotorealistycznym kolażem mixed media miejskich krajobrazów i budynków pod kinowym oświetleniem.
Czarno-biały futurystyczny obraz z metalicznymi liniami rozciągającymi się od góry, z czerwonymi liśćmi ramującymi scenę oraz niebieskim pulsującym diamentem na środku.
Fotorealistyczny obraz robota pokojówki leżącej na leśnej ziemi z wplątanymi w jej włosy liśćmi i częściami robota, ubranej w białą suknię pokojówki.
Fantastyczna supermodelka o eterycznym pięknie w żywej, kolorowej awangardowej sukni, ozdobiona misterną biżuterią, na tle wirującego, jaskrawego, wielokolorowego tła.
Młoda kobieta baristka stojąca za rustykalnym ladą kawiarni, ubrana w czarną koszulę z guzikami i czarny fartuch, delikatnie się uśmiechając, z naturalnym makijażem i związanymi włosami.
Trzy kobiety w marynarskich swetrach i spodniach stoją razem na pokładzie luksusowego jachtu nocą z tłem karaibskiego oceanu.
Fotorealistyczna scena młodej japońskiej kobiety w płynącej, kolorowej sukience na ramiączkach, spacerującej leśną ścieżką otoczoną świecącymi, unoszącymi się meduzami, przy naturalnym oświetleniu.
Urocza dziewczyna siedząca wygodnie w przytulnej bibliotece, ucząca się przy świetle świec z ciepłym, nastrojowym oświetleniem i otwartą książką przed sobą.
Szczegółowa 2D wektorowa ilustracja kobiety ozdobionej kwiatami czarnej orchidei i misternymi wzorami kwiatowymi w stylu barokowym.
Zbliżenie młodego mężczyzny z krótkim blond brodawkowym zarostem i okularami, oświetlone połowicznie porannym słońcem, z pręgowanym kotem odpoczywającym na ramieniu.

Obrazy z realistyczny

Szczegółowy realistyczny portret młodej kobiety z pięknymi niebieskimi oczami, białymi włosami ozdobionymi kwiatami i złotymi ozdobami, podkreślony oświetleniem bocznym i featuring lśniącą skórą.
Jedyny Pierścień świecący złotymi runami spoczywa na szczegółowej fantastycznej mapie Śródziemia, oświetlony dramatycznym kinowym światłem i otoczony cieniami miniaturowych drzew.
Impresjonistyczny obraz olejny uwodzicielskiej kobiety o bladej cerze z nowoczesną czarną fryzurą bob, ubraną w bordową satynową suknię bez rękawów z szerokim czarnym paskiem, na tle ciepłego złotego i ciemnego, fakturowanego tła z oświetleniem chiaroscuro.
Realistyczny, szczegółowy portret blondyna trzymającego duży magiczny szmaragd ze złotymi zdobieniami, ubranego w ozdobną niebieską kamizelkę zdobioną zielonymi kamieniami i misterną złotą biżuterię.
Realistyczna ilustracja dziewczyny z białymi włosami i świecącymi fioletowymi oczami, ubranej w czarny crop top i jasnoniebieską mini spódniczkę, siedzącej wśród różowych kwiatów pod nocnym niebem z jasnym słońcem.
Realistyczny widok z kokpitu statku kosmicznego pokazujący podróżnika kosmicznego w hełmie pilotującego statek z grafiką prędkości światła na zewnątrz i Ziemią w tle.
Kinowa panorama miasta z wysokimi wieżowcami oświetlonymi pod burzowym niebem ze światłem wolumetrycznym i mgłą, przedstawiona w neonowej palecie kolorów.
Biały robot mecha w szczegółowej zbroi z świecącymi oczami, noszący płynącą czarną pelerynę, stojący na zewnątrz w jasnym świetle słonecznym z rozmytym naturalnym tłem.

Obrazy z kobieta

Obraz impresjonistyczny przedstawiający kobietę w dżinsach i koszuli w kratę zbierającą jabłka z drzewa pod miękkim, pochmurnym światłem
Czarno-białe zdjęcie kobiety w formalnym stroju i kapeluszu z szerokim rondem stojącej na pływającej lodowej platformie obok nowoczesnego krzesła, odbijającej się w spokojnej wodzie pod pochmurnym niebem.
Kobieta cyborg stojąca w alejce dystopijnego miasta oświetlonej neonami w nocy, z świecącymi czerwonymi oczami, ubrana w biologiczno-mechaniczny refleksyjny kombinezon, otoczona przez deszczową miejską ruinę i mokre neonowe refleksy.
Kobieta o ciemnych włosach z czerwoną opaską na głowie, ubrana w czerwoną i białą sukienkę mini w kratę i czarne buty motocyklowe, siedząca na betonowym murku nocą na tle teksturowanej miejskiej ściany z światłami miasta w tle.
Spokojna chińska kobieta z długimi czarnymi włosami ozdobionymi ozdobną biżuterią i tradycyjnym strojem, z zamkniętymi oczami, z mitycznym stworzeniem za nią.
Szczupła kobieta w czerwonej, długiej, dopasowanej sukni z rozcięciem i frędzlami, nosząca czarne rękawiczki i pończochy, futurystyczne okulary na głowie oraz opaskę z piór, na tle w stylu art deco w odcieniach niebieskiego.
Zbliżenie orzechowego oka kobiety ukazujące szczegółowe rzęsy, gładką teksturę skóry i delikatny makijaż.
Portret rudowłosej kobiety z uderzającymi niebieskimi oczami, piegami i długimi, falującymi włosami, ubranej w zieloną bluzkę.
Widok z tyłu na kobietę z włosami upiętymi w kok, ubraną w białą sukienkę z odkrytymi ramionami, stojącą refleksyjnie obok okna, przez które do przyciemnionego pokoju wpada ciepłe światło słoneczne.