Czarno-biała żyrafa stoi, kontemplując olbrzymi mniszek lekarski na zaśnieżonym wzgórzu pod wietrznym niebem rozsiewającym nasiona mniszka w monochromatycznych tonach.

Zalecane negatywne podpowiedzi

big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Zalecane parametry

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, DPM++ 2M beta, sgm_uniform, DDEIS, normal, simple, beta, dpmpp_3m_sde, dpmpp_3m_sde_gpu

steps

12 - 25

cfg

1.5 - 11

Wskazówki

Używaj DPM++ 2/3M SDE z samplerami Karras lub Exponential i ponad 25 kroków oraz CFG około 5-7, aby uzyskać najlepsze wyniki z SDXL.

Wypróbuj DPM++ SDE Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) dla alternatywnych stylów.

Samplery Euler Ancestral / Normal dają mniej szczegółowe wyniki, które mogą być pożądane przy modelu Fv6 w celu redukcji szumu.

Domyślne CLIP Skip to 2, ale wypróbowanie 1 może zwiększyć dopasowanie do promptu, a 3-4 ulepszyć skupienie na konceptach.

Dla modeli Flux preferowane są samplery takie jak DPM++ 2M beta lub sgm_uniform.

Ustawienia CFG mają ogromny wpływ na jakość obrazów; niższe CFG (1.5-2.5) zapobiega efektowi plastikowej skóry na zdjęciach, podczas gdy dla stylów ilustracji może być wymagane wyższe CFG (3-6+).

Niewłaściwe ustawienia CFG lub liczby kroków często powodują rozmyte lub zdeformowane obrazy, konieczne mogą być dostosowania zależnie od stylu.

Najważniejsze informacje o wersji

Oparty na Fv4 z połączeniem wcześniejszych wersji moich modeli oraz BigLove_XL2, aby dalej posunąć realizm.

W efekcie Fv5 jest moją najbardziej fotorealistyczną wersją do tej pory, z bardziej precyzyjnymi i subtelnymi obrazami w porównaniu do F4, ale wraz z rosnącym realizmem model jest coraz mniej zdolny do tworzenia stylizowanych obrazów, zwłaszcza ilustracji: niedługo pojawi się nowa wersja serii G do takich zastosowań :)

Co do ustawień, DPM++ 2/3M SDE / Karras lub Exponential zawsze są dobrym wyborem przy 25+ krokach i CFG około 5-7. Ale DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) jest warte spróbowania. Domyślne CLIP SKIP o wartości 2 jest również dobrym wyborem, ale warto próbować też 1 lub 3-4.

Sponsorzy twórcy

Jeśli podobają Ci się moje wkłady w tę społeczność, śmiało kup mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę stworzyć 😅

Jeśli podobają Ci się moje wkłady w tę społeczność, śmiało kup mi kawę: im więcej kofeiny wypiję, tym więcej modeli mogę stworzyć 😅

Galeria porównawcza tutaj: Fv6-Fv5 oraz porównanie ilustracji NSFW między Gv1-Cv6-Fv2.

Aktualny model SOTA w moim eksperymencie:

  • Model bazowy SDXL: Gv4 to najbardziej zbalansowany model pozwalający na realistyczne i stylizowane obrazy NSFW i SFW. Lepsza estetyka niż Fv6, ale mniej fotorealistyczny.

  • Model fotorealistyczny SDXL (SFW i NSFW): Fv6 to wybór dla hiperrealizmu, w tym realistycznych obrazów NSFW, ale brakuje mu w dużej mierze możliwości stylizacji Gv4.

  • Ilustracja SDXL: Gv4 (SFW i NSFW). Cv6 jednak nadal warto wypróbować, jeśli nie interesują Cię obrazy NSFW.

  • Model Flux: Flux1-A1

Ustawienia generowania obrazów dla modeli SDXL

DPM++ 2/3M SDE / Karras lub Exponential są zawsze dobrym wyborem przy 25+ krokach i CFG około 5-7. Ale DPM++ SDE / Karras z mniejszą liczbą kroków (np. 12) i wyższym CFG (8-11) jest warte wypróbowania, podobnie jak Euler Ancestral / Normal dla mniej szczegółowego wyniku, co może być interesujące w przypadku modelu Fv6, by uzyskać coś mniej „szumnego”.

Domyślny CLIP Skip o wartości 2 jest także dobrym wyborem, ale warto wypróbować 1 lub 3-4: 1 zwiększa dopasowanie do promptu, a 3-4 czasem dają lepszy efekt niż domyślny, skupiając się bardziej na „koncepcjach”.

Ustawienia generowania obrazów dla modeli Flux

Moje preferowane ustawienia to DPM++ 2M / beta lub sgm_uniform lub DDEIS / normal jako sampler / scheduler, gdzie beta daje bardziej wyrazisty i mocniejszy obraz. Dla bardziej subtelnego obrazu Euler / simple lub beta wydają się dobrym wyborem.

CFG ma ogromny wpływ na ostateczny obraz i jest bardzo czułe nawet na drobne zmiany.

  • Dla zdjęć CFG powinno pozostać niskie (1.5-2.5), by uniknąć efektu plastikowej skóry.

  • Dla dzieł sztuki i ilustracji jest to bardziej skomplikowane, bo zależy od medium. Dla „szorstkich” stylów (malarstwo, akwarele itp.) CFG powinno być dość niskie w zakresie 1.5-2.5, ale dla stylu anime lub komiksowego często trzeba je podnieść, by osiągnąć pożądany efekt (3-6 lub więcej).

Jeśli obraz jest niechlujny / zdeformowany lub rozmazany, często wynika to z niewłaściwego CFG/liczby kroków, ale nie zawsze łatwo określić, czy CFG/kroki należy zwiększyć czy zmniejszyć (przynajmniej dla mnie 😊).

Na pewno jest dużo do poznania odnośnie zachowania Flux, które jest dość inne niż SDXL i musimy się dostosować.

Workflow

Wszystkie moje obrazy są przesyłane z osadzonym workflow ComfyUI, który niestety jest niekompatybilny z przetwarzaniem CivitAI i najczęściej nie można odzyskać promptu. Możesz jednak pobrać oryginalny obraz PNG z dołączonym workflow, klikając ikonę „DOWNLOAD” w przeglądarce obrazów.

Dlaczego staram się publikować głównie obrazy prosto z mojego modelu z ewentualnym dodatkiem Lory (mojej lub wzmacniacza detali), czasem używam także Controlnet, aby łatwiej uzyskać lepsze, bardziej szczegółowe kompozycje: w tym przypadku obraz źródłowy oczywiście nie jest we workflow, ale przypuszczam, że nadal możesz użyć opublikowanego przeze mnie obrazu jako źródła, jeśli chcesz zrobić wariację :)

Przeszłość


Począwszy od serii E, modele ewoluują czasem poprzez łączenie się z innymi modelami (dzięki innym współtwórcom!), ale przede wszystkim przez trening na moim własnym zbiorze danych: skromny zbiór (~2000 obrazów obecnie), staram się jednak jakością i oryginalnością to jakoś zrekompensować.

Od Fv1 włączyłem wiele syntetycznych obrazów stworzonych za pomocą wcześniejszych wersji: mocno operując na promptach i retuszując w Photoshopie, gdy było to potrzebne, by mieć zbiór z wieloma oryginalnymi obrazami.


Główną ideą tego modelu było stworzenie wszechstronnego narzędzia przez połączenie najlepszych istniejących modeli odpowiadających mojemu gustowi (fotografia i fantastyka artystyczna, by to uprościć). Moje główne cele to:

  1. Fotorealizm: Zdolność do tworzenia oszałamiająco realistycznych obrazów zarówno postaci, jak i obiektów/natury.

  2. Elastyczność: Zdolność do tworzenia wysoce stylizowanych obrazów, umożliwiając wyraz artystyczny przez różne style i kombinacje artystów. Pochodzę z starszego pokolenia i Europy, więc „styl” nie oznacza dla mnie „japońskie kawaii anime z biustem” czy „DC Comics z mnóstwem superbohaterów i bujnymi blondynkami”, lecz bardziej świat Franka Frazetty, Milo Manary, Borisa Vallejo, H.R. Gigera, Wojtka Siudmaka i takich mistrzów sztuki fantastycznej: na pewno są tam piersi, ale styl jest nieco inny :P

  3. Ponieważ nie lubię być ograniczany w eksploracji ludzkiego ciała, zamysł to również mieć całkiem zdolny model NSFW. Jednak ze względu na charakter dostępnych obrazów treningowych w zestawach danych, NSFW często ma silne uprzedzenie ku zdjęciom pornograficznym lub japońskiej pornograficznej anime i wpływa to na elastyczność (zazwyczaj gdy używasz słowa „sexy” w prompt, musisz uwzględnić styl). Ten punkt NIE jest więc priorytetem dla modelu bazowego, lecz jest rozwijany w modelu NSFW.

Poprzedni
ICBINP XL - v4
Następny
MonsterCoffeeBang! Mix - v1.1 No VAE

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

SDXL 1.0

Wersja modelu

Fv5

Hash modelu

17b3e65f07

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa Eksperyment Araminta (SDXL+Flux) - Fv5

Czarno-biała żyrafa stoi, kontemplując olbrzymi mniszek lekarski na zaśnieżonym wzgórzu pod wietrznym niebem rozsiewającym nasiona mniszka w monochromatycznych tonach.

Obrazy z model bazowy

Fotorealistyczna scena postaci nieumarłych, w tym zombie i szkieletów, spacerujących przez upiorny cmentarz oświetlony świecącymi lampionami jack-o'-lantern pod ciemnym, złowrogim niebem.

Obrazy z nsfw

Elegancka młoda kobieta ubrana w żywy czerwony kombinezon z czarnym kołnierzem, siedząca elegancko na czerwonym tapicerowanym drewnianym fotelu, z prostymi ciemnymi włosami i szczegółową twarzą.
Widok z profilu cyberpunkowej wojowniczki z długimi, różowymi, zaplecionymi włosami, tatuażami na ramieniu, ubraną w turkusową zbroję na tors i trzymającą katanę na tle neonowo oświetlonego przemysłowego krajobrazu.
Ilustracja w stylu anime przedstawiająca dziewczynę o blond włosach i niebieskich oczach, ubraną w czerwone bikini, pozującą pewnie na plaży z kroplami wody na skórze i falami w tle.
Szczegółowy cyfrowy obraz walecznej kobiety wojownika z długimi czerwonymi włosami, kucającej na kamiennym piedestale na cmentarzu, trzymającej miecz na plecach. Ma na sobie ciemną zbroję i turkusowy płaszcz, oświetlony mistycznymi błyskawicami na nocnym niebie.
Młoda kobieta w słomkowym kapeluszu i sukience stoi z rowerem na wiejskiej ścieżce otoczonej dzikimi kwiatami, obserwując zachód słońca nad wioską i pagórkami.
Portret z bliska wojowniczej księżniczki Wikingów z białym mohawkiem, niebieskimi oczami, misterną biżuterią, futrzanym ubraniem i tatuażami, na tle nocnego nieba z mgławicą i gwiazdami.
Steampunkowa kobieta z zaplecionymi włosami i goglami na głowie, z przezroczystym mechanicznym tułowiem zegarowym z widocznymi zębatkami i tłokami, pozuje pewnie na tle mechanicznego miasta.
Zbliżenie na drobną kobietę w okularach przeciwsłonecznych i skórzanej kurtce, oświetloną neonami w futurystycznym nocnym mieście w stylu retro synthwave z lat 80.
Cyberpunkowa kobieta cyborg z czerwonymi rogami oni i czarnymi włosami, nosząca czarną maskę i mechaniczne niebieskie ramiona, trzymająca świecący niebieski miecz katana w ciemnym futurystycznym korytarzu.
Cyberpunkowa dziewczyna o krótkich czarnych włosach, ubrana w żółty top i czarne spodnie z wysokim stanem, trzymająca futurystyczną broń, stojąca przed dużym mecha czołgiem i przemysłowym tłem.

Obrazy z fotorealistyczny

Photorealistic portrait of a blonde woman with curly hair and makeup, wearing a rust-colored dress and white jacket, standing against a wooden wall in an urban environment.
Photorealistic young woman with brown hair and short asymmetrical bangs wearing a medieval-style dress, holding a basket full of apples in an outdoor setting.
Photorealistic portrait of a young woman with short dark hair, detailed facial features, and natural outdoor lighting.
Photorealistic portrait of Casca wearing detailed medieval breastplate and shoulder armor with a red cape, standing in a castle courtyard.
Portret młodej wojowniczki Casci w wypolerowanym napierśniku i naramiennikach, brązowych rękawiczkach, wysokich butach oraz czerwonej pelerynie, siedzącej w ciepło oświetlonym, drewnianym pokoju.
Hiperrealistyczny android w półpostaci z pękniętą białą twarzą pokrytą mchem i dzikimi kwiatami, ustawiony w bujnym lesie z zardzewiałymi metalowymi częściami i świecącymi zielonymi oczami.
Futurystyczny karaibski kurort nadmorski z świecącymi, unoszącymi się willami i genetycznie ulepszonymi palmami pod podwójnym słońcem na spokojnym nocnym niebie, z bioluminescencyjnymi ścieżkami i dronami.
Zdeformowana obca istota z dużymi oczami stoi na tle ciemnego, upiornego tła, oświetlona niepokojącym i kinowym światłem.
Fotorealistyczny obraz kobiecej modelki modowej z krótkimi włosami w żółtej kurtce, białym topie, czarnej spódnicy, pomarańczowych legginsach i białych szpilkach, stojącej w pomieszczeniu.
Fotorealistyczny portret modnej kobiety z kręconymi blond włosami, ubraną w żywe tkaniny i misterną biżuterię, na tle ozdobnego gobelinu.

Obrazy z realistyczny

Photorealistic portrait of a blonde woman with curly hair and makeup, wearing a rust-colored dress and white jacket, standing against a wooden wall in an urban environment.
Photorealistic young woman with brown hair and short asymmetrical bangs wearing a medieval-style dress, holding a basket full of apples in an outdoor setting.
Photorealistic portrait of a young woman with short dark hair, detailed facial features, and natural outdoor lighting.
Photorealistic portrait of Casca wearing detailed medieval breastplate and shoulder armor with a red cape, standing in a castle courtyard.
Portret młodej wojowniczki Casci w wypolerowanym napierśniku i naramiennikach, brązowych rękawiczkach, wysokich butach oraz czerwonej pelerynie, siedzącej w ciepło oświetlonym, drewnianym pokoju.
Hiperrealistyczny android w półpostaci z pękniętą białą twarzą pokrytą mchem i dzikimi kwiatami, ustawiony w bujnym lesie z zardzewiałymi metalowymi częściami i świecącymi zielonymi oczami.
Futurystyczny karaibski kurort nadmorski z świecącymi, unoszącymi się willami i genetycznie ulepszonymi palmami pod podwójnym słońcem na spokojnym nocnym niebie, z bioluminescencyjnymi ścieżkami i dronami.
Realistyczny portret dziewczyny z długimi brązowymi włosami i brązowymi oczami, noszącej różowe kolczyki w kształcie serca oraz czarny choker z zawieszkami serc, z wystawionym językiem i kroplą śliny, na czarnym tle
Fotorealistyczny portret modnej kobiety z kręconymi blond włosami, ubraną w żywe tkaniny i misterną biżuterię, na tle ozdobnego gobelinu.

Obrazy z kobieta

Elfka ze srebrnymi włosami w futurystycznej zbroi stoi na tle wirującego, kolorowego nieba z chmurami, ukazana w żywym cyberpunkowym stylu obrazu olejnego.
Animowany portret Lois Lane w fioletowej marynarce i czarnej spódnicy, stojącej na miejskiej ulicy z drapaczami chmur w tle, trzymającej fioletową torebkę i uśmiechającej się.
Portret całej postaci kobiety z piegami i długimi rudymi włosami w żywej, wielokolorowej, płynącej sukni w odcieniach pomarańczowego, fioletu i niebieskiego.
Kobieta trzymająca zapaloną świecę na całkowicie czarnym, ciemnym tle, oświetlająca połowę jej twarzy ciepłym światłem świecy.
Portret kobiety o platynowo blond włosach i fioletowych oczach, ubranej w czarny crop top z odsłoniętymi ramionami, stojącej na tle żółtawo-brązowej, teksturowanej ściany, z tatuażem na górnej części ramienia i umięśnioną sylwetką.
3D renderowana umięśniona kobieta z piegami i czarnymi włosami w błyszczącym kombinezonie, pozująca na prostym czerwonym tle z kinowym oświetleniem i stylem atompunk.
Zbliżenie portretu kobiety o zielonych oczach leżącej na łóżku, oświetlonej ciepłym światłem złotej godziny wewnątrz.
Zbliżony portret kobiety ze średnio nieuczesanymi włosami i ciepłym światłem na ustach, oprawiony przez vintage okno z częściowym cieniem i odbiciem Wieży Eiffla.
Kobieta w stylu anime z zielonymi wężowymi włosami siedząca na niebieskim krześle biurowym przy biurku, ubrana w strój biznesowy i czarne szpilki.
Kobieta przypominająca Meduzę z zielonymi wężami zamiast włosów, w okularach i czerwonej sukience, machająca do widza z dużymi zielonymi oczami.