Hiperrealistyczny portret starszej kobiety przypominającej Amelię Earhart, ubraną w modę lat 70., mrugającą do kamery, trzymającą biały kubek do kawy w przytulnym wnętrzu.
Młoda brunetka kibicka tańcząca w zielonej spódnicy i białej bluzce z czerwonym wykończeniem na boisku stadionu piłkarskiego, żywa atmosfera
Młoda brunetka kibicka tańcząca w żywym niebiesko-czerwonym stroju sportowym na stadionie piłkarskim z tłumem w tle
Cheerleaderka w czerwonej sportowej koszulce i białej plisowanej spódnicy tańczy na boisku piłkarskim, a w tle widać tłum na stadionie.
Realistyczny obraz młodej kobiety z długimi włosami, ubranej w białą minispódniczkę i jasnoniebieską bluzkę, stojącej na kręgielni z kulami do kręgli po boku.

Zalecane negatywne podpowiedzi

strabismus

Zalecane parametry

samplers

DPM++ 2M SDE Heun Exponential

steps

42

cfg

7

resolution

720x1280, 1024x1024

vae

included VAE

Wskazówki

Jeśli generowanie obrazu nie daje rezultatu, spróbuj przełączyć na CLIP SKIP 2 lub lekko zmodyfikować prompt przez zmianę kolejności lub słów.

Używanie promptów w formie zdań zwykle poprawia jakość obrazu bardziej niż lista tagów.

Pozostawienie pola negatywnego promptu pustego często daje lepsze rezultaty obrazu.

Sprawdź specyfikację gridu, aby dobrać optymalne ustawienia przed użyciem.

Eksperymentuj z kilkoma konkretnymi negatywnymi promptami jak 'strabismus', aby rozwiązać problemy takie jak asymetryczne oczy czy pikselizacja.

Najważniejsze informacje o wersji

v1.3

  • Aby zilustrować jakość związaną z losowością modelu, ustandaryzowałem wartość seed na '9' dla wszystkich obrazów pokazowych przeznaczonych do próbkowania, i natychmiast je wygenerowałem.

  • Szczególnie w tej wersji, ze względu na duży wpływ negatywnych promptów, pozostawienie pola negatywnego promptu puste prawdopodobnie da najlepszą jakość.

Specyfikacja gridu(438,7 MB): pobierz

  • Jak widać, wraz ze wzrostem liczby kroków (Steps), model staje się dostępny dla wszystkich samplerów, a jakość także się poprawia.

  • Ze względu na działanie LoRA, którą opracowałem i scaliłem, jak opisano poniżej, używanie promptów w formie zdaniowej zamiast listy tagów bezpośrednio wiąże się z poprawą jakości.

  • Scaliłem 45 checkpointów i 7 LoRA. Następnie scalono AlbedoBase v0.4 i v0.3 w kolejności, w zakresie poniżej 0~5%, aby przywrócić rozcieńczone, przestarzałe scalenia modeli.

  • Wśród 7 LoRA, jeden jest stworzony przeze mnie. Polega na analizie i anotacji opisów 174 wysokiej jakości zdjęć obrazowych za pomocą GPT4-V. Scalenie tego LoRA skutkowało zadziwiająco czystymi obrazami oraz niezwykle dobrą interpretacją promptów.

  • Moje własnoręcznie stworzone LoRA są wyłącznie dostępne na zakup dla moich wspierających na poziomie Creative lub wyższym na Ko-fi. Planuję w przyszłości wydawać coraz więcej aktualizacji. Ceny wahają się od 10 do 50 dolarów.

Sponsorzy twórcy

Jeśli model okazał się dla Ciebie wartościowy, rozważ proszę wsparcie. Twoja wpłata zostanie w całości przeznaczona na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 zakup ㅤ|ㅤ 🌱 dotacja


Jeśli model okazał się dla Ciebie wartościowy, rozważ proszę wsparcie. Twoja wpłata zostanie w całości przeznaczona na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord)|ㅤ 🛒 zakupㅤ |ㅤ 🌱 dotacja


AlbedoBase XL (SFW&NSFW)

Refiner nie jest potrzebny, a VAE jest dołączone.


CEL

Stable Diffusion XL posiada 3,5 miliarda parametrów (bez Refiner), co stanowi około 3,6 raza więcej niż wersja SD v1.5. Wierzę, że to nie tylko liczba, ale liczba, która może prowadzić do znaczącej poprawy wydajności.

Minęło już trochę czasu, odkąd zauważyliśmy, że ogólna wydajność SD v1.5 poprawiła się ponad wyobrażenia dzięki ogromnym wkładom naszej społeczności. Dlatego pracuję nad ukończeniem tego modelu AlbedoBase XL, aby optymalnie odtworzyć poprawę wydajności, jaka nastąpiła w v1.5 także w tej wersji XL.

Moją intencją jest bezpośrednie testowanie wydajności wszystkich checkpointów i LoRA publicznie udostępnianych na Civitai oraz scalanie tylko tych zasobów, które po przejściu przez filtry uznam za optymalne. To przewyższy wydajność AI generujących obrazy, takich jak Midjourney.

Obecnie AlbedoBase XL v3.1 Large scalił około 200 wybranych checkpointów i 251 LoRA.


LOG

v3.1-Large

• Scalono ponad 50 wybranych najnowszych wersji modeli SDXL za pomocą rekursywnego skryptu zastosowanego w V3.

Specyfikacja gridu(370,7 MB): pobierz


v3-mini

Szczerze przepraszam za tak długie oczekiwanie.

Miałem do załatwienia sprawy osobiste, a podczas pracy nad nową wersją mierzyłem się także z problemami zdrowotnymi. Nawet pisząc to, wciąż się z nimi zmagam.

Poczułem, że krótka aktualizacja nie wystarczy, dlatego proszę o wyrozumiałość i dzielę się tą bardziej szczegółową wiadomością.

Od wydania wersji 2.0 poświęcam się samodzielnej nauce głębokiego uczenia. Nie posiadam formalnego wykształcenia, a oprócz skromnych umiejętności programowania moim zapleczem są sztuki plastyczne. W efekcie brakuje mi matematycznych i naukowych podstaw do osiągnięcia przełomów, biorąc pod uwagę włożony czas i wysiłek. Mimo to doświadczenie samodzielnego zgłębiania i badania tych zagadnień jest dla mnie bezcenne.

Ostatnio natrafiłem na pomysł, który może być dużym przełomem. Po przebudowaniu setek formuł i metod od wersji 2.0 udało mi się opracować dość intrygujący i skuteczny algorytm. Proces scalania modelu oparto na SDXL1.0 i SD1.5 oraz innych starannie dobranych modelach. Podzielono je na pięć głównych kategorii: „ANIME,” „REALIZM,” „ARTYSTYCZNE,” „NSFW” i „BASE,” które zostały użyte jako bazy danych w algorytmie scalającym. To podejście przyniosło fascynujące efekty.

Jednak, choć rozwój algorytmu był wyzwaniem, to żaden etap nie był tak trudny jak testowanie wydajności. Moje zdrowie fizyczne i psychiczne znacznie się pogorszyło, aż doszedłem do wniosku, że nie dam rady kontynuować tego samodzielnie. To właśnie ostatecznie zadecydowało o wydaniu tej wersji.

Z radością ogłaszam premierę długo wyczekiwanej wersji AlbedoBaseXL V3 Mini. Choć model ten jest mniejszą skalą scalania, nie jest ograniczony do żadnej dziedziny i radzi sobie znakomicie w różnych obszarach. Ma potencjał, by służyć jako nowy model bazowy dla SDXL1.0. (Dla informacji, mój algorytm scalający nie jest „scalaniem liniowym,” dlatego można go zasadniczo traktować jako nowy, precyzyjnie dostrojony model.)

Ten model, wraz z istniejącymi modelami AlbedoBase, jest wszechstronny i przewyższa wszystkie poprzednie wersje pod każdym względem. (Treści NSFW, choć niezbyt ekstremalne, oferują szerszy zakres wyrazu w porównaniu do wcześniejszych wersji, np. v2.1. Dedykowany model NSFW do scalania będzie wydany w przyszłości.)

Zauważyłem też, że wiele udostępnianych modeli zaczęło ostatnio przyjmować licencje zabraniające scalania lub komercjalizacji zewnętrznej. To rozczarowanie, bo uniemożliwia mi używanie świetnych modeli do scalania.

Chciałbym wyrazić serdeczne podziękowania twórcom modeli, którzy udostępnili je na licencjach pozwalających na scalanie, umożliwiając korzystanie z wysokiej jakości modeli będących efektem dużego nakładu pracy i czasu.

Wkrótce wrócę.

Z niecierpliwością czekam na wasze testy wydajności w wielu dziedzinach, w tym ANIME, REALIZM, ARTYSTYCZNE, 2.5D, 3D i NSFW.

Jako twórcy modeli zasiewamy tylko nasiona. Ostatecznie to Wy, użytkownicy modeli i artyści, uprawiacie je i przynosicie owoce.

Dziękuję jak zawsze.


Dla tych, którzy chcą wesprzeć moją pracę małą kwotą, proszę o rozważenie użycia poniższych linków. Obecnie nie mogę znaleźć zatrudnienia i stoję przed niepewną przyszłością finansową.

🌱 dotacja

Specyfikacja gridu(380,5 MB): pobierz


v2.1
Ponowne scalanie i dostosowanie v0.1 do 2.0 z użyciem nowego algorytmu scalania i formuły.

Specyfikacja gridu(424,5 MB): pobierz

v2.0

Chciałbym podziękować wszystkim, którzy pomogli mi przy AlbedoBase XL Pre. Bez Was data premiery prawdopodobnie byłaby dużo późniejsza. Wielkie dzięki!

  • Napisałem własny skrypt do scalenia istniejących modeli AlbedoBase XL w jeden, precyzyjnie dostosowując wagi wierszy i kolumn wszystkich bloków U-NET i CLIP zgodnie z moją unikalną formułą.

  • Jeśli generowanie obrazu nie działa (nic się nie tworzy), przełącz się na CLIP SKIP 2 albo lekko zmodyfikuj prompt! Mogą istnieć kombinacje promptów, których CLIP nie rozpoznaje. W takim wypadku zmień kolejność słów, użyj innych słów lub - najprościej - zmień CLIP SKIP. Stopniowo będę pracował nad rozwiązaniem tych problemów, podobnie jak w v1.3.

Specyfikacja gridu(403,5 MB): pobierz

v1.3

  • Aby zilustrować jakość związaną z losowością modelu, ustandaryzowałem wartość seed na '9' dla wszystkich obrazów pokazowych przeznaczonych do próbkowania, i natychmiast je wygenerowałem.

  • Szczególnie w tej wersji, ze względu na duży wpływ negatywnych promptów, pozostawienie pola negatywnego promptu puste prawdopodobnie da najlepszą jakość.

Specyfikacja gridu(438,7 MB): pobierz

  • Jak widać, wraz ze wzrostem liczby kroków (Steps), model staje się dostępny dla wszystkich samplerów, a jakość także się poprawia.

  • Ze względu na działanie LoRA, którą opracowałem i scaliłem, jak opisano poniżej, używanie promptów w formie zdaniowej zamiast listy tagów bezpośrednio wiąże się z poprawą jakości.

  • Scaliłem 45 checkpointów i 7 LoRA. Następnie scalono AlbedoBase v0.4 i v0.3 w kolejności, w zakresie poniżej 0~5%, aby przywrócić rozcieńczone, przestarzałe scalenia modeli.

  • Wśród 7 LoRA, jeden jest stworzony przeze mnie. Polega na analizie i anotacji opisów 174 wysokiej jakości zdjęć obrazowych za pomocą GPT4-V. Scalenie tego LoRA skutkowało zadziwiająco czystymi obrazami oraz niezwykle dobrą interpretacją promptów.

  • Moje własnoręcznie stworzone LoRA są wyłącznie dostępne na zakup dla moich wspierających na poziomie Creative lub wyższym na Ko-fi. Planuję w przyszłości wydawać coraz więcej aktualizacji. Ceny wahają się od 10 do 50 dolarów.


v1.2

  • Scalono 22 najnowsze checkpointy.

Specyfikacja gridu(565,6 MB): pobierz

v1.1

  • Ustabilizowano.

  • Bardziej szczegółowe.

  • Jeśli uważasz się za zaawansowanego użytkownika, polecam wersję 1.0. Po znalezieniu odpowiednich ustawień, wersja 1.0 może generować o wiele bardziej żywe dzieła.

Specyfikacja gridu(349,7 MB): pobierz

v1.0

  • Scalono 106 LoRA.

  • Scalono 19 checkpointów.

  1. Model może produkować różne wyniki w zależności od wybranych ustawień, dlatego ważne jest, aby sprawdzić specyfikację gridu przed użyciem.

    • Odkryłem, że użycie kilku konkretnych negatywnych promptów może pomóc rozwiązać problem asymetrycznych oczu lub pikselizacji. Specyfikacja Grid może się różnić w zależności od CPU lub GPU, więc proszę traktować ją ogólnie. Eksperymentuj z kilkoma negatywnymi promptami, aby poprawić jakość (np. zeza). Uważam, że trudno zadowolić wszystkie ustawienia równocześnie wraz ze wzrostem liczby scalonych LoRA. Niemniej jednak, chciałbym abyś skupił się na tej zalecie wersji 1.0, która potrafi tworzyć niesamowite dzieła o wysokiej jakości, jeśli ustawienia są odpowiednie. Wrócę z bardziej stabilną wersją w przyszłości.

  2. Przydatne wartości ustawień znajdziesz w showcase lub poprzez wyszukiwanie przykładów innych.

  3. Jak zawsze, najlepiej pozostawić puste pole negatywnego promptu dla najlepszych rezultatów.

  4. Ta wersja 1.0 była dużą pracą, więc teraz robię przerwę. Mam nadzieję, że korzystanie z modelu sprawi Ci radość, a jeśli go scalisz, proszę podziel się nim na Civitai za darmo. Dzięki temu wszyscy będziemy mogli go dalej ulepszać.

Specyfikacja gridu(479,4 MB): pobierz

v0.4

  • Scalono 132 LoRA.

  • Scalono 4 checkpointy.

Specyfikacja gridu: pobierz

v0.3

  • Ulepszenia we wszystkich samplerach.

  • Osiągnięto realistyczny realizm.

  • Ustabilizowano.

Specyfikacja gridu: pobierz

v0.2

  • Znaczące ulepszenia ostrości i szczegółowości.

  • Poprawiona implementacja rąk i stóp.

  • Główne ulepszenia estetyczne; kompozycja, abstrakcja, płynność, światło i kolor itp.

v0.1

  • Po odpowiednim dostrojeniu modelu SDXL1.0, starannie i celowo scalono ponad 40 wysokiej jakości modeli publicznie dostępnych na Civitai.

  • Testy koncentrowały się głównie na zapewnieniu maksymalnej jakości przy minimalnej liczbie tokenów w promptach, nie potwierdzono jak bardzo jakość może się poprawić przy użyciu dużej liczby tokenów. (Proszę przeprowadzić własne testy i podzielić się wynikami)

  • Najpiękniejsze efekty zazwyczaj osiągane są na styku rzeczywistości i animacji.

  • Mimo to, przy odpowiednim promptcie, generalnie nie ma rzeczy, której nie potrafi wyrazić. (Uważam, że ma dużą wartość jako model bazowy przewyższający inne w scalaniu. Proszę jednak pamiętać, że to obecnie wersja v0.1)


Poprzedni
🥂🎆SDXL FaeTastic🎆🥂 - v24
Następny
Photo Factory - V1

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

SDXL 1.0

Wersja modelu

v1.3

Hash modelu

a40d817f46

Wytrenowane słowa

all in one
photo
2d
3d
anime
game
photorealistic
cinematic
design
base

Twórca

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa AlbedoBase XL - v1.3

Hiperrealistyczny portret starszej kobiety przypominającej Amelię Earhart, ubraną w modę lat 70., mrugającą do kamery, trzymającą biały kubek do kawy w przytulnym wnętrzu.
Młoda brunetka kibicka tańcząca w zielonej spódnicy i białej bluzce z czerwonym wykończeniem na boisku stadionu piłkarskiego, żywa atmosfera
Młoda brunetka kibicka tańcząca w żywym niebiesko-czerwonym stroju sportowym na stadionie piłkarskim z tłumem w tle
Cheerleaderka w czerwonej sportowej koszulce i białej plisowanej spódnicy tańczy na boisku piłkarskim, a w tle widać tłum na stadionie.
Realistyczny obraz młodej kobiety z długimi włosami, ubranej w białą minispódniczkę i jasnoniebieską bluzkę, stojącej na kręgielni z kulami do kręgli po boku.

Obrazy z 3d

Zbliżenie fotorealistycznego portretu stylowej hipsterskiej dziewczyny z ciemnym makijażem, wyraźną linią szczęki i kuszącym naszyjnikiem.
Realistyczny obraz 3D Tify Lockhart siedzącej z jedną nogą uniesioną, ubranej w biały stanik sportowy i czarne spodnie dresowe, pokazujący błyszczącą skórę i pot na prostym białym tle.
Bardzo szczegółowy żółw noszący jetpack, latający nad tętniącym życiem kanałem miejskim otoczonym kolorowymi budynkami pod niebieskim niebem.
Żywy żółty klasyczny samochód pędzący po mokrej miejskiej ulicy z dużą eksplozją w tle pod pochmurnym niebem.
Loona z Helluva Boss siedząca na fotelu gamingowym z dużymi smutnymi czerwonymi oczami, trzymająca płonący znak z napisem 'Need Buzz to generate more Loona' w pokoju do gier.
Kompaktowa futurystyczna sypialnia z metalicznym i industrialnym designem, z nieuporządkowanym łóżkiem obok dużego panoramicznego okna z widokiem na neonowo oświetloną panoramę cyberpunkowego miasta nocą.
Fotorealistyczny obraz stylowej kobiety w efektownej czerwonej sukience i okularach przeciwsłonecznych, stojącej pewnie w terminalu lotniska otoczonej przez wysoką, chaotyczną stertę kolorowych walizek na wózku bagażowym.
Realistyczna 3D dziewczyna ćma z czarno-białymi rozdwojonymi włosami, szerokimi czerwonymi oczami i wyrazem zdumienia z śliną, pochylona nad świecącą żarówką na drewnianym stole.
Trójwymiarowa wizualizacja średniowiecznej kobiecej kuszniczki z plecionymi brązowymi włosami, brązowymi oczami, ubranej w jasnobrązowe średniowieczne ubrania i skórzaną zbroję, trzymającej kuszę z poważnym, bocznym spojrzeniem.
3D grafika cyfrowa żółtego kota pirata z jasnoniebieskimi oczami, dużym granatowym kapeluszem pirackim ozdobionym emblematem czaszki, szczegółową granatową peleryną zapinaną na złote łańcuchy oraz brązowym płaszczem, stojącego pewnie na tle witrażu.

Obrazy z wszystko w jednym

Urocza anime zakonnica z zaplecionymi blond włosami, dużymi niebieskimi oczami i radosnym wyrazem twarzy. Ubrana jest w tradycyjny habit zakonny z czarnym welonem i białą opaską, trzymając ręce w modlitewnej pozie. Obraz wygenerowany przez AI przy użyciu Stable Diffusion.
Dziewczyna w stylu anime z długimi niebieskimi włosami spiętymi w kucyk, trzymająca miecz katana, stojąca pod kwitnącymi drzewami sakura. Stworzona przez AI za pomocą Stable Diffusion.
Dziewczyna anime z długimi niebiesko-szarymi włosami, ozdobnym strojem i szczegółowymi akcesoriami, obraz wygenerowany przez AI z użyciem Stable Diffusion.

Obrazy z anime

Szczegółowy cyfrowy portret dziewczyny z anime z blond włosami i uderzającymi niebieskimi oczami, oświetlony miękkim, marzycielskim światłem w stylu CGI.
Zbliżony portret Dio Brando z blond włosami i zieloną opaską, otoczony efektami rozbłysku pod jasnym błękitnym niebem.
Cyberpunkowy bar świecący fioletowymi neonami, pełen futurystycznych klientów w kaskach i cybernetycznym ekwipunku, z holograficznymi ekranami i zaawansowaną technicznie atmosferą.
Szczegółowa dziewczyna z anime o blond włosach, ubrana w białe i czerwone ubrania, idąca przez leśny strumień otoczony świecącymi pomarańczowymi meduzami o zmierzchu.
Portret elfki z długimi, białymi kucykami, niebieskimi oczami, spiczastymi uszami, w białym płaszczyku ze złotym wykończeniem i biżuterią na czarnym tle.
Elfka w stylu anime z długimi, srebrnymi dwoma kucykami i zielonymi oczami, stojąca na polu niebieskich kwiatów, ubrana w biały pelerynkę, pasiastą koszulę i czarne rajstopy.
Młoda kobieta anime z niebieskimi oczami i brązowymi włosami stoi przed tłem z kobaltowo-niebieskiej kwiatowej mozaiki w estetyce dreamscape.
Cyfrowa ilustracja w stylu anime przedstawiająca dużą, ostrą trójkątną kamienną piramidę na jałowej ziemi z rozrzuconymi skałami pod gwiaździstym niebem i planetą z pomarańczowymi pierścieniami.
Szczegółowa kobieta wojownik w stylu anime w czarnym skórzanym stroju, przyjmująca dynamiczną pozę z niebiesko-pomarańczowymi wirującymi efektami w tle.
Szczegółowy portret cyborga z długimi białymi włosami, niebieskimi oczami i skomplikowaną robotyczną zbroją stojącego w futurystycznym cyberpunkowym mieście nocą.

Obrazy z model bazowy

Fotorealistyczna scena postaci nieumarłych, w tym zombie i szkieletów, spacerujących przez upiorny cmentarz oświetlony świecącymi lampionami jack-o'-lantern pod ciemnym, złowrogim niebem.

Obrazy z fotorealistyczny

Sylwetka cybernetycznego człowieka ze skrzydłami i długimi, smukłymi nogami wypełniona fotorealistycznym kolażem mixed media miejskich krajobrazów i budynków pod kinowym oświetleniem.
Czarno-biały futurystyczny obraz z metalicznymi liniami rozciągającymi się od góry, z czerwonymi liśćmi ramującymi scenę oraz niebieskim pulsującym diamentem na środku.
Fotorealistyczny obraz robota pokojówki leżącej na leśnej ziemi z wplątanymi w jej włosy liśćmi i częściami robota, ubranej w białą suknię pokojówki.
Fantastyczna supermodelka o eterycznym pięknie w żywej, kolorowej awangardowej sukni, ozdobiona misterną biżuterią, na tle wirującego, jaskrawego, wielokolorowego tła.
Młoda kobieta baristka stojąca za rustykalnym ladą kawiarni, ubrana w czarną koszulę z guzikami i czarny fartuch, delikatnie się uśmiechając, z naturalnym makijażem i związanymi włosami.
Trzy kobiety w marynarskich swetrach i spodniach stoją razem na pokładzie luksusowego jachtu nocą z tłem karaibskiego oceanu.
Fotorealistyczna scena młodej japońskiej kobiety w płynącej, kolorowej sukience na ramiączkach, spacerującej leśną ścieżką otoczoną świecącymi, unoszącymi się meduzami, przy naturalnym oświetleniu.
Urocza dziewczyna siedząca wygodnie w przytulnej bibliotece, ucząca się przy świetle świec z ciepłym, nastrojowym oświetleniem i otwartą książką przed sobą.
Szczegółowa 2D wektorowa ilustracja kobiety ozdobionej kwiatami czarnej orchidei i misternymi wzorami kwiatowymi w stylu barokowym.
Zbliżenie młodego mężczyzny z krótkim blond brodawkowym zarostem i okularami, oświetlone połowicznie porannym słońcem, z pręgowanym kotem odpoczywającym na ramieniu.