modele/AlbedoBase XL - v1.3

AlbedoBase XL - v1.3

Zofia Nowak

7/22/2025

1:32:04 PM

| Discussion|

Powiązane słowa kluczowe i tagi

Hiperrealistyczny portret starszej kobiety przypominającej Amelię Earhart, ubraną w modę lat 70., mrugającą do kamery, trzymającą biały kubek do kawy w przytulnym wnętrzu.

Młoda brunetka kibicka tańcząca w zielonej spódnicy i białej bluzce z czerwonym wykończeniem na boisku stadionu piłkarskiego, żywa atmosfera

Młoda brunetka kibicka tańcząca w żywym niebiesko-czerwonym stroju sportowym na stadionie piłkarskim z tłumem w tle

Cheerleaderka w czerwonej sportowej koszulce i białej plisowanej spódnicy tańczy na boisku piłkarskim, a w tle widać tłum na stadionie.

Realistyczny obraz młodej kobiety z długimi włosami, ubranej w białą minispódniczkę i jasnoniebieską bluzkę, stojącej na kręgielni z kulami do kręgli po boku.

Zalecane negatywne podpowiedzi

strabismus

Zalecane parametry

samplers

DPM++ 2M SDE Heun Exponential

steps

cfg

resolution

720x1280, 1024x1024

vae

included VAE

Wskazówki

Jeśli generowanie obrazu nie daje rezultatu, spróbuj przełączyć na CLIP SKIP 2 lub lekko zmodyfikować prompt przez zmianę kolejności lub słów.

Używanie promptów w formie zdań zwykle poprawia jakość obrazu bardziej niż lista tagów.

Pozostawienie pola negatywnego promptu pustego często daje lepsze rezultaty obrazu.

Sprawdź specyfikację gridu, aby dobrać optymalne ustawienia przed użyciem.

Eksperymentuj z kilkoma konkretnymi negatywnymi promptami jak 'strabismus', aby rozwiązać problemy takie jak asymetryczne oczy czy pikselizacja.

Najważniejsze informacje o wersji

v1.3

Aby zilustrować jakość związaną z losowością modelu, ustandaryzowałem wartość seed na '9' dla wszystkich obrazów pokazowych przeznaczonych do próbkowania, i natychmiast je wygenerowałem.
Szczególnie w tej wersji, ze względu na duży wpływ negatywnych promptów, pozostawienie pola negatywnego promptu puste prawdopodobnie da najlepszą jakość.

Specyfikacja gridu(438,7 MB): pobierz

Jak widać, wraz ze wzrostem liczby kroków (Steps), model staje się dostępny dla wszystkich samplerów, a jakość także się poprawia.
Ze względu na działanie LoRA, którą opracowałem i scaliłem, jak opisano poniżej, używanie promptów w formie zdaniowej zamiast listy tagów bezpośrednio wiąże się z poprawą jakości.

Scaliłem 45 checkpointów i 7 LoRA. Następnie scalono AlbedoBase v0.4 i v0.3 w kolejności, w zakresie poniżej 0~5%, aby przywrócić rozcieńczone, przestarzałe scalenia modeli.
Wśród 7 LoRA, jeden jest stworzony przeze mnie. Polega na analizie i anotacji opisów 174 wysokiej jakości zdjęć obrazowych za pomocą GPT4-V. Scalenie tego LoRA skutkowało zadziwiająco czystymi obrazami oraz niezwykle dobrą interpretacją promptów.

Moje własnoręcznie stworzone LoRA są wyłącznie dostępne na zakup dla moich wspierających na poziomie Creative lub wyższym na Ko-fi. Planuję w przyszłości wydawać coraz więcej aktualizacji. Ceny wahają się od 10 do 50 dolarów.

Sponsorzy twórcy

Jeśli model okazał się dla Ciebie wartościowy, rozważ proszę wsparcie. Twoja wpłata zostanie w całości przeznaczona na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 zakup ㅤ|ㅤ 🌱 dotacja

Jeśli model okazał się dla Ciebie wartościowy, rozważ proszę wsparcie. Twoja wpłata zostanie w całości przeznaczona na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 zakupㅤ |ㅤ 🌱 dotacja

AlbedoBase XL (SFW&NSFW)

Refiner nie jest potrzebny, a VAE jest dołączone.

CEL

Stable Diffusion XL posiada 3,5 miliarda parametrów (bez Refiner), co stanowi około 3,6 raza więcej niż wersja SD v1.5. Wierzę, że to nie tylko liczba, ale liczba, która może prowadzić do znaczącej poprawy wydajności.

Minęło już trochę czasu, odkąd zauważyliśmy, że ogólna wydajność SD v1.5 poprawiła się ponad wyobrażenia dzięki ogromnym wkładom naszej społeczności. Dlatego pracuję nad ukończeniem tego modelu AlbedoBase XL, aby optymalnie odtworzyć poprawę wydajności, jaka nastąpiła w v1.5 także w tej wersji XL.

Moją intencją jest bezpośrednie testowanie wydajności wszystkich checkpointów i LoRA publicznie udostępnianych na Civitai oraz scalanie tylko tych zasobów, które po przejściu przez filtry uznam za optymalne. To przewyższy wydajność AI generujących obrazy, takich jak Midjourney.

Obecnie AlbedoBase XL v3.1 Large scalił około 200 wybranych checkpointów i 251 LoRA.

LOG

v3.1-Large

• Scalono ponad 50 wybranych najnowszych wersji modeli SDXL za pomocą rekursywnego skryptu zastosowanego w V3.

Specyfikacja gridu(370,7 MB): pobierz

v3-mini

Szczerze przepraszam za tak długie oczekiwanie.

Miałem do załatwienia sprawy osobiste, a podczas pracy nad nową wersją mierzyłem się także z problemami zdrowotnymi. Nawet pisząc to, wciąż się z nimi zmagam.

Poczułem, że krótka aktualizacja nie wystarczy, dlatego proszę o wyrozumiałość i dzielę się tą bardziej szczegółową wiadomością.

Od wydania wersji 2.0 poświęcam się samodzielnej nauce głębokiego uczenia. Nie posiadam formalnego wykształcenia, a oprócz skromnych umiejętności programowania moim zapleczem są sztuki plastyczne. W efekcie brakuje mi matematycznych i naukowych podstaw do osiągnięcia przełomów, biorąc pod uwagę włożony czas i wysiłek. Mimo to doświadczenie samodzielnego zgłębiania i badania tych zagadnień jest dla mnie bezcenne.

Ostatnio natrafiłem na pomysł, który może być dużym przełomem. Po przebudowaniu setek formuł i metod od wersji 2.0 udało mi się opracować dość intrygujący i skuteczny algorytm. Proces scalania modelu oparto na SDXL1.0 i SD1.5 oraz innych starannie dobranych modelach. Podzielono je na pięć głównych kategorii: „ANIME,” „REALIZM,” „ARTYSTYCZNE,” „NSFW” i „BASE,” które zostały użyte jako bazy danych w algorytmie scalającym. To podejście przyniosło fascynujące efekty.

Jednak, choć rozwój algorytmu był wyzwaniem, to żaden etap nie był tak trudny jak testowanie wydajności. Moje zdrowie fizyczne i psychiczne znacznie się pogorszyło, aż doszedłem do wniosku, że nie dam rady kontynuować tego samodzielnie. To właśnie ostatecznie zadecydowało o wydaniu tej wersji.

Z radością ogłaszam premierę długo wyczekiwanej wersji AlbedoBaseXL V3 Mini. Choć model ten jest mniejszą skalą scalania, nie jest ograniczony do żadnej dziedziny i radzi sobie znakomicie w różnych obszarach. Ma potencjał, by służyć jako nowy model bazowy dla SDXL1.0. (Dla informacji, mój algorytm scalający nie jest „scalaniem liniowym,” dlatego można go zasadniczo traktować jako nowy, precyzyjnie dostrojony model.)

Ten model, wraz z istniejącymi modelami AlbedoBase, jest wszechstronny i przewyższa wszystkie poprzednie wersje pod każdym względem. (Treści NSFW, choć niezbyt ekstremalne, oferują szerszy zakres wyrazu w porównaniu do wcześniejszych wersji, np. v2.1. Dedykowany model NSFW do scalania będzie wydany w przyszłości.)

Zauważyłem też, że wiele udostępnianych modeli zaczęło ostatnio przyjmować licencje zabraniające scalania lub komercjalizacji zewnętrznej. To rozczarowanie, bo uniemożliwia mi używanie świetnych modeli do scalania.

Chciałbym wyrazić serdeczne podziękowania twórcom modeli, którzy udostępnili je na licencjach pozwalających na scalanie, umożliwiając korzystanie z wysokiej jakości modeli będących efektem dużego nakładu pracy i czasu.

Wkrótce wrócę.

Z niecierpliwością czekam na wasze testy wydajności w wielu dziedzinach, w tym ANIME, REALIZM, ARTYSTYCZNE, 2.5D, 3D i NSFW.

Jako twórcy modeli zasiewamy tylko nasiona. Ostatecznie to Wy, użytkownicy modeli i artyści, uprawiacie je i przynosicie owoce.

Dziękuję jak zawsze.

Dla tych, którzy chcą wesprzeć moją pracę małą kwotą, proszę o rozważenie użycia poniższych linków. Obecnie nie mogę znaleźć zatrudnienia i stoję przed niepewną przyszłością finansową.

🌱 dotacja

Specyfikacja gridu(380,5 MB): pobierz

v2.1
Ponowne scalanie i dostosowanie v0.1 do 2.0 z użyciem nowego algorytmu scalania i formuły.

Specyfikacja gridu(424,5 MB): pobierz

v2.0

Chciałbym podziękować wszystkim, którzy pomogli mi przy AlbedoBase XL Pre. Bez Was data premiery prawdopodobnie byłaby dużo późniejsza. Wielkie dzięki!

Napisałem własny skrypt do scalenia istniejących modeli AlbedoBase XL w jeden, precyzyjnie dostosowując wagi wierszy i kolumn wszystkich bloków U-NET i CLIP zgodnie z moją unikalną formułą.
Jeśli generowanie obrazu nie działa (nic się nie tworzy), przełącz się na CLIP SKIP 2 albo lekko zmodyfikuj prompt! Mogą istnieć kombinacje promptów, których CLIP nie rozpoznaje. W takim wypadku zmień kolejność słów, użyj innych słów lub - najprościej - zmień CLIP SKIP. Stopniowo będę pracował nad rozwiązaniem tych problemów, podobnie jak w v1.3.

Specyfikacja gridu(403,5 MB): pobierz

v1.3

Aby zilustrować jakość związaną z losowością modelu, ustandaryzowałem wartość seed na '9' dla wszystkich obrazów pokazowych przeznaczonych do próbkowania, i natychmiast je wygenerowałem.
Szczególnie w tej wersji, ze względu na duży wpływ negatywnych promptów, pozostawienie pola negatywnego promptu puste prawdopodobnie da najlepszą jakość.

Specyfikacja gridu(438,7 MB): pobierz

Jak widać, wraz ze wzrostem liczby kroków (Steps), model staje się dostępny dla wszystkich samplerów, a jakość także się poprawia.
Ze względu na działanie LoRA, którą opracowałem i scaliłem, jak opisano poniżej, używanie promptów w formie zdaniowej zamiast listy tagów bezpośrednio wiąże się z poprawą jakości.

Scaliłem 45 checkpointów i 7 LoRA. Następnie scalono AlbedoBase v0.4 i v0.3 w kolejności, w zakresie poniżej 0~5%, aby przywrócić rozcieńczone, przestarzałe scalenia modeli.
Wśród 7 LoRA, jeden jest stworzony przeze mnie. Polega na analizie i anotacji opisów 174 wysokiej jakości zdjęć obrazowych za pomocą GPT4-V. Scalenie tego LoRA skutkowało zadziwiająco czystymi obrazami oraz niezwykle dobrą interpretacją promptów.

Moje własnoręcznie stworzone LoRA są wyłącznie dostępne na zakup dla moich wspierających na poziomie Creative lub wyższym na Ko-fi. Planuję w przyszłości wydawać coraz więcej aktualizacji. Ceny wahają się od 10 do 50 dolarów.

v1.2

Scalono 22 najnowsze checkpointy.

Specyfikacja gridu(565,6 MB): pobierz

v1.1

Ustabilizowano.
Bardziej szczegółowe.
Jeśli uważasz się za zaawansowanego użytkownika, polecam wersję 1.0. Po znalezieniu odpowiednich ustawień, wersja 1.0 może generować o wiele bardziej żywe dzieła.

Specyfikacja gridu(349,7 MB): pobierz

v1.0

Scalono 106 LoRA.
Scalono 19 checkpointów.

Model może produkować różne wyniki w zależności od wybranych ustawień, dlatego ważne jest, aby sprawdzić specyfikację gridu przed użyciem.
- Odkryłem, że użycie kilku konkretnych negatywnych promptów może pomóc rozwiązać problem asymetrycznych oczu lub pikselizacji. Specyfikacja Grid może się różnić w zależności od CPU lub GPU, więc proszę traktować ją ogólnie. Eksperymentuj z kilkoma negatywnymi promptami, aby poprawić jakość (np. zeza). Uważam, że trudno zadowolić wszystkie ustawienia równocześnie wraz ze wzrostem liczby scalonych LoRA. Niemniej jednak, chciałbym abyś skupił się na tej zalecie wersji 1.0, która potrafi tworzyć niesamowite dzieła o wysokiej jakości, jeśli ustawienia są odpowiednie. Wrócę z bardziej stabilną wersją w przyszłości.
Przydatne wartości ustawień znajdziesz w showcase lub poprzez wyszukiwanie przykładów innych.
Jak zawsze, najlepiej pozostawić puste pole negatywnego promptu dla najlepszych rezultatów.
Ta wersja 1.0 była dużą pracą, więc teraz robię przerwę. Mam nadzieję, że korzystanie z modelu sprawi Ci radość, a jeśli go scalisz, proszę podziel się nim na Civitai za darmo. Dzięki temu wszyscy będziemy mogli go dalej ulepszać.

Specyfikacja gridu(479,4 MB): pobierz

v0.4

Scalono 132 LoRA.
Scalono 4 checkpointy.

Specyfikacja gridu: pobierz

v0.3

Ulepszenia we wszystkich samplerach.
Osiągnięto realistyczny realizm.
Ustabilizowano.

Specyfikacja gridu: pobierz

v0.2

Znaczące ulepszenia ostrości i szczegółowości.
Poprawiona implementacja rąk i stóp.
Główne ulepszenia estetyczne; kompozycja, abstrakcja, płynność, światło i kolor itp.

v0.1

Po odpowiednim dostrojeniu modelu SDXL1.0, starannie i celowo scalono ponad 40 wysokiej jakości modeli publicznie dostępnych na Civitai.
Testy koncentrowały się głównie na zapewnieniu maksymalnej jakości przy minimalnej liczbie tokenów w promptach, nie potwierdzono jak bardzo jakość może się poprawić przy użyciu dużej liczby tokenów. (Proszę przeprowadzić własne testy i podzielić się wynikami)
Najpiękniejsze efekty zazwyczaj osiągane są na styku rzeczywistości i animacji.
Mimo to, przy odpowiednim promptcie, generalnie nie ma rzeczy, której nie potrafi wyrazić. (Uważam, że ma dużą wartość jako model bazowy przewyższający inne w scalaniu. Proszę jednak pamiętać, że to obecnie wersja v0.1)

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

🥂🎆SDXL FaeTastic🎆🥂 - v24

Następny

Photo Factory - V1

Użyj tego modelu