modele/AlbedoBase XL - v2.0

AlbedoBase XL - v2.0

7/31/2025

1:17:51 PM

Powiązane słowa kluczowe i tagi

2d,3d,albedobase xl,albedobond,wszystko w jednym,anime,model bazowy,checkpoint,filmowy,gra,lora,łączenie modeli,fotorealistyczny,sdxl 1.0,sdxl1.0,stable diffusion xl,ostateczny,zjednocz,v2.0

Świecące bioluminescencyjne jądro wśród gruzu zniszczonej planety unoszące się tajemniczo nad skalistym, ciemnym krajobrazem w przestrzeni kosmicznej.

Fotorealistyczna figurka przypominająca muchomora czerwonego z dużym czerwonym kapeluszem stojąca w magicznym lesie przy błękitnym zachodzie słońca, otoczona przez mniejsze grzyby i żywą roślinność.

Kobieta w niebieskim skafandrze kosmicznym stoi wewnątrz stacji kosmicznej, jej ręce uniesione ekspresyjnie przy dużym oknie z widokiem na Ziemię w tle, uchwycona głębokimi kolorami i subtelną ziarnistością.

Robot endoszkielet T800 w podartym białym t-shircie i niebieskich spodniach dresowych trzymający kosz z ludzką skórą w wewnętrznej pralni z kinowym oświetleniem i wysokim poziomem detali.

Egzotyczny las w stylu LEGO z żywą roślinnością i krystalicznie czystą rzeką przepływającą przez środek, pod jasnym błękitnym niebem i efektem flary słonecznej, szczegółowo przedstawiony bujną zielenią LEGO.

Zalecane negatywne podpowiedzi

strabismus,asymmetrical eyes,pixelated images

amateur quality, vague shapes, vague texture, wrong perspective, ugly, dowdy style

Zalecane parametry

samplers

DPM++ 2M SDE Heun Karras

steps

cfg

clip skip

resolution

1024x1024, 720x1280

vae

Included VAE - default

Wskazówki

Jeśli napotkasz błąd polegający na braku generowania, przełącz się na CLIP SKIP 2 lub nieznacznie zmodyfikuj prompt.

Używanie promptów w formie zdań zamiast listy tagów poprawia jakość obrazu.

Pozostawienie pola negatywnego promptu pustym często daje najlepszą jakość obrazów.

Przed użyciem sprawdź specyfikację gridu dla zalecanych ustawień.

Eksperymentuj z kilkoma negatywnymi promptami, by rozwiązać problemy takie jak asymetria oczu lub pikselizacja.

Najważniejsze informacje o wersji

Napisałem własny skrypt, aby zbiec istniejące modele AlbedoBase XL w jeden. Starannie wyrównując wagi wierszy i kolumn wszystkich bloków U-NET i CLIP zgodnie z moją unikalną formułą.

Sponsorzy twórcy

Jeśli model okazał się pomocny, prosimy o wsparcie. Twoja wpłata zostanie przeznaczona wyłącznie na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 zakupㅤ |ㅤ 🌱 darowizna

Jeśli model okazał się pomocny, prosimy o wsparcie. Twoja wpłata zostanie przeznaczona wyłącznie na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 zakupㅤ |ㅤ 🌱 darowizna

AlbedoBase XL (SFW&NSFW)

Refiner nie jest potrzebny, VAE jest wbudowane.

CEL

Stable Diffusion XL posiada 3,5 miliarda parametrów (bez Refiner), czyli około 3,6 razy więcej niż wersja SD v1.5. Wierzę, że to nie tylko liczba, ale parametr mogący prowadzić do znaczącej poprawy wydajności.

Od dłuższego czasu zauważamy, że ogólna wydajność SD v1.5 znacznie się poprawiła dzięki ogromnym wkładom naszej społeczności. Dlatego pracuję nad ukończeniem modelu AlbedoBase XL, by optymalnie odwzorować tę poprawę wydajności z v1.5 również w wersji XL.

Moim celem jest bezpośrednie testowanie wydajności wszystkich checkpointów i LoRAs publicznie udostępnionych na Civitai, a następnie łączenie tylko tych zasobów, które zostaną uznane za optymalne po przejściu przez kilka filtrów. To przewyższy wydajność AI generujących obrazy, takich jak Midjourney.

Aktualnie, AlbedoBase XL v3.1 Large połączył około 200 wybranych checkpointów i 251 LoRAs.

LOG

v3.1-Large

• Połączono ponad 50 wybranych najnowszych wersji modeli SDXL za pomocą rekurencyjnego skryptu używanego w V3.

Specyfikacja gridu(370.7 MB): pobierz

v3-mini

Szczerze przepraszam za tak długie oczekiwanie.

Zmagałem się z prywatnymi sprawami, a podczas pracy nad nową wersją również zdrowotnymi problemami. Nawet gdy to piszę, wciąż z tym walczę.

Poczułem, że krótka aktualizacja nie wystarczy, dlatego proszę o wyrozumiałość, gdy dzielę się tym bardziej szczegółowym komunikatem.

Od wydania wersji 2.0 poświęcam się samodzielnej nauce deep learningu. Nie posiadam formalnego wykształcenia, a poza skromnym talentem programistycznym, mam wykształcenie artystyczne. W efekcie brakuje mi matematycznej i naukowej podstawy, by osiągnąć duże przełomy, mimo zaangażowanego czasu i wysiłku. Mimo to doświadczenie samodzielnej nauki i badań jest dla mnie bezcenne.

Ostatnio natrafiłem na pomysł, który może być istotnym przełomem. Po przeróbce setek wzorów i metod od wersji 2.0, udało mi się wypracować dość intrygujący i skuteczny algorytm. Proces łączenia modeli bazował na SDXL1.0 i SD1.5 wraz z innymi starannie dobranymi modelami. Były one podzielone na pięć głównych kategorii: „ANIME”, „REALISM”, „ARTISTIC”, „NSFW” i „BASE”, i podano je jako zestawy danych do algorytmu łączenia. Podejście to przyniosło fascynujące rezultaty.

Jednak, choć opracowanie algorytmu było wyzwaniem, żadna faza nie była tak trudna jak testowanie wydajności. Moje zdrowie fizyczne i psychiczne znacznie się pogorszyło, aż zrozumiałem, że nie mogę kontynuować pracy samodzielnie. To ostatecznie skłoniło mnie do decyzji o wydaniu tej wersji.

Z przyjemnością ogłaszam wydanie wyczekiwanej wersji AlbedoBaseXL V3 Mini. Chociaż model ten jest mniejszą skalą łączenia, nie jest ograniczony do żadnej konkretnej dziedziny i doskonale sprawdza się w różnych obszarach. Może służyć jako nowy model bazowy dla SDXL1.0. (Dla jasności, mój algorytm łączenia nie jest „łączeniem liniowym”, więc można go zasadniczo traktować jak nowy, dostrojony model.)

Ten model, wraz z istniejącymi modelami AlbedoBase, jest wszechstronny i przewyższa poprzednie wersje pod każdym względem. (Treści NSFW, choć nie ekstremalne, oferują szerszy zakres ekspresji niż wcześniejsze wersje takie jak v2.1. Dedykowany model łączeniowy NSFW zostanie wydany w przyszłości.)

Zauważyłem, że wiele udostępnionych modeli ostatnio zaczęło korzystać z licencji zabraniających łączenia lub komercjalizacji zewnętrznej. Było to dla mnie rozczarowujące, ponieważ uniemożliwiło mi użycie niektórych naprawdę doskonałych modeli do łączenia.

Chcę wyrazić szczere podziękowania twórcom modeli, którzy udostępniają bezpłatne licencje, pozwalając na łączenie ich wysokiej jakości modeli, które są wynikiem wielu godzin pracy i wysiłku.

Wkrótce wrócę.

Z niecierpliwością oczekuję waszych testów wydajności w wielu obszarach, w tym ANIME, REALISM, ARTISTIC, 2.5D, 3D i NSFW.

Jako twórcy modeli sadzimy jedynie ziarna. To wy, użytkownicy i artyści modeli, pielęgnujecie je i sprawiacie, że kwitną oraz owocują.

Dziękuję jak zawsze.

Dla tych, którzy chcą wesprzeć moją pracę drobnym datkiem, proszę o skorzystanie z poniższych linków. Obecnie nie mogę znaleźć zatrudnienia i stoję przed niepewną przyszłością finansową.

🌱 darowizna

Specyfikacja gridu(380.5 MB): pobierz

v2.1
Ponowne łączenie i dostosowanie v0.1 do 2.0 przy użyciu nowego algorytmu i formuły łączenia.

Specyfikacja gridu(424.5 MB): pobierz

v2.0

Chciałbym podziękować wszystkim, którzy pomagali mi przy AlbedoBase XL Pre. Bez was data wydania byłaby prawdopodobnie znacznie późniejsza. Bardzo dziękuję!

Napisałem własny skrypt, aby zbiec istniejące modele AlbedoBase XL w jeden. Starannie wyrównując wagi wierszy i kolumn wszystkich bloków U-NET i CLIP zgodnie z moją unikalną formułą.
Jeśli napotkasz błąd przy generowaniu obrazu (gdy nic się nie generuje), przełącz się na CLIP SKIP 2 lub nieco zmodyfikuj prompt! Mogą wystąpić kombinacje promptów, których CLIP nie rozpoznaje. W takim przypadku możesz zmienić kolejność słów, użyć innych słów lub, najprościej, zmienić CLIP SKIP. Stopniowo będę rozwiązywać te problemy w przyszłości, tak jak w v1.3.

Specyfikacja gridu(403.5 MB): pobierz

v1.3

Aby zilustrować jakość związaną z losowością modelu, ustawiłem wartość seed na '9' dla wszystkich obrazów pokazowych przeznaczonych do próbkowania i natychmiastowej generacji.
Szczególnie w tej wersji, ze względu na duży wpływ negatywnych promptów, pozostawienie pola negatywnego promptu pustym prawdopodobnie przyniesie dobrą jakość.

Specyfikacja gridu(438.7 MB): pobierz

Jak widać, wraz ze wzrostem liczby kroków (Steps), staje się to dostępne dla wszystkich samplerów, a jakość także się poprawia.
Dzięki efektowi LoRA, które stworzyłem i połączyłem, jak opisano poniżej, używanie promptów w formie zdań zamiast listy tagów bezpośrednio przekłada się na poprawę jakości.

Połączyłem 45 checkpointów i 7 LoRAs. Następnie kolejno połączyłem AlbedoBase v0.4 i v0.3 w mniej niż 0~5%, by ożywić rozmyte, przestarzałe modele.
Spośród 7 LoRAs jedno zostało stworzone przeze mnie. Polega ono na analizie i opisaniu 174 zdjęć wysokiej jakości przy użyciu GPT4-V. Połączenie tej LoRA skutkowało zadziwiająco klarownymi obrazami i wyjątkowym zrozumieniem promptów.

Moje własne LoRAs są dostępne wyłącznie do zakupu dla moich wspierających na poziomie Creative lub wyższym.

v1.2

Połączono 22 najnowsze checkpointy.

Specyfikacja gridu(565.6 MB): pobierz

v1.1

Stabilizacja.
Bardziej szczegółowe.
Jeśli jesteś zaawansowanym użytkownikiem, polecam wersję 1.0. Jeśli w wersji 1.0 znajdziesz odpowiednie ustawienia, może generować dużo bardziej żywe dzieła.

Specyfikacja gridu(349.7 MB): pobierz

v1.0

Połączono 106 LoRAs.
Połączono 19 checkpointów.

Model może generować różne wyniki w zależności od wybranych ustawień, więc ważne jest, aby sprawdzić specyfikację gridu przed użyciem.
- Zauważyłem, że użycie kilku specyficznych negatywnych promptów może pomóc rozwiązać problem asymetrycznych oczu lub pikselizacji. Specyfikacja gridu może się różnić w zależności od CPU lub GPU, więc traktuj ją jako ogólne odniesienie. Eksperymentuj z negatywnymi promptami, aby poprawić jakość (np. zez). Trudno zadowolić wszystkie ustawienia równocześnie wraz ze wzrostem liczby łączonych LoRA. Jednak chciałbym, abyś skupił się na tej zalecie wersji 1.0, ponieważ może generować dzieła o niesamowitej jakości w różnych aspektach przy odpowiednich ustawieniach. Wrócę z bardziej stabilną wersją w przyszłości.
Przydatne wartości ustawień można znaleźć na showcase lub wyszukując u innych użytkowników.
Jak zawsze, najlepiej pozostawić negatywny prompt pusty dla najlepszych rezultatów.
Wersja v1.0 wymagała dużo pracy, więc robię teraz przerwę. Mam nadzieję, że model przypadnie wam do gustu, a jeśli go połączycie, udostępnijcie za darmo na Civitai, byśmy wszyscy mogli go dalej rozwijać.

Specyfikacja gridu(479.4 MB): pobierz

v0.4

Połączono 132 LoRAs.
Połączono 4 checkpointy.

Specyfikacja gridu: pobierz

v0.3

Poprawiono wszystkie samplery.
Osiągnięto realistyczny realizm.
Stabilizacja.

Specyfikacja gridu: pobierz

v0.2

Znaczna poprawa klarowności i szczegółowości.
Ulepszenie implementacji rąk i stóp.
Główne ulepszenia estetyczne: kompozycja, abstrakcja, płynność, światło i kolor itd.

v0.1

Po odpowiednim dostrojeniu modelu SDXL1.0, starannie i celowo połączono ponad 40 wysokiej jakości modeli dostępnych publicznie na Civitai.
Testy skupiały się głównie na zapewnieniu maksymalnej jakości przy minimalnej liczbie tokenów promptu, nie potwierdzono, jak bardzo jakość może się poprawić przy użyciu dużej liczby tokenów. (Proszę przeprowadzać własne testy i dzielić się wynikami)
Zazwyczaj najbardziej estetyczne rezultaty osiąga się na granicy między realizmem a animacją.
Niemniej jednak przy właściwym promptcie, generalnie nie ma rzeczy, której by nie potrafił wyrazić. (Twierdzę, że posiada dużą wartość jako model bazowy przewyższający inne w łączeniu. Jednak pamiętaj, że to obecnie v0.1)

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

SocaRealism XL - 1.3

Następny

Realistyczne zdjęcie stockowe - v2.0

Użyj tego modelu