modele/AlbedoBase XL - v2.1

AlbedoBase XL - v2.1

Zofia Nowak

7/7/2025

1:50:32 PM

| Discussion|

Powiązane słowa kluczowe i tagi

Kobieta trzymająca zapaloną świecę na całkowicie czarnym, ciemnym tle, oświetlająca połowę jej twarzy ciepłym światłem świecy.

Szczegółowa ilustracja tornada wirującego nad wiejskim krajobrazem z domami i pickupem, przedstawiona na zużytym pergaminie z plamami tuszu i efektami tekstury.

Postać zcyfryzowanego hackera w kapturze w stylu cyberpunk z mechanicznymi kablami i ciemnym futurystycznym strojem

Tajemnicza, blada postać w długim, zwiewnym czarnym płaszczu trzymająca pistolet stoi na mgławicowej, ciemnej ulicy miasta z retro samochodem i latarnią w tle w stylu neo-noir.

Kawaii fantastyczna scena przedstawiająca rudowłosą dziewczynę w białej sukience siedzącą przed dużym zielonym stworzeniem z szerokimi, zębatymi ustami, otoczoną kilkoma małymi uroczymi zwierzętami przypominającymi króliki.

Sylwetki łodzi i palm nad rzeką przy zachodzie słońca z ognistym pomarańczowym niebem w stylu collagraph autorstwa Williama Wraya.

Dwie osoby w sylwetce łodzi rybackiej na spokojnej wodzie z odbijającym się jasnym światłem słonecznym, praca w stylu collagraph autorstwa Williama Wray'a

Antropomorficzna kaczka w starych goglach i skórzanej kurtce jadąca na motocyklu, z białą kaczką siedzącą z przodu.

Portret pięknej młodej kobiety z puszczonymi włosami i seksownym stylem modowym, pozującej na oświetlonym słońcem dziedzińcu willi toskańskiej z żywymi kolorami i ubraniami haute couture.

Retrofuturystyczny pojazd wyścigowy na jednym kole z kierowcą w kasku i skórzanej kurtce, przedstawiony w stylu kolagrafii Williama Wraya

Czarna sylwetka stojącego mężczyzny z nastroszonymi włosami i kurtką na tle beżowo-białej rozpryskanej abstrakcji w stylu street art.

Trzy osoby punk z kolczastymi włosami i tatuażami ubrane w preppy stroje na żółtym tle, ilustrowane techniką palette knife inspirowaną Dave McKeanem.

Zalecane negatywne podpowiedzi

strabismus

lowres

Zalecane parametry

samplers

DPM++ 2M SDE Heun Karras

steps

24 - 60

cfg

7.5 - 8

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Wskazówki

Jeśli generowanie obrazu nic nie daje, spróbuj przełączyć na CLIP SKIP 2 lub lekko zmodyfikować prompt, zmieniając kolejność słów lub używając innych wyrazów.

Pozostawienie pola negatywnego promptu pustego może dać ładną jakość obrazów, szczególnie w wersji 1.3.

Używanie promptów w formie zdań zamiast listy słów (tagów) może poprawić jakość obrazu dzięki efektom LoRA.

Sprawdź specyfikację siatki przed użyciem modelu, aby uzyskać najlepsze ustawienia, dostępne za pomocą podanych linków do pobrania.

Najważniejsze informacje o wersji

Ponowne łączenie i dostosowanie v0.1 do 2.0 za pomocą nowego algorytmu i formuły łączenia.

Sponsorzy twórcy

Jeśli doceniasz ten model, prosimy o wsparcie. Twoja wpłata zostanie w całości przeznaczona na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 zakup ㅤ|ㅤ 🌱 donacja

Jeśli doceniasz ten model, prosimy o wsparcie. Twoja wpłata zostanie w całości przeznaczona na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 zakupㅤ |ㅤ 🌱 donacja

AlbedoBase XL (SFW&NSFW)

Refiner nie jest potrzebny, a VAE jest dołączone.

CEL

Stable Diffusion XL ma 3,5 miliarda parametrów (bez Refiner), co jest około 3,6 razy więcej niż wersja SD v1.5. Uważam, że to nie tylko liczba, ale wartość, która może prowadzić do znacznej poprawy wydajności.

Minęło już trochę czasu, odkąd zauważyliśmy, że ogólna wydajność SD v1.5 poprawiła się ponad wyobrażenia dzięki ogromnym wkładom naszej społeczności. Dlatego pracuję nad ukończeniem modelu AlbedoBase XL, aby optymalnie odwzorować tę poprawę wydajności również w wersji XL.

Moim celem jest bezpośrednie przetestowanie wydajności wszystkich checkpointów i LoRA, które są publicznie udostępnione na Civitai, oraz połączenie tylko tych zasobów, które po kilku filtrach okażą się optymalne. To pozwoli przewyższyć wydajność AI generujących obrazy, takich jak Midjourney.

Na dzień dzisiejszy AlbedoBase XL v3.1 Large połączył około 200 wybranych checkpointów i 251 LoRA.

LOG

v3.1-Large

• Połączono ponad 50 wybranych najnowszych wersji modeli SDXL za pomocą rekurencyjnego skryptu używanego w V3.

Specyfikacja siatki(370.7 MB): pobierz

v3-mini

Szczerze przepraszam za tak długie oczekiwanie.

Zmagałem się z pewnymi sprawami osobistymi, a podczas pracy nad nową wersją pojawiły się również problemy zdrowotne. Nawet pisząc te słowa, nadal borykam się z tymi wyzwaniami.

Czułem, że krótka aktualizacja nie wystarczy, dlatego proszę o wyrozumiałość, gdy dzielę się tym bardziej szczegółowym przekazem.

Od wydania wersji 2.0 poświęcam się samodzielnej nauce deep learningu. Nie mam formalnego wykształcenia, a oprócz skromnych zdolności programistycznych, moja przeszłość to sztuka. W efekcie brakuje mi matematycznych i naukowych podstaw do osiągnięcia znaczących przełomów, biorąc pod uwagę mój czas i wysiłek. Mimo to doświadczenie samodzielnych studiów i badań jest bezcennym skarbem w moim życiu.

Ostatnio natrafiłem na pomysł, który może być znaczącym przełomem. Po przeróbce setek formuł i metod od wersji 2.0, udało mi się opracować dość intrygujący i skuteczny algorytm. Proces łączenia modeli opiera się na SDXL1.0 i SD1.5 oraz innych starannie dobranych modelach. Zostały one podzielone na pięć głównych kategorii: „ANIME,” „REALISM,” „ARTISTIC,” „NSFW” i „BASE,” i wprowadzone do algorytmu łączenia jako zestawy danych. Ta metoda dała fascynujące rezultaty.

Jednak, choć rozwijanie algorytmu było trudne, nic nie było tak wymagające jak faza testów wydajności. Mój stan fizyczny i psychiczny znacznie się pogorszył, aż doszedłem do wniosku, że nie da się kontynuować pracy samemu. To ostatecznie skłoniło mnie do wydania tej wersji.

Teraz z radością ogłaszam premierę długo oczekiwanej wersji AlbedoBaseXL V3 Mini. Choć model jest mniejszą skalą połączenia, nie ogranicza się do konkretnej dziedziny i działa znakomicie w różnych obszarach. Może służyć jako nowy model bazowy dla SDXL1.0. (Dla przypomnienia, mój algorytm łączenia nie jest „łączeniem liniowym,” więc można go zasadniczo uważać za nowy dostrojony model.)

Ten model wraz z istniejącymi modelami AlbedoBase jest wszechstronny i przewyższa wcześniejsze wersje pod każdym względem. (Treści NSFW, choć nie ekstremalne, oferują szerszy zakres wyrazu niż wcześniejsze wersje, np. v2.1. Dedykowany model łączący NSFW zostanie wydany w przyszłości.)

Zauważyłem również, że wiele udostępnionych modeli zaczęło ostatnio stosować licencje zabraniające łączenia lub komercjalizacji zewnętrznej. To rozczarowujące, gdyż uniemożliwiło mi wykorzystanie niektórych naprawdę znakomitych modeli do łączenia.

Chciałbym wyrazić ogromną wdzięczność twórcom modeli, którzy udostępnili darmowe licencje, pozwalając używać ich wysokiej jakości modeli — owoców znacznego czasu i wysiłku — do łączenia.

Z niecierpliwością czekam na Wasze testy wydajności w wielu dziedzinach, w tym ANIME, REALISM, ARTISTIC, 2.5D, 3D i NSFW.

Jako twórcy modeli tylko zasadźmy ziarna. To Wy, użytkownicy modeli i artyści, pielęgnujecie je, przynosząc kwiaty i owoce.

Dziękuję, jak zawsze.

Dla tych, którzy chcą wesprzeć moją pracę niewielką wpłatą, proszę rozważyć użycie poniższych linków. Obecnie nie mogę znaleźć zatrudnienia i stoję w obliczu niepewnej przyszłości.

🌱 donacja

Specyfikacja siatki(380.5 MB): pobierz

v2.1
Ponowne łączenie i dostosowanie v0.1 do 2.0 za pomocą nowego algorytmu i formuły łączenia.

Specyfikacja siatki(424.5 MB): pobierz

v2.0

Chciałbym podziękować wszystkim, którzy pomogli mi przy projekcie AlbedoBase XL Pre. Bez Was data premiery prawdopodobnie byłaby znacznie późniejsza. Dziękuję bardzo!

Napisałem własny skrypt, który scala istniejące modele AlbedoBase XL w jeden. Skrupulatnie dopasowując wagi wierszy i kolumn wszystkich bloków U-NET i CLIP według mojej unikalnej formuły.
Jeśli podczas generowania obrazu nic się nie pojawia, spróbuj przełączyć na CLIP SKIP 2 lub lekko zmodyfikować prompt! Mogą istnieć kombinacje promptów, których CLIP nie rozpoznaje. W takim wypadku możesz zmienić kolejność słów, użyć innych wyrazów lub najprościej zmienić CLIP SKIP. Będę stopniowo rozwiązywać te problemy w przyszłości, podobnie jak w wersji v1.3.

Specyfikacja siatki(403.5 MB): pobierz

v1.3

Aby zobrazować jakość związaną z losowością modelu, ustandaryzowałem wartość ziarna na „9” dla wszystkich obrazów pokazowych przeznaczonych do próbkowania i od razu je wygenerowałem.
Szczególnie w tej wersji, ze względu na duży wpływ negatywnych promptów, pozostawienie pola negatywnego promptu puste prawdopodobnie da dobrą jakość.

Specyfikacja siatki(438.7 MB): pobierz

Jak widać, wraz ze wzrostem liczby Steps staje się dostępny dla wszystkich samplerów, a jakość również się poprawia.
Dzięki efektowi LoRA, który opracowałem i połączyłem, jak poniżej opisano, używanie promptów w formie zdań, a nie listy słów (tagów), bezpośrednio wiąże się z poprawą jakości.

Połączyłem 45 checkpointów i 7 LoRA. Następnie sekwencyjnie dołączyłem AlbedoBase v0.4 i v0.3 w ilości mniej niż 0~5%, aby ożywić rozcieńczone, połączone modele, które stały się przestarzałe.
Z 7 LoRA, jedna została stworzona przeze mnie. Polega na analizie i adnotacji napisów do 174 wysokiej jakości zdjęć ilustracyjnych przy użyciu GPT4-V. Połączenie tej LoRA przyniosło znacznie wyraźniejsze obrazy i znakomite zrozumienie promptów.

Moje własnoręcznie stworzone LoRA są wyłącznie dostępne do zakupu dla moich wspierających na Ko-fi na poziomie Creative lub wyższym.

v1.2

Połączono 22 najnowsze checkpointy.

Specyfikacja siatki(565.6 MB): pobierz

v1.1

Ustabilizowano.
Bardziej szczegółowe.
Jeśli uważasz się za zaawansowanego użytkownika, polecam wersję 1.0. Gdy wersja 1.0 znajdzie odpowiednie ustawienia, może generować znacznie żywsze prace.

Specyfikacja siatki(349.7 MB): pobierz

v1.0

Połączono 106 LoRA.
Połączono 19 checkpointów.

Model może generować różne efekty w zależności od wybranych ustawień, dlatego ważne jest, aby sprawdzić specyfikację siatki przed użyciem.
- Zauważyłem, że zastosowanie kilku określonych negatywnych promptów może pomóc rozwiązać problem asymetrycznych oczu lub pikselizacji. Specyfikacja siatki może się różnić w zależności od Twojego CPU lub GPU, więc traktuj ją jako ogólne odniesienie. Eksperymentuj z negatywnymi promptami, aby poprawić jakość (np. zez). Trudno jest spełnić wszystkie wymagania przy rosnącej liczbie połączonych LoRA. Jednak chcę, abyś skupił się na tej zalecie wersji 1.0, ponieważ może ona wygenerować niesamowite prace przy odpowiednich ustawieniach. Wrócę z bardziej stabilną wersją w przyszłości.
Przydatne wartości ustawień znajdziesz w pokazie modeli lub wyszukując inne przykłady.
Jak zawsze, najlepiej pozostawić negatywny prompt pusty, aby uzyskać najlepsze efekty.
Przy wersji v1.0 włożyłem dużo pracy, więc robię małą przerwę. Mam nadzieję, że model Ci się spodoba, a jeśli go połączysz, podziel się nim za darmo na Civitai. W ten sposób wszyscy możemy go dalej ulepszać.

Specyfikacja siatki(479.4 MB): pobierz

v0.4

Połączono 132 LoRA.
Połączono 4 checkpointy.

Specyfikacja siatki: pobierz

v0.3

Poprawiono w wszystkich samplerach.
Osiągnięto realistyczny wygląd.
Ustabilizowano.

Specyfikacja siatki: pobierz

v0.2

Znacząca poprawa klarowności i detali.
Poprawiona implementacja rąk i stóp.
Główne ulepszenia estetyczne; kompozycja, abstrakcja, przepływ, światło i kolor itp.

v0.1

Po odpowiednim dostrojeniu modelu SDXL1.0, dokładnie i celowo połączono ponad 40 wysokiej jakości modeli dostępnych publicznie na Civitai.
Testy skupiały się głównie na zapewnieniu maksymalnej jakości przy minimalnej liczbie tokenów prompu; nie potwierdzono, jak bardzo jakość poprawi się przy użyciu dużej liczby tokenów. (Proszę przeprowadzić własne testy i podzielić się wynikami)
Zazwyczaj najpiękniejsze efekty osiąga się w połowie drogi między realizmem a animacją.
Niemniej jednak, przy odpowiednim prompcie, generalnie nie ma niczego, czego nie potrafi wyrazić. (Twierdzę, że posiada obfitą wartość jako model bazowy przewyższający inne modele w łączeniu. Proszę jednak pamiętać, że to obecnie v0.1)

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

Fluxartis - Opus I

Następny

Negatywne i Pozytywne Embeddings By Stable Yogi - v1.0

Użyj tego modelu