modele/AlbedoBase XL - v3.1-Large

AlbedoBase XL - v3.1-Large

Zofia Nowak

7/27/2025

1:15:40 AM

| Discussion|

Powiązane słowa kluczowe i tagi

Postać z kreskówki: mężczyzna o zszokowanym wyrazie twarzy, dzikich i kręconych włosach, okularach oraz kilkudniowym zarostem, ubrany w żółtą koszulę w kratę z czerwoną krawatą i niebieskimi szelkami na teksturowanym zielonym tle.

Biała, puchata miniaturowa figurka alpaki z dużymi czarnymi oczami stojąca obok brązowego małego domu wydrukowanego w 3D.

Żywa cyfrowa grafika wektorowa w stylu Williama Wraya przedstawiająca zrelaksowanego słonia w kształcie kolorowego balonu powietrznego z wesołym pingwinem siedzącym na górze, otoczona wielokolorowymi balonami na tle nieba.

Grafika impastem przedstawiająca sylwetkę kobiety w sukience i kapeluszu stojącej nad rzeką, patrzącej na małego psa, z klasycznym londyńskim mostem i Big Benem w tle.

Sylwetka kobiety tańczącej tango w stylu wycinanki papierowej, misternie wykonana ze stali z wpływami kirigami, otoczona wirującymi abstrakcyjnymi formami.

Kolorowa ilustracja w stylu powieści graficznej pokazująca ogromne sandsharki z ostrymi zębami atakujące małe łodzie rybaków wiosłujące przez pustynne morze z drobnymi postaciami przypominającymi ludzi wokół.

Zalecane podpowiedzi

(incredibly ultra lifelike, perfect professional precise, masterpiece, extremely beautiful, light and shadow

Zalecane negatywne podpowiedzi

strabismus

(worst quality, normal quality, score_3, score_4

Zalecane parametry

samplers

Euler a, DPM++ 2M SDE Heun

steps

24 - 72

cfg

3 - 9.5

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Wskazówki

Jeśli generowanie obrazu nie daje efektu, spróbuj przełączyć się na CLIP SKIP 2 lub delikatnie zmodyfikować prompt, zmieniając kolejność lub słowa.

Używanie promptów w formie zdań zwykle poprawia jakość obrazów bardziej niż lista tagów.

Pozostawienia pola negatywnego promptu pustego często przynosi lepsze rezultaty.

Sprawdź specyfikację siatki, aby dobrać optymalne ustawienia przed użyciem.

Eksperymentuj z kilkoma specyficznymi negatywnymi promptami, takimi jak 'zez', aby rozwiązać problemy z asymetrią oczu czy pikselacją.

Najważniejsze informacje o wersji

• Połączono ponad 50 wybranych najnowszych wersji modeli SDXL za pomocą skryptu rekurencyjnego zastosowanego w V3.

Sponsorzy twórcy

Jeśli doceniasz wartość modelu, rozważ proszę wsparcie. Twoja pomoc zostanie całkowicie przeznaczona na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 zakup ㅤ|ㅤ 🌱 donacja

Jeśli doceniasz wartość modelu, rozważ proszę wsparcie. Twoja pomoc zostanie całkowicie przeznaczona na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 zakupㅤ |ㅤ 🌱 donacja

AlbedoBase XL (SFW&NSFW)

Refiner jest niepotrzebny, a VAE jest w zestawie.

CEL

Stable Diffusion XL ma 3,5 miliarda parametrów (nie licząc Refiner), co stanowi około 3,6 razy więcej niż wersja SD v1.5. Wierzę, że to nie tylko liczba, ale liczba, która może prowadzić do znaczącej poprawy wydajności.

Minęło trochę czasu, odkąd zauważyliśmy, że ogólna wydajność SD v1.5 znacznie się poprawiła dzięki ogromnym wkładom naszej społeczności. Dlatego pracuję nad ukończeniem modelu AlbedoBase XL, aby optymalnie odtworzyć poprawę wydajności z v1.5 także w tej wersji XL.

Moim celem jest bezpośrednie przetestowanie wydajności wszystkich checkpointów i LoRA publicznie udostępnionych na Civitai oraz połączenie tylko tych zasobów, które po przejściu przez kilka filtrów okażą się optymalne. To przewyższy wydajność AI generującego obrazy, takich firm jak Midjourney.

Na dzień dzisiejszy AlbedoBase XL v3.1 Large ma połączonych około 200 wybranych checkpointów i 251 LoRAs.

LOG

v3.1-Large

• Połączono ponad 50 wybranych najnowszych wersji modeli SDXL za pomocą skryptu rekurencyjnego zastosowanego w V3.

Specyfikacja siatki(370,7 MB): pobierz

v3-mini

Serdecznie przepraszam za tak długie oczekiwanie.

Sprawy osobiste oraz kwestie zdrowotne podczas pracy nad nową wersją były dla mnie wyzwaniem. Nawet pisząc te słowa, nadal zmagam się z tymi trudnościami.

Uznałem, że krótka aktualizacja nie wystarczy, dlatego proszę o wyrozumiałość przy przyjęciu bardziej szczegółowej wiadomości.

Od wydania wersji 2.0 poświęcam się samodzielnej nauce deep learning. Nie mam formalnego wykształcenia w tym kierunku, a poza skromnymi zdolnościami programistycznymi, moje tło jest artystyczne. W rezultacie brakuje mi matematycznych i naukowych podstaw, aby osiągnąć znaczące przełomy w czasie i nakładzie pracy, który włożyłem. Mimo to doświadczenie głębokiego samokształcenia i badań było dla mnie bezcennym skarbem.

Niedawno natknąłem się na pomysł, który może stanowić istotny przełom. Po przepracowaniu setek formuł i metod od wersji 2.0 udało mi się opracować ciekawy i skuteczny algorytm. Proces łączenia modeli został oparty na SDXL1.0 i SD1.5 oraz innych starannie wyselekcjonowanych modelach. Skategoryzowano je w pięć głównych grup: „ANIME”, „REALIZM”, „ARTYSTYCZNY”, „NSFW” oraz „BASE” i podano jako dane do algorytmu łączenia. Ta metoda przyniosła fascynujące rezultaty.

Jednakże, choć rozwój algorytmu był wymagający, nieporównanie trudniejsza była faza testów wydajności. Moje zdrowie fizyczne i psychiczne znacznie się pogorszyło, aż zdałem sobie sprawę, że nie jestem w stanie samodzielnie kontynuować pracy. To ostatecznie zadecydowało o decyzji o wypuszczeniu tej wersji.

Z radością ogłaszam premierę długo oczekiwanej wersji AlbedoBaseXL V3 Mini. To mniejszy model, nieograniczony do konkretnej dziedziny, działający doskonale w różnych obszarach. Może posłużyć jako nowa baza dla SDXL1.0. (Dla informacji, mój algorytm łączenia nie jest „linear merging”, więc zasadniczo można go uważać za nowy model dostrojony.)

Ten model, podobnie jak istniejące modele AlbedoBase, jest wszechstronny i przewyższa wszystkie poprzednie wersje pod każdym względem. (Zawartość NSFW, choć nieekstremalna, oferuje szerszy zakres ekspresji niż wcześniejsze wersje jak v2.1. Dedykowany model łączenia NSFW pojawi się w przyszłości.)

Zauważyłem też, że wiele udostępnianych modeli zaczęło korzystać z licencji zabraniających łączenia lub komercjalizacji zewnętrznej. To rozczarowujące, gdyż uniemożliwiło mi użycie naprawdę świetnych modeli do łączenia.

Chciałbym wyrazić wdzięczność deweloperom modeli, którzy udostępnili swoje wysokiej jakości modele na licencjach darmowych, pozwalając na ich użycie do łączenia.

Z niecierpliwością czekam na wasze testy wydajności w różnych dziedzinach, takich jak ANIME, REALIZM, ARTYSTYCZNY, 2.5D, 3D i NSFW.

Jako twórcy modeli tylko siejemy nasiona. To wy, użytkownicy i artyści, dbacie o nie i sprawiacie, że kwitną i owocują.

Dziękuję, jak zawsze.

Dla tych, którzy chcą wesprzeć moją pracę drobnym wkładem finansowym, proszę skorzystać z poniższych linków. Obecnie nie mogę znaleźć zatrudnienia i niepewna jest moja przyszłość materialna.

🌱 donacja

Specyfikacja siatki(380,5 MB): pobierz

v2.1
Ponowne łączenie i dostosowanie v0.1 do 2.0 z użyciem nowego algorytmu i formuły łączenia.

Specyfikacja siatki(424,5 MB): pobierz

v2.0

Chciałbym podziękować wszystkim, którzy pomogli mi przy AlbedoBase XL Pre. Bez was data premiery byłaby prawdopodobnie znacznie późniejsza. Dziękuję bardzo!

Napisałem niestandardowy skrypt do scalania istniejących modeli AlbedoBase XL w jeden, misternie dopasowując wagi wierszy i kolumn wszystkich bloków U-NET i CLIP według mojego unikalnego wzoru.
Jeśli podczas generowania obrazu nie pojawia się wynik, spróbuj przełączyć się na CLIP SKIP 2 lub delikatnie zmodyfikować prompt! Możliwe są takie kombinacje promptów, których CLIP nie rozpoznaje. W takim przypadku możesz zmienić kolejność słów, użyć innych słów lub po prostu zmienić CLIP SKIP. Będę stopniowo rozwiązywać te problemy w przyszłości, tak jak w v1.3.

Specyfikacja siatki(403,5 MB): pobierz

v1.3

Aby przedstawić jakość związaną z losowością modelu, ustawiłem wartość ziarna na '9' dla wszystkich pokazanych obrazów do próbkowania i wygenerowałem je natychmiast.
Szczególnie w tej wersji, z powodu dużego wpływu negatywnych promptów, pozostawienie pola negatywnego promptu pustym prawdopodobnie przynosi dobrą jakość.

Specyfikacja siatki(438,7 MB): pobierz

Jak widać, w miarę jak rośnie liczba Steps, jest możliwość używania wszystkich samplerów, a jakość również się poprawia.
Dzięki efektowi wypracowanemu przez połączone przeze mnie LoRA, jak opisano poniżej, używanie zdań jako promptów zamiast listy słów bezpośrednio wpływa na poprawę jakości.

Połączyłem 45 checkpointów i 7 LoRA. Następnie połączyłem po kolei AlbedoBase v0.4 i v0.3 w niewielkim stopniu, poniżej 0~5%, aby odświeżyć rozcieńczone, przestarzałe modele łączone.
Wśród 7 LoRA jedna została stworzona przeze mnie. Polega na analizie i adnotacji podpisów dla w sumie 174 wysokiej jakości zdjęć za pomocą GPT4-V. Połączenie tej LoRA skutkowało zadziwiająco wyraźnymi obrazami i znakomitym rozumieniem promptów.

Moje autorskie LoRA są wyłącznie dostępne do zakupu dla wspierających mnie na poziomie Creative lub wyższym na Ko-fi.

v1.2

Połączono 22 najnowsze checkpointy.

Specyfikacja siatki(565,6 MB): pobierz

v1.1

Stabilizacja.
Więcej szczegółów.
Jeśli jesteś zaawansowanym użytkownikiem, polecam wersję 1.0. Jeśli znajdziesz odpowiednie ustawienia, może dać o wiele żywsze prace.

Specyfikacja siatki(349,7 MB): pobierz

v1.0

Połączono 106 LoRA.
Połączono 19 checkpointów.

Model może dawać różne wyniki w zależności od wybranych ustawień, dlatego ważne jest, aby sprawdzić specyfikację siatki przed użyciem.
- Stwierdziłem, że zastosowanie kilku konkretnych negatywnych promptów może pomóc rozwiązać problemy z asymetrycznymi oczami lub obrazami pikselowanymi. Specyfikacja siatki może się różnić w zależności od CPU lub GPU, więc proszę traktować ją jako ogólny przewodnik. Eksperymentuj z negatywnymi promptami, aby poprawić jakość (np. zez). Ustawienie wszystkich parametrów idealnie jest trudne wraz ze wzrostem liczby połączonych LoRA. Mimo to zależy mi, aby skupić się na tej zalecie wersji 1.0, ponieważ może generować prace o niesamowitej jakości w wielu aspektach przy prawidłowych ustawieniach. Wrócę z bardziej stabilną wersją w przyszłości.
Przydatne ustawienia znajdziesz w pokazie lub wyszukując je u innych.
Jak zawsze, najlepiej zostawić negatywny prompt pusty dla najlepszych efektów.
Ta wersja v1.0 wymagała dużo pracy, więc biorę teraz przerwę. Mam nadzieję, że model przypadnie Ci do gustu, a jeśli połączysz go z innymi, proszę podziel się nim bezpłatnie na Civitai. W ten sposób wszyscy będziemy mogli go ulepszać.

Specyfikacja siatki(479,4 MB): pobierz

v0.4

Połączono 132 LoRA.
Połączono 4 checkpointy.

Specyfikacja siatki: pobierz

v0.3

Poprawa działania wszystkich samplerów.
Uzyskano realistyczny wygląd.
Stabilizacja.

Specyfikacja siatki: pobierz

v0.2

Zauważalne poprawki w wyrazistości i detalach.
Lepsza implementacja dłoni i stóp.
Znaczące ulepszenia estetyczne; kompozycja, abstrakcja, płynność, światło i kolor itp.

v0.1

Po odpowiednim dostrojeniu modelu SDXL1.0, starannie i celowo połączono ponad 40 wysokiej jakości modeli publicznie dostępnych na Civitai.
Testy koncentrowały się głównie na zapewnieniu maksymalnej jakości przy minimalnej liczbie tokenów w promptach i nie jest potwierdzone, jak bardzo jakość może się poprawić przy większej liczbie tokenów. (Proszę przeprowadzić własne testy i podzielić się wynikami)
Zazwyczaj najpiękniejsze rezultaty uzyskuje się w połowie drogi między rzeczywistością a animacją.
Mimo to przy odpowiednim promptcie zazwyczaj nie ma niczego, czego model nie potrafiłby wyrazić. (Uważam, że ma dużą wartość jako model bazowy przewyższający inne w łączeniu. Proszę jednak pamiętać, że jest to obecnie v0.1)

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

Shuttle 3 Diffusion - bf16

Następny

WaduStyle - V1

Użyj tego modelu