modele/AlbedoBase XL - v1.1

AlbedoBase XL - v1.1

Zofia Nowak

7/29/2025

2:14:52 AM

| Discussion|

Powiązane słowa kluczowe i tagi

Podwodny portret białowłosej Montserratiańskiej kobiety z zamkniętymi oczami i zmęczonym wyrazem twarzy, otoczonej dużymi pomarańczowo-białymi karpiami pływającymi z gracją.

Zbliżenie boczne kolorowej jaszczurki z żywymi łuskami opalającej się na pniu, uchwycone w makrofotografii.

Zbliżenie na ptaka zimorodka siedzącego na mchu na korze drzewa blisko głębokiej niebieskiej wody z poranną mgłą i światłem świtu

Zalecane negatywne podpowiedzi

strabismus

inconsiderate details

Zalecane parametry

samplers

DPM++ 3M SDE Karras

steps

cfg

resolution

768x1008, 1024x1024, 768x1024

vae

included VAE

Zalecane parametry wysokiej rozdzielczości

upscaler

4x-UltraSharp

upscale

1.35

steps

denoising strength

0.45 - 0.52

Wskazówki

Jeśli generowanie obrazu nie daje rezultatu, spróbuj przełączyć na CLIP SKIP 2 lub delikatnie zmodyfikować prompt, zmieniając kolejność lub słowa.

Stosowanie promptów w formie zdań zwykle poprawia jakość obrazu bardziej niż lista tagów.

Pozostawienie pola negatywnego promptu pustego często daje lepsze efekty.

Przed użyciem sprawdź siatkę specyfikacji, aby dobrać optymalne ustawienia.

Eksperymentuj z kilkoma specyficznymi negatywnymi promptami, jak 'zez', aby rozwiązać problemy z asymetrią oczu lub pikselacją.

Najważniejsze informacje o wersji

v1.1

Stabilizacja.
Więcej detali.
Jeśli uważasz, że jesteś zaawansowanym użytkownikiem, polecam wersję 1.0. Jeśli znajdzie właściwe ustawienia, potrafi wygenerować dużo bardziej żywe prace.

Siatka specyfikacji (349,7 MB): pobierz

Sponsorzy twórcy

Jeśli uznałeś model za wartościowy, rozważ proszę wsparcie. Twoja wpłata zostanie w całości przeznaczona na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 kup ㅤ|ㅤ 🌱 wspomóż

Jeśli uznałeś model za wartościowy, rozważ proszę wsparcie. Twoja wpłata zostanie w całości przeznaczona na rozwój społeczności SDXL.

🙋🏼‍♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 kupㅤ |ㅤ 🌱 wspomóż

AlbedoBase XL (SFW&NSFW)

Refiner nie jest potrzebny, a VAE jest w zestawie.

CEL

Stable Diffusion XL posiada 3,5 miliarda parametrów (bez Refiner’a), czyli około 3,6 razy więcej niż wersja SD v1.5. Uważam, że to nie tylko liczba, ale liczba mogąca prowadzić do znacznej poprawy wydajności.

Od dawna wiemy, że ogólna wydajność SD v1.5 poprawiła się niewiarygodnie dzięki ogromnemu wkładowi naszej społeczności. Dlatego pracuję nad ukończeniem modelu AlbedoBase XL, aby optymalnie odwzorować poprawę wydajności z v1.5 również w tej wersji XL.

Moją intencją jest bezpośrednie przetestowanie wydajności wszystkich checkpointów i LoRAs publicznie udostępnionych na Civitai i po kilku filtrach scalenie tylko tych zasobów, które okażą się optymalne. To pozwoli przewyższyć wydajność AI generujących obrazy, takich jak Midjourney.

Obecnie AlbedoBase XL v3.1 Large zawiera połączone około 200 wybranych checkpointów i 251 LoRAs.

HISTORIA

v3.1-Large

• Połączono ponad 50 wybranych najnowszych wersji modeli SDXL, używając skryptu rekurencyjnego zastosowanego w V3.

Siatka specyfikacji (370,7 MB): pobierz

v3-mini

Zmagałem się z prywatnymi sprawami, a podczas pracy nad nową wersją napotkałem również problemy zdrowotne. Nawet teraz, pisząc to, nadal borykam się z tymi wyzwaniami.

Poczułem, że krótka aktualizacja nie wystarczy, dlatego proszę o wyrozumiałość podczas przekazywania tej bardziej szczegółowej wiadomości.

Od wydania wersji 2.0 poświęcam się samodzielnej nauce deep learningu. Nie posiadam formalnego wykształcenia, a poza umiarkowanymi zdolnościami programistycznymi, moja podstawa to sztuka. W efekcie brakuje mi matematycznych i naukowych podstaw, by dokonać przełomów proporcjonalnych do czasu i wysiłku, który włożyłem. Mimo tego, doświadczenie samodzielnej nauki i badań było dla mnie bezcennym skarbem.

Niedawno natknąłem się na pomysł, który może być przełomowy. Po przetworzeniu setek formuł i metod od wersji 2.0, stworzyłem bardzo interesujący i skuteczny algorytm. Proces łączenia modeli bazował na SDXL1.0 i SD1.5 oraz innych starannie dobranych modelach. Podzielono je na pięć głównych kategorii: „ANIME,” „REALISM,” „ARTISTIC,” „NSFW” oraz „BASE,” które posłużyły jako zestawy danych do algorytmu scalającego. Efekty są fascynujące.

Jednak najtrudniejszy był etap testowania wydajności. Moje zdrowie fizyczne i psychiczne bardzo się pogorszyło, aż doszedłem do wniosku, że nie mogę tego kontynuować samodzielnie. To ostatecznie skłoniło mnie do wypuszczenia tej wersji.

I teraz z radością ogłaszam premierę długo wyczekiwanej wersji AlbedoBaseXL V3 Mini. Ten model, choć mniejszej skali, nie jest ograniczony do konkretnej dziedziny i radzi sobie znakomicie w różnych obszarach. Może służyć jako nowy model bazowy dla SDXL1.0. (Dla porównania, mój algorytm scalania nie jest „liniowym łączeniem,” więc można go zasadniczo traktować jako nowy model precyzyjnie dostrojony.)

Ten model, razem z istniejącymi modelami AlbedoBase, jest wszechstronny i przewyższa wszystkie poprzednie wersje pod każdym względem. (Zawartość NSFW, choć nie ekstremalna, oferuje szerszy zakres ekspresji w porównaniu do wcześniejszych wersji jak v2.1. Dedykowany model scalający NSFW zostanie wypuszczony w przyszłości.)

Zauważyłem też, że wiele udostępnianych modeli ostatnio przyjęło licencje zabraniające scalania lub komercjalizacji zewnętrznej. To rozczarowujące, ponieważ uniemożliwiło mi wykorzystanie niektórych naprawdę świetnych modeli do łączenia.

Chciałbym wyrazić serdeczne podziękowania twórcom modeli, którzy udostępnili je na darmowych licencjach, umożliwiając wykorzystanie wysokiej jakości modeli, będących owocem wielogodzinnej pracy, do scalania.

Wkrótce wrócę.

Jako twórcy modeli sadzimy tylko nasiona. Ostatecznie to wy, użytkownicy i artyści, je pielęgnujecie i przynosicie kwiaty oraz owoce.

Dziękuję, jak zawsze.

Dla tych, którzy chcą wesprzeć moją pracę niewielką kwotą, proszę skorzystać z poniższych linków. Obecnie nie mam stałego zatrudnienia i moja przyszłość życiowa jest niepewna.

🌱 wspomóż

Siatka specyfikacji (380,5 MB): pobierz

v2.1
Ponowne scalanie i dostosowanie v0.1 do 2.0 za pomocą nowego algorytmu i formuły scalania.

Siatka specyfikacji (424,5 MB): pobierz

v2.0

Chciałbym podziękować wszystkim, którzy pomogli mi przy AlbedoBase XL Pre. Bez was premiera prawdopodobnie byłaby dużo później. Serdecznie dziękuję!

Napisałem własny skrypt scalający istniejące modele AlbedoBase XL w jeden. Precyzyjnie dopasowując wagi wierszy i kolumn wszystkich bloków U-NET i CLIP według własnej, unikalnej formuły.
Jeśli podczas generowania obrazu nie pojawia się rezultat (nic się nie wygeneruje), spróbuj przełączyć na CLIP SKIP 2 lub delikatnie zmodyfikuj prompt! Mogą wystąpić kombinacje promptów, których CLIP nie rozpoznaje. W takim przypadku możesz zmienić kolejność słów, użyć innych wyrazów lub najprościej zmienić CLIP SKIP. Będę stopniowo rozwiązywać te problemy w przyszłości, jak w v1.3.

Siatka specyfikacji (403,5 MB): pobierz

v1.3

Aby zilustrować jakość związaną z losowością modelu, ustaliłem stałą wartość ziarna na '9' dla wszystkich przykładowych obrazów, które natychmiast wygenerowano.
Szczególnie w tej wersji, ze względu na duży wpływ negatywnych promptów, pozostawienie pola negatywnego promptu pustego zwykle daje lepszą jakość.

Siatka specyfikacji (438,7 MB): pobierz

Jak widać, w miarę wzrostu liczby kroków, staje się on dostępny dla wszystkich samplerów, a jakość również się poprawia.
Dzięki efektom stworzonego i scalonego przeze mnie LoRA, jak opisano poniżej, stosowanie promptów w formie zdań zamiast listy tagów bezpośrednio przekłada się na lepszą jakość.

Połączyłem 45 checkpointów i 7 LoRA. Następnie kolejno scaliłem AlbedoBase v0.4 i v0.3 w ilościach poniżej 0-5%, aby ożywić rozmyte, przestarzałe modele scalone.
Z 7 LoRA jedno stworzyłem sam. Polega ono na analizie i anotacji opisów dla łącznie 174 wysokiej jakości zdjęć z użyciem GPT4-V. Scalanie tej LoRA dało zaskakująco wyraźne obrazy i doskonałe rozumienie promptów.

Moje własne LoRA są wyłącznie dostępne do zakupu dla moich wspierających na poziomie Creative lub wyższym na Ko-fi.

v1.2

Połączono 22 najnowsze checkpointy.

Siatka specyfikacji (565,6 MB): pobierz

v1.1

Stabilizacja.
Więcej detali.
Jeśli uważasz, że jesteś zaawansowanym użytkownikiem, polecam wersję 1.0. Jeśli znajdzie właściwe ustawienia, potrafi wygenerować dużo bardziej żywe prace.

Siatka specyfikacji (349,7 MB): pobierz

v1.0

Połączono 106 LoRA.
Połączono 19 Checkpointów.

Model może dawać różne rezultaty w zależności od wybranych ustawień, dlatego ważne jest, aby sprawdzić siatkę specyfikacji przed użyciem.
- Ustalono, że użycie kilku konkretnych negatywnych promptów może pomóc rozwiązać problem asymetrycznych oczu lub pikselizacji. Specyfikacja może się różnić w zależności od urządzenia CPU lub GPU, więc używaj jej jako ogólnego odniesienia. Eksperymentuj z kilkoma negatywnymi promptami (np. zez). Trudno jest zadowolić wszystkie ustawienia jednocześnie w miarę wzrostu liczby scalonych LoRA. Proszę jednak skupić się na tej zalecie wersji 1.0, która pozwala tworzyć prace o zadziwiającej jakości w różnych aspektach, przy właściwych ustawieniach. W przyszłości wrócę z bardziej stabilną wersją.
Przydatne wartości ustawień znajdziesz w showcase lub szukając u innych.
Jak zawsze, najlepiej pozostawić puste pole negatywnego promptu dla najlepszych efektów.
Wersja v1.0 wymagała dużo pracy, więc robię teraz przerwę. Mam nadzieję, że model Ci się spodoba, a jeśli scalisz go samodzielnie, podziel się nim w Civitai za darmo. Dzięki temu wszyscy możemy go dalej ulepszać.

Siatka specyfikacji (479,4 MB): pobierz

v0.4

Połączono 132 LoRA.
Połączono 4 Checkpointy.

Siatka specyfikacji: pobierz

v0.3

Ulepszone we wszystkich samplerach.
Osiągnięty realistyczny wygląd.
Stabilizacja.

Siatka specyfikacji: pobierz

v0.2

Znaczne poprawy przejrzystości i detali.
Poprawiona implementacja rąk i stóp.
Znaczne ulepszenia estetyczne; kompozycja, abstrakcja, płynność, światło i kolor itd.

v0.1

Po odpowiednim dostrojeniu modelu SDXL1.0, starannie i celowo scalono ponad 40 wysokiej jakości modeli publicznie dostępnych na Civitai.
Testy koncentrowały się głównie na maksymalnej jakości przy minimalnej liczbie tokenów promptu i nie potwierdzono, jak bardzo jakość może się poprawić przy użyciu dużej liczby tokenów. (Proszę przeprowadzać własne testy i dzielić się wynikami)
Zazwyczaj najpiękniejsze rezultaty uzyskuje się gdzieś pomiędzy realizmem a animacją.
Niemniej jednak, używając odpowiedniego promptu, generalnie nie ma nic, czego nie potrafi wyrazić. (Uważam, że jest to wartościowy model bazowy, który przewyższa inne w łączeniu. Proszę jednak pamiętać, że to obecnie wersja v0.1)

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

Sasha Vicious - Sasha Vicious

Następny

CyberRealistic XL - v5.6

Użyj tego modelu