AlbedoBase XL - v2.0
Powiązane słowa kluczowe i tagi
Zalecane negatywne podpowiedzi
strabismus,asymmetrical eyes,pixelated images
amateur quality, vague shapes, vague texture, wrong perspective, ugly, dowdy style
Zalecane parametry
samplers
steps
cfg
clip skip
resolution
vae
Wskazówki
Jeśli napotkasz błąd polegający na braku generowania, przełącz się na CLIP SKIP 2 lub nieznacznie zmodyfikuj prompt.
Używanie promptów w formie zdań zamiast listy tagów poprawia jakość obrazu.
Pozostawienie pola negatywnego promptu pustym często daje najlepszą jakość obrazów.
Przed użyciem sprawdź specyfikację gridu dla zalecanych ustawień.
Eksperymentuj z kilkoma negatywnymi promptami, by rozwiązać problemy takie jak asymetria oczu lub pikselizacja.
Najważniejsze informacje o wersji
Napisałem własny skrypt, aby zbiec istniejące modele AlbedoBase XL w jeden. Starannie wyrównując wagi wierszy i kolumn wszystkich bloków U-NET i CLIP zgodnie z moją unikalną formułą.
Sponsorzy twórcy
Jeśli model okazał się pomocny, prosimy o wsparcie. Twoja wpłata zostanie przeznaczona wyłącznie na rozwój społeczności SDXL.
Jeśli model okazał się pomocny, prosimy o wsparcie. Twoja wpłata zostanie przeznaczona wyłącznie na rozwój społeczności SDXL.
🙋🏼♂️ dołącz do nas (discord) ㅤ|ㅤ 🛒 zakupㅤ |ㅤ 🌱 darowizna
AlbedoBase XL (SFW&NSFW)
Refiner nie jest potrzebny, VAE jest wbudowane.
CEL
Stable Diffusion XL posiada 3,5 miliarda parametrów (bez Refiner), czyli około 3,6 razy więcej niż wersja SD v1.5. Wierzę, że to nie tylko liczba, ale parametr mogący prowadzić do znaczącej poprawy wydajności.
Od dłuższego czasu zauważamy, że ogólna wydajność SD v1.5 znacznie się poprawiła dzięki ogromnym wkładom naszej społeczności. Dlatego pracuję nad ukończeniem modelu AlbedoBase XL, by optymalnie odwzorować tę poprawę wydajności z v1.5 również w wersji XL.
Moim celem jest bezpośrednie testowanie wydajności wszystkich checkpointów i LoRAs publicznie udostępnionych na Civitai, a następnie łączenie tylko tych zasobów, które zostaną uznane za optymalne po przejściu przez kilka filtrów. To przewyższy wydajność AI generujących obrazy, takich jak Midjourney.
Aktualnie, AlbedoBase XL v3.1 Large połączył około 200 wybranych checkpointów i 251 LoRAs.
LOG
v3.1-Large
• Połączono ponad 50 wybranych najnowszych wersji modeli SDXL za pomocą rekurencyjnego skryptu używanego w V3.
Specyfikacja gridu(370.7 MB): pobierz


v3-mini
Szczerze przepraszam za tak długie oczekiwanie.
Zmagałem się z prywatnymi sprawami, a podczas pracy nad nową wersją również zdrowotnymi problemami. Nawet gdy to piszę, wciąż z tym walczę.
Poczułem, że krótka aktualizacja nie wystarczy, dlatego proszę o wyrozumiałość, gdy dzielę się tym bardziej szczegółowym komunikatem.
Od wydania wersji 2.0 poświęcam się samodzielnej nauce deep learningu. Nie posiadam formalnego wykształcenia, a poza skromnym talentem programistycznym, mam wykształcenie artystyczne. W efekcie brakuje mi matematycznej i naukowej podstawy, by osiągnąć duże przełomy, mimo zaangażowanego czasu i wysiłku. Mimo to doświadczenie samodzielnej nauki i badań jest dla mnie bezcenne.
Ostatnio natrafiłem na pomysł, który może być istotnym przełomem. Po przeróbce setek wzorów i metod od wersji 2.0, udało mi się wypracować dość intrygujący i skuteczny algorytm. Proces łączenia modeli bazował na SDXL1.0 i SD1.5 wraz z innymi starannie dobranymi modelami. Były one podzielone na pięć głównych kategorii: „ANIME”, „REALISM”, „ARTISTIC”, „NSFW” i „BASE”, i podano je jako zestawy danych do algorytmu łączenia. Podejście to przyniosło fascynujące rezultaty.
Jednak, choć opracowanie algorytmu było wyzwaniem, żadna faza nie była tak trudna jak testowanie wydajności. Moje zdrowie fizyczne i psychiczne znacznie się pogorszyło, aż zrozumiałem, że nie mogę kontynuować pracy samodzielnie. To ostatecznie skłoniło mnie do decyzji o wydaniu tej wersji.
Z przyjemnością ogłaszam wydanie wyczekiwanej wersji AlbedoBaseXL V3 Mini. Chociaż model ten jest mniejszą skalą łączenia, nie jest ograniczony do żadnej konkretnej dziedziny i doskonale sprawdza się w różnych obszarach. Może służyć jako nowy model bazowy dla SDXL1.0. (Dla jasności, mój algorytm łączenia nie jest „łączeniem liniowym”, więc można go zasadniczo traktować jak nowy, dostrojony model.)

Ten model, wraz z istniejącymi modelami AlbedoBase, jest wszechstronny i przewyższa poprzednie wersje pod każdym względem. (Treści NSFW, choć nie ekstremalne, oferują szerszy zakres ekspresji niż wcześniejsze wersje takie jak v2.1. Dedykowany model łączeniowy NSFW zostanie wydany w przyszłości.)
Zauważyłem, że wiele udostępnionych modeli ostatnio zaczęło korzystać z licencji zabraniających łączenia lub komercjalizacji zewnętrznej. Było to dla mnie rozczarowujące, ponieważ uniemożliwiło mi użycie niektórych naprawdę doskonałych modeli do łączenia.
Chcę wyrazić szczere podziękowania twórcom modeli, którzy udostępniają bezpłatne licencje, pozwalając na łączenie ich wysokiej jakości modeli, które są wynikiem wielu godzin pracy i wysiłku.
Wkrótce wrócę.
Z niecierpliwością oczekuję waszych testów wydajności w wielu obszarach, w tym ANIME, REALISM, ARTISTIC, 2.5D, 3D i NSFW.
Jako twórcy modeli sadzimy jedynie ziarna. To wy, użytkownicy i artyści modeli, pielęgnujecie je i sprawiacie, że kwitną oraz owocują.
Dziękuję jak zawsze.
Dla tych, którzy chcą wesprzeć moją pracę drobnym datkiem, proszę o skorzystanie z poniższych linków. Obecnie nie mogę znaleźć zatrudnienia i stoję przed niepewną przyszłością finansową.
Specyfikacja gridu(380.5 MB): pobierz


v2.1
Ponowne łączenie i dostosowanie v0.1 do 2.0 przy użyciu nowego algorytmu i formuły łączenia.

Specyfikacja gridu(424.5 MB): pobierz

v2.0
Chciałbym podziękować wszystkim, którzy pomagali mi przy AlbedoBase XL Pre. Bez was data wydania byłaby prawdopodobnie znacznie późniejsza. Bardzo dziękuję!

Napisałem własny skrypt, aby zbiec istniejące modele AlbedoBase XL w jeden. Starannie wyrównując wagi wierszy i kolumn wszystkich bloków U-NET i CLIP zgodnie z moją unikalną formułą.
Jeśli napotkasz błąd przy generowaniu obrazu (gdy nic się nie generuje), przełącz się na CLIP SKIP 2 lub nieco zmodyfikuj prompt! Mogą wystąpić kombinacje promptów, których CLIP nie rozpoznaje. W takim przypadku możesz zmienić kolejność słów, użyć innych słów lub, najprościej, zmienić CLIP SKIP. Stopniowo będę rozwiązywać te problemy w przyszłości, tak jak w v1.3.
Specyfikacja gridu(403.5 MB): pobierz
v1.3
Aby zilustrować jakość związaną z losowością modelu, ustawiłem wartość seed na '9' dla wszystkich obrazów pokazowych przeznaczonych do próbkowania i natychmiastowej generacji.
Szczególnie w tej wersji, ze względu na duży wpływ negatywnych promptów, pozostawienie pola negatywnego promptu pustym prawdopodobnie przyniesie dobrą jakość.
Specyfikacja gridu(438.7 MB): pobierz

Jak widać, wraz ze wzrostem liczby kroków (Steps), staje się to dostępne dla wszystkich samplerów, a jakość także się poprawia.
Dzięki efektowi LoRA, które stworzyłem i połączyłem, jak opisano poniżej, używanie promptów w formie zdań zamiast listy tagów bezpośrednio przekłada się na poprawę jakości.
Połączyłem 45 checkpointów i 7 LoRAs. Następnie kolejno połączyłem AlbedoBase v0.4 i v0.3 w mniej niż 0~5%, by ożywić rozmyte, przestarzałe modele.
Spośród 7 LoRAs jedno zostało stworzone przeze mnie. Polega ono na analizie i opisaniu 174 zdjęć wysokiej jakości przy użyciu GPT4-V. Połączenie tej LoRA skutkowało zadziwiająco klarownymi obrazami i wyjątkowym zrozumieniem promptów.

Moje własne LoRAs są dostępne wyłącznie do zakupu dla moich wspierających na poziomie Creative lub wyższym.
v1.2
Połączono 22 najnowsze checkpointy.
Specyfikacja gridu(565.6 MB): pobierz
v1.1
Stabilizacja.
Bardziej szczegółowe.
Jeśli jesteś zaawansowanym użytkownikiem, polecam wersję 1.0. Jeśli w wersji 1.0 znajdziesz odpowiednie ustawienia, może generować dużo bardziej żywe dzieła.
Specyfikacja gridu(349.7 MB): pobierz
v1.0
Połączono 106 LoRAs.
Połączono 19 checkpointów.
Model może generować różne wyniki w zależności od wybranych ustawień, więc ważne jest, aby sprawdzić specyfikację gridu przed użyciem.
Zauważyłem, że użycie kilku specyficznych negatywnych promptów może pomóc rozwiązać problem asymetrycznych oczu lub pikselizacji. Specyfikacja gridu może się różnić w zależności od CPU lub GPU, więc traktuj ją jako ogólne odniesienie. Eksperymentuj z negatywnymi promptami, aby poprawić jakość (np. zez). Trudno zadowolić wszystkie ustawienia równocześnie wraz ze wzrostem liczby łączonych LoRA. Jednak chciałbym, abyś skupił się na tej zalecie wersji 1.0, ponieważ może generować dzieła o niesamowitej jakości w różnych aspektach przy odpowiednich ustawieniach. Wrócę z bardziej stabilną wersją w przyszłości.
Przydatne wartości ustawień można znaleźć na showcase lub wyszukując u innych użytkowników.
Jak zawsze, najlepiej pozostawić negatywny prompt pusty dla najlepszych rezultatów.
Wersja v1.0 wymagała dużo pracy, więc robię teraz przerwę. Mam nadzieję, że model przypadnie wam do gustu, a jeśli go połączycie, udostępnijcie za darmo na Civitai, byśmy wszyscy mogli go dalej rozwijać.
Specyfikacja gridu(479.4 MB): pobierz
v0.4
Połączono 132 LoRAs.
Połączono 4 checkpointy.
Specyfikacja gridu: pobierz
v0.3
Poprawiono wszystkie samplery.
Osiągnięto realistyczny realizm.
Stabilizacja.
Specyfikacja gridu: pobierz
v0.2
Znaczna poprawa klarowności i szczegółowości.
Ulepszenie implementacji rąk i stóp.
Główne ulepszenia estetyczne: kompozycja, abstrakcja, płynność, światło i kolor itd.
v0.1
Po odpowiednim dostrojeniu modelu SDXL1.0, starannie i celowo połączono ponad 40 wysokiej jakości modeli dostępnych publicznie na Civitai.
Testy skupiały się głównie na zapewnieniu maksymalnej jakości przy minimalnej liczbie tokenów promptu, nie potwierdzono, jak bardzo jakość może się poprawić przy użyciu dużej liczby tokenów. (Proszę przeprowadzać własne testy i dzielić się wynikami)
Zazwyczaj najbardziej estetyczne rezultaty osiąga się na granicy między realizmem a animacją.
Niemniej jednak przy właściwym promptcie, generalnie nie ma rzeczy, której by nie potrafił wyrazić. (Twierdzę, że posiada dużą wartość jako model bazowy przewyższający inne w łączeniu. Jednak pamiętaj, że to obecnie v0.1)
Szczegóły modelu
Dyskusja
Proszę się log in, aby dodać komentarz.



