modele/Animagine XL V3.1 - v3.1

Animagine XL V3.1 - v3.1

7/21/2025

1:32:11 PM

Powiązane słowa kluczowe i tagi

animagine xl 3.1,animagine xl v3.1,anime,postacie anime,generowanie obrazów anime,model tekst na obraz w stylu anime,model bazowy,cagliostrolab,checkpoint,sdxl 1.0,stable diffusion xl,v3.1

Portret kobiety o ognistoczerwonych włosach i świecących czerwonych oczach otoczonych wirującymi płomieniami, widoczna górna część ciała z odkrytymi ramionami.

Pełny widok sylwetki ucznia w czarnym mundurku gakuran z zieloną koszulą, stojącego na zewnątrz na chodniku pokrytym jesiennymi liśćmi, patrzącego w górę, trzymającego torbę, w towarzystwie czarnego kota.

Dojrzała blondynka z wielobarwnymi włosami i migoczącymi ognistymi oczami, nosząca okulary bez oprawek oraz czarny garnitur z czerwonym podkoszulkiem i krawatem, otoczona wirującymi płomieniami i iskrami.

Asuka Langley, postać z anime, stoi pewnie w błyszczącym czerwonym kombinezonie z długimi brązowymi włosami, uśmiechając się pośród zrujnowanych budynków miejskich pod niebieskim niebem.

Zbliżony portret dziewczyny anime z wilczymi uszami, opadającymi czarno-pomarańczowymi włosami, czerwonymi oczami, ubranej w czarną sukienkę z odkrytymi ramionami, stojącej na deszczowej ulicy miejskiej.

Mroczny fantastyczny rycerz nekromanta w zakrwawionej zbroi trzymający miecz w pozycji parowania na deszczowej średniowiecznej polu bitwy z dużym pełnym czerwonym księżycem i płonącymi budynkami w tle.

Czerwono-czarny szkic smoka górującego nad osobą w deszczu w nocy.

Kolorowa cyberpunkowa dziewczyna z niebieskimi i pomarańczowymi włosami w żywym kombinezonie, przedstawiona w dynamicznym stylu komiksowym z abstrakcyjnym tłem.

Piękny widok krajobrazu z niebieskim niebem, górskim płaskowyżem z zielonymi polami, otoczonym chmurami i odległą doliną.

Piękny ręcznie malowany rysunek tuszem i akwarelą przedstawiający dziewczynę o siwych włosach w dwóch kucykach trzymającą uroczego kurczaka na tle deszczu i kapiących chmur.

Futurystyczna wojowniczka w egzoszkielecie o motywie miko, nosząca maskę gazową i dzierżąca świecące czerwone ostrze, oświetlona kinowym światłem w mrocznym krajobrazie miejskim.

Futurystyczny krajobraz oświetlony neonami, inspirowany cyberpunkowym anime lat 90., przedstawiający samotną postać spoglądającą na duże budynki pokryte neonami pośród wzgórz o zmierzchu w Texas.

Zalecane podpowiedzi

masterpiece, best quality, very aesthetic, absurdres

outdoors, masterpiece, very aesthetic, best quality, absurdres

Zalecane negatywne podpowiedzi

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

nsfw, worst quality, low quality

Zalecane parametry

samplers

Euler Ancestral (Euler a), Euler a

steps

28 - 30

cfg

5 - 7

resolution

1024x1024, 1152x896, 896x1152, 1216x832, 832x1216, 1344x768, 768x1344, 1536x640, 640x1536, 896x1152, 1216x832

other models

animagine-xl-3.1 (9f86289b6a)

Zalecane parametry wysokiej rozdzielczości

upscaler

Latent (nearest-exact), R-ESRGAN 4x+ Anime6B

upscale

1.5

steps

15 - 30

denoising strength

0.4 - 0.55

Wskazówki

Używaj ustrukturyzowanego szablonu prompta: '1girl/1boy, nazwa postaci, z jakiej serii, wszystko inne w dowolnej kolejności.'

Używaj specjalnych tagów jakości, oceny, roku i estetyki, aby dokładniej kontrolować wyniki generowania.

Model jest zoptymalizowany pod kątem tagów w stylu Danbooru, a nie naturalnego języka.

Dla lepszej jakości stosuj niższy CFG Scale około 5-7 oraz mniej niż 30 kroków próbkowania.

Tagi estetyczne pochodzą z wyspecjalizowanego modelu klasyfikacji obrazów ViT trenowanego na danych anime.

Sponsorzy twórcy

Dołącz do serwera Cagliostro Lab Discord: https://discord.gg/cqh9tZgbGc

Jeśli chcesz nas wesprzeć lub postawić kawę, możesz przekazać darowiznę tutaj

Bardzo dziękujemy ^_^

Animagine XL 3.1 to aktualizacja serii Animagine XL V3, ulepszająca poprzednią wersję, Animagine XL 3.0. Ten otwartoźródłowy model tekst-na-obraz o tematyce anime został usprawniony, aby generować obrazy w stylu anime o wyższej jakości. Zawiera szerszy zakres postaci z dobrze znanych serii anime, zoptymalizowany zbiór danych oraz nowe tagi estetyczne dla lepszej tworzenia obrazów. Stworzony na bazie Stable Diffusion XL, Animagine XL 3.1 ma na celu być cennym zasobem dla fanów anime, artystów i twórców treści, dostarczając dokładnych i szczegółowych reprezentacji postaci anime.

Szczegóły modelu

Opracowany przez: Cagliostro Research Lab
We współpracy z: SeaArt.ai
Typ modelu: Model generatywny tekst-na-obraz oparty na dyfuzji
Opis modelu: Animagine XL 3.1 generuje wysokiej jakości obrazy anime na podstawie tekstowych zapytań. Charakteryzuje się ulepszoną anatomią dłoni, lepszym zrozumieniem koncepcji oraz zaawansowaną interpretacją zapytań.
Licencja: Fair AI Public License 1.0-SD
Wytrenowany na bazie: Animagine XL 3.0

Zalecenia dotyczące użytkowania

Kolejność tagów

Dla optymalnych rezultatów zaleca się użycie odpowiednio zorganizowanego szablonu prompta, ponieważ na taki sposób model był trenowany:

1girl/1boy, nazwa postaci, z jakiej serii, wszystko inne w dowolnej kolejności.

Specjalne tagi

Animagine XL 3.1 korzysta ze specjalnych tagów, które kierują wynik pod względem jakości, oceny, daty utworzenia i estetyki. Chociaż model może generować obrazy bez tych tagów, ich użycie pomaga osiągnąć lepsze efekty.

Modyfikatory jakości

Tagi jakości teraz biorą pod uwagę zarówno oceny, jak i post-ratingi, aby zapewnić zrównoważony rozkład jakości. Poprawiono oznaczenia dla większej przejrzystości, np. zmieniając 'high quality' na 'great quality'.


Modyfikator jakości	Kryterium oceny
masterpiece	        > 95%
best quality	        > 85% & ≤ 95%
great quality	        > 75% & ≤ 85%
good quality	        > 50% & ≤ 75%
normal quality	        > 25% & ≤ 50%
low quality	        > 10% & ≤ 25%
worst quality	        ≤ 10%

Modyfikatory oceny

Uprościliśmy tagi oceny dla większej jasności i globalnych zasad stosowanych w różnych modelach. Na przykład tag 'rating: general' jest teraz po prostu 'general', a 'rating: sensitive' został skrócony do 'sensitive'.


Modyfikator oceny	    Kryterium oceny
safe	            General
sensitive	    Sensitive
nsfw	            Questionable
explicit, nsfw	    Explicit

Modyfikator roku

Zdefiniowaliśmy na nowo zakresy lat, aby precyzyjniej kierować wyniki w stronę konkretnych stylów anime – nowoczesnych lub vintage. Ta aktualizacja upraszcza zakres i skupia się na istotności względem aktualnych i przeszłych epok.


Tag roku	Zakres lat
newest	        2021 do 2024
recent	        2018 do 2020
mid	        2015 do 2017
early	        2011 do 2014
oldest	        2005 do 2010

Tagi estetyczne

Ulepszyliśmy system tagowania o tagi estetyczne, które pomagają w kategoryzacji treści na podstawie atrakcyjności wizualnej. Tagi te pochodzą z oceny specjalistycznego modelu klasyfikacji obrazów ViT (Vision Transformer), trenowanego na danych anime. Do tego celu wykorzystaliśmy model shadowlilac/aesthetic-shadow-v2, który ocenia wartość estetyczną treści przed treningiem. Zapewnia to, że każda treść jest nie tylko trafna i dokładna, ale także wizualnie atrakcyjna.


Tag estetyczny	       Zakres oceny
very aesthetic	       > 0.71
aesthetic	       > 0.45 & < 0.71
displeasing	       > 0.27 & < 0.45
very displeasing       ≤ 0.27

Zalecane ustawienia

Aby nakierować model na generowanie obrazów o wysokiej estetyce, używaj negatywnych promptów takich jak:

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

Dla wyższej jakości efektów, poprzedzaj prompt takimi frazami:

masterpiece, best quality, very aesthetic, absurdres

Zaleca się stosowanie niższej wartości classifier-free guidance (CFG Scale) około 5-7, kroków próbkowania poniżej 30 oraz użycie Euler Ancestral (Euler a) jako samplera.

Rozdzielczości wieloaspektowe

Model wspiera generowanie obrazów w następujących rozmiarach:

Wymiary	Proporcje obrazu
1024 x 1024	1:1 Kwadrat
1152 x 896	9:7
896 x 1152	7:9
1216 x 832	19:13
832 x 1216	13:19
1344 x 768	7:4 Poziomo
768 x 1344	4:7 Pionowo
1536 x 640	12:5 Poziomo
640 x 1536	5:12 Pionowo

Podziękowania

Rozwój i wydanie Animagine XL 3.1 nie byłyby możliwe bez nieocenionego wkładu i wsparcia następujących osób i organizacji:

SeaArt.ai: Nasz partner i sponsor współpracy.
Shadow Lilac: Dostawca modelu klasyfikacji estetycznej, aesthetic-shadow-v2.
Derrian Distro: Za dostarczenie własnego planera szybkości uczenia się, zaadaptowanego z LoRA Easy Training Scripts.
Kohya SS: Za ich kompleksowe skrypty treningowe.
Współpracownicy Cagliostrolab: Za ich zaangażowanie w trening modelu, zarządzanie projektem i kurację danych.
Wczesni testerzy: Za wartościowy feedback i wsparcie kontroli jakości.
NovelAI: Za innowacyjne podejście do tagowania estetycznego, które było inspiracją dla naszej implementacji.

Dziękujemy wszystkim za wsparcie i wiedzę przy przesuwaniu granic generowania obrazów w stylu anime.

Ograniczenia

Choć Animagine XL 3.1 stanowi znaczący postęp w generowaniu obrazów w stylu anime, ważne jest uznanie jego ograniczeń:

Skupienie na anime: Model jest specjalnie zaprojektowany do generowania obrazów w stylu anime i nie nadaje się do tworzenia realistycznych zdjęć.
Złożoność promptów: Model może nie dostarczać wysokiej jakości wyników przy krótkich lub prostych promptach. Trening skupiał się na zrozumieniu koncepcji, a nie na precyzyjnym dostrojeniu estetycznym, co wymaga bardziej szczegółowych i konkretnych promptów dla oczekiwanych rezultatów.
Format promptu: Animagine XL 3.1 jest zoptymalizowany pod kątem tagów w stylu Danbooru, a nie naturalnych poleceń językowych. Dla najlepszych efektów zaleca się użycie odpowiednich tagów i składni.
Anatomia i renderowanie dłoni: Pomimo ulepszeń, wciąż mogą się zdarzać przypadki, gdzie model produkuje suboptymalne wyniki w tych obszarach.
Rozmiar zbioru danych: Zbiór danych użyty do trenowania Animagine XL 3.1 liczy około 870 000 obrazów. Połączenie z poprzednim zbiorem (1,2 miliona) daje łącznie około 2,1 miliona obrazów. Pomimo dużej skali, może to być wciąż ograniczone dla tzw. "ostatecznego" modelu anime.
Zawartość NSFW: Animagine XL 3.1 został zaprojektowany do generowania bardziej zrównoważonych treści NSFW. Jednak model może wciąż wygenerować treści NSFW, nawet bez wyraźnego promptu na to.

Uznając te ograniczenia, pragniemy zapewnić przejrzystość i realne oczekiwania wobec użytkowników Animagine XL 3.1. Mimo tych ograniczeń uważamy, że model stanowi duży krok naprzód w generowaniu obrazów w stylu anime i oferuje potężne narzędzie dla artystów, projektantów i entuzjastów.

Licencja

Opierając się na Animagine XL 3.0, Animagine XL 3.1 podlega licencji Fair AI Public License 1.0-SD, która jest zgodna z licencją modeli Stable Diffusion. Kluczowe punkty:

Udostępnianie modyfikacji: Jeśli modyfikujesz Animagine XL 3.1, musisz udostępnić zarówno zmiany, jak i oryginalną licencję.
Dostępność kodu źródłowego: Jeśli twoja zmodyfikowana wersja jest dostępna w sieci, zapewnij sposób (np. link do pobrania) na uzyskanie kodu źródłowego. Dotyczy to również modeli pochodnych.
Warunki dystrybucji: Każda dystrybucja musi odbywać się na tej licencji lub innej z podobnymi zasadami.
Zgodność: Braki w zgodności muszą być naprawione w ciągu 30 dni, aby uniknąć zakończenia licencji, co podkreśla przejrzystość i przestrzeganie wartości open-source.

Wybór tej licencji ma na celu utrzymanie Animagine XL 3.1 otwartym i modyfikowalnym, zgodnie z duchem społeczności open source. Chroni to współtwórców i użytkowników, zachęcając do współpracy i etycznego rozwoju społeczności open source. Zapewnia, że model nie tylko korzysta z wkładu społeczności, ale także szanuje wolności rozwoju open source.

Wreszcie serwer Cagliostro Lab otwarty publicznie: https://discord.gg/cqh9tZgbGc

Zapraszamy do dołączenia na nasz serwer Discord.
Jeśli chcesz nas wesprzeć lub postawić kawę, możesz przekazać darowiznę tutaj

Bardzo dziękujemy ^_^

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

Cybernetyczne Roboty - v1.0

Następny

✨ Lazy Embeddings dla WSZYSTKICH znanych modeli NoobAI Pony SDXL LazyPositive LazyNegative (Pozytywne i Negatywne plus więcej!) - lazyhand

Użyj tego modelu