Animagine XL V3.1 - v3.1
Zalecane podpowiedzi
masterpiece, best quality, very aesthetic, absurdres
outdoors, masterpiece, very aesthetic, best quality, absurdres
Zalecane negatywne podpowiedzi
nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]
nsfw, worst quality, low quality
Zalecane parametry
samplers
steps
cfg
resolution
other models
Zalecane parametry wysokiej rozdzielczości
upscaler
upscale
steps
denoising strength
Wskazówki
Używaj ustrukturyzowanego szablonu prompta: '1girl/1boy, nazwa postaci, z jakiej serii, wszystko inne w dowolnej kolejności.'
Używaj specjalnych tagów jakości, oceny, roku i estetyki, aby dokładniej kontrolować wyniki generowania.
Model jest zoptymalizowany pod kątem tagów w stylu Danbooru, a nie naturalnego języka.
Dla lepszej jakości stosuj niższy CFG Scale około 5-7 oraz mniej niż 30 kroków próbkowania.
Tagi estetyczne pochodzą z wyspecjalizowanego modelu klasyfikacji obrazów ViT trenowanego na danych anime.
Sponsorzy twórcy
Dołącz do serwera Cagliostro Lab Discord: https://discord.gg/cqh9tZgbGc
Jeśli chcesz nas wesprzeć lub postawić kawę, możesz przekazać darowiznę tutaj
Bardzo dziękujemy ^_^
Animagine XL 3.1 to aktualizacja serii Animagine XL V3, ulepszająca poprzednią wersję, Animagine XL 3.0. Ten otwartoźródłowy model tekst-na-obraz o tematyce anime został usprawniony, aby generować obrazy w stylu anime o wyższej jakości. Zawiera szerszy zakres postaci z dobrze znanych serii anime, zoptymalizowany zbiór danych oraz nowe tagi estetyczne dla lepszej tworzenia obrazów. Stworzony na bazie Stable Diffusion XL, Animagine XL 3.1 ma na celu być cennym zasobem dla fanów anime, artystów i twórców treści, dostarczając dokładnych i szczegółowych reprezentacji postaci anime.
Szczegóły modelu
Opracowany przez: Cagliostro Research Lab
We współpracy z: SeaArt.ai
Typ modelu: Model generatywny tekst-na-obraz oparty na dyfuzji
Opis modelu: Animagine XL 3.1 generuje wysokiej jakości obrazy anime na podstawie tekstowych zapytań. Charakteryzuje się ulepszoną anatomią dłoni, lepszym zrozumieniem koncepcji oraz zaawansowaną interpretacją zapytań.
Licencja: Fair AI Public License 1.0-SD
Wytrenowany na bazie: Animagine XL 3.0
Zalecenia dotyczące użytkowania
Kolejność tagów
Dla optymalnych rezultatów zaleca się użycie odpowiednio zorganizowanego szablonu prompta, ponieważ na taki sposób model był trenowany:
1girl/1boy, nazwa postaci, z jakiej serii, wszystko inne w dowolnej kolejności.
Specjalne tagi
Animagine XL 3.1 korzysta ze specjalnych tagów, które kierują wynik pod względem jakości, oceny, daty utworzenia i estetyki. Chociaż model może generować obrazy bez tych tagów, ich użycie pomaga osiągnąć lepsze efekty.
Modyfikatory jakości
Tagi jakości teraz biorą pod uwagę zarówno oceny, jak i post-ratingi, aby zapewnić zrównoważony rozkład jakości. Poprawiono oznaczenia dla większej przejrzystości, np. zmieniając 'high quality' na 'great quality'.
Modyfikator jakości Kryterium oceny
masterpiece > 95%
best quality > 85% & ≤ 95%
great quality > 75% & ≤ 85%
good quality > 50% & ≤ 75%
normal quality > 25% & ≤ 50%
low quality > 10% & ≤ 25%
worst quality ≤ 10%Modyfikatory oceny
Uprościliśmy tagi oceny dla większej jasności i globalnych zasad stosowanych w różnych modelach. Na przykład tag 'rating: general' jest teraz po prostu 'general', a 'rating: sensitive' został skrócony do 'sensitive'.
Modyfikator oceny Kryterium oceny
safe General
sensitive Sensitive
nsfw Questionable
explicit, nsfw ExplicitModyfikator roku
Zdefiniowaliśmy na nowo zakresy lat, aby precyzyjniej kierować wyniki w stronę konkretnych stylów anime – nowoczesnych lub vintage. Ta aktualizacja upraszcza zakres i skupia się na istotności względem aktualnych i przeszłych epok.
Tag roku Zakres lat
newest 2021 do 2024
recent 2018 do 2020
mid 2015 do 2017
early 2011 do 2014
oldest 2005 do 2010Tagi estetyczne
Ulepszyliśmy system tagowania o tagi estetyczne, które pomagają w kategoryzacji treści na podstawie atrakcyjności wizualnej. Tagi te pochodzą z oceny specjalistycznego modelu klasyfikacji obrazów ViT (Vision Transformer), trenowanego na danych anime. Do tego celu wykorzystaliśmy model shadowlilac/aesthetic-shadow-v2, który ocenia wartość estetyczną treści przed treningiem. Zapewnia to, że każda treść jest nie tylko trafna i dokładna, ale także wizualnie atrakcyjna.
Tag estetyczny Zakres oceny
very aesthetic > 0.71
aesthetic > 0.45 & < 0.71
displeasing > 0.27 & < 0.45
very displeasing ≤ 0.27Zalecane ustawienia
Aby nakierować model na generowanie obrazów o wysokiej estetyce, używaj negatywnych promptów takich jak:
nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]
Dla wyższej jakości efektów, poprzedzaj prompt takimi frazami:
masterpiece, best quality, very aesthetic, absurdres
Zaleca się stosowanie niższej wartości classifier-free guidance (CFG Scale) około 5-7, kroków próbkowania poniżej 30 oraz użycie Euler Ancestral (Euler a) jako samplera.
Rozdzielczości wieloaspektowe
Model wspiera generowanie obrazów w następujących rozmiarach:
Wymiary Proporcje obrazu
1024 x 1024 1:1 Kwadrat
1152 x 896 9:7
896 x 1152 7:9
1216 x 832 19:13
832 x 1216 13:19
1344 x 768 7:4 Poziomo
768 x 1344 4:7 Pionowo
1536 x 640 12:5 Poziomo
640 x 1536 5:12 PionowoPodziękowania
Rozwój i wydanie Animagine XL 3.1 nie byłyby możliwe bez nieocenionego wkładu i wsparcia następujących osób i organizacji:
SeaArt.ai: Nasz partner i sponsor współpracy.
Shadow Lilac: Dostawca modelu klasyfikacji estetycznej, aesthetic-shadow-v2.
Derrian Distro: Za dostarczenie własnego planera szybkości uczenia się, zaadaptowanego z LoRA Easy Training Scripts.
Kohya SS: Za ich kompleksowe skrypty treningowe.
Współpracownicy Cagliostrolab: Za ich zaangażowanie w trening modelu, zarządzanie projektem i kurację danych.
Wczesni testerzy: Za wartościowy feedback i wsparcie kontroli jakości.
NovelAI: Za innowacyjne podejście do tagowania estetycznego, które było inspiracją dla naszej implementacji.
Dziękujemy wszystkim za wsparcie i wiedzę przy przesuwaniu granic generowania obrazów w stylu anime.
Ograniczenia
Choć Animagine XL 3.1 stanowi znaczący postęp w generowaniu obrazów w stylu anime, ważne jest uznanie jego ograniczeń:
Skupienie na anime: Model jest specjalnie zaprojektowany do generowania obrazów w stylu anime i nie nadaje się do tworzenia realistycznych zdjęć.
Złożoność promptów: Model może nie dostarczać wysokiej jakości wyników przy krótkich lub prostych promptach. Trening skupiał się na zrozumieniu koncepcji, a nie na precyzyjnym dostrojeniu estetycznym, co wymaga bardziej szczegółowych i konkretnych promptów dla oczekiwanych rezultatów.
Format promptu: Animagine XL 3.1 jest zoptymalizowany pod kątem tagów w stylu Danbooru, a nie naturalnych poleceń językowych. Dla najlepszych efektów zaleca się użycie odpowiednich tagów i składni.
Anatomia i renderowanie dłoni: Pomimo ulepszeń, wciąż mogą się zdarzać przypadki, gdzie model produkuje suboptymalne wyniki w tych obszarach.
Rozmiar zbioru danych: Zbiór danych użyty do trenowania Animagine XL 3.1 liczy około 870 000 obrazów. Połączenie z poprzednim zbiorem (1,2 miliona) daje łącznie około 2,1 miliona obrazów. Pomimo dużej skali, może to być wciąż ograniczone dla tzw. "ostatecznego" modelu anime.
Zawartość NSFW: Animagine XL 3.1 został zaprojektowany do generowania bardziej zrównoważonych treści NSFW. Jednak model może wciąż wygenerować treści NSFW, nawet bez wyraźnego promptu na to.
Uznając te ograniczenia, pragniemy zapewnić przejrzystość i realne oczekiwania wobec użytkowników Animagine XL 3.1. Mimo tych ograniczeń uważamy, że model stanowi duży krok naprzód w generowaniu obrazów w stylu anime i oferuje potężne narzędzie dla artystów, projektantów i entuzjastów.
Licencja
Opierając się na Animagine XL 3.0, Animagine XL 3.1 podlega licencji Fair AI Public License 1.0-SD, która jest zgodna z licencją modeli Stable Diffusion. Kluczowe punkty:
Udostępnianie modyfikacji: Jeśli modyfikujesz Animagine XL 3.1, musisz udostępnić zarówno zmiany, jak i oryginalną licencję.
Dostępność kodu źródłowego: Jeśli twoja zmodyfikowana wersja jest dostępna w sieci, zapewnij sposób (np. link do pobrania) na uzyskanie kodu źródłowego. Dotyczy to również modeli pochodnych.
Warunki dystrybucji: Każda dystrybucja musi odbywać się na tej licencji lub innej z podobnymi zasadami.
Zgodność: Braki w zgodności muszą być naprawione w ciągu 30 dni, aby uniknąć zakończenia licencji, co podkreśla przejrzystość i przestrzeganie wartości open-source.
Wybór tej licencji ma na celu utrzymanie Animagine XL 3.1 otwartym i modyfikowalnym, zgodnie z duchem społeczności open source. Chroni to współtwórców i użytkowników, zachęcając do współpracy i etycznego rozwoju społeczności open source. Zapewnia, że model nie tylko korzysta z wkładu społeczności, ale także szanuje wolności rozwoju open source.
Wreszcie serwer Cagliostro Lab otwarty publicznie: https://discord.gg/cqh9tZgbGc
Zapraszamy do dołączenia na nasz serwer Discord.
Jeśli chcesz nas wesprzeć lub postawić kawę, możesz przekazać darowiznę tutaj
Bardzo dziękujemy ^_^
Szczegóły modelu
Dyskusja
Proszę się log in, aby dodać komentarz.
