modele/Stabilizer IL/NAI - illus01 v1.72

Stabilizer IL/NAI - illus01 v1.72

9/30/2025

1:07:02 PM

Powiązane słowa kluczowe i tagi

dora,dostrojony model bazowy,wysoki kontrast,illus01 v1.72,wspaniały,oświetlenie,lora,naturalne tekstury,noobai,przeuczenie,zrozumienie podpowiedzi,reakaakasky,stabilizator,stabilizer il/nai,styl

Antro mieszaniec jelenia o czerwonych włosach trzymająca duży rozdarty zielony parasol, ubrana w sukienkę z liści, stojąca w lesie iglastym pod pochmurnym niebem, ptaki siedzą na jej porożu w gnieździe.

Kawaii młoda kobieta z jasnoblond włosami i niebieskimi oczami, uśmiechająca się podekscytowana, trzyma dwa rożki lodów na miejskiej ulicy w pastelowych barwach.

Zalecane podpowiedzi

<lora:illustriousXL_stabilizer_v1.72:0.8>1girl, masterpiece

Zalecane parametry

samplers

Euler a

steps

24 - 25

cfg

3 - 5.5

resolution

1024x1024, 832x1216

other models

illustriousXL_stabilizer_v1.72 (632563d18bb8), illustriousXL_v01 (3e15ba0038), waiNSFWIllustrious_v120 (89cb4ec0a9)

Zalecane parametry wysokiej rozdzielczości

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.5

denoising strength

0.25

Wskazówki

Najpierw ładuj tę LoRĘ w swojej kolejce LoR, aby zminimalizować nieoczekiwane zmiany spowodowane dynamicznymi wagami łatki w architekturze DoRA.

Używaj jako dostrojony model bazowy, stosując pełną siłę na wytrenowanym modelu bazowym dla najlepszych naturalnych detali i kontroli stylu.

Bądź ostrożny przy nakładaniu na mocno wystylizowane modele bazowe, ponieważ może to pogorszyć pożądane efekty.

Model nie może dodać naturalnych detali do modeli bazowych silnie przeuczonych na styl AI.

Unikaj opinii w systemie recenzji Civitai; zostawiaj komentarze w dostępnej sekcji komentarzy dla lepszej widoczności.

Używaj uzupełniających LoR, takich jak Dark, Contrast Controller i Style Strength Controller, do dodatkowej regulacji otoczenia i stylu.

Sponsorzy twórcy

Znajdź mnie na TensorArt

Najnowsza aktualizacja:

(9/7/2025) Znajdziesz mnie na TensorArt.

Stabilizer

To jest mój dostrojony model bazowy, ale w formie LoRA.

Ten dostrojony model bazowy:

Skupia się na kreatywności, a nie na stałym stylu. Zbiór danych jest bardzo zróżnicowany. Ten model nie ma domyślnego stylu (uprzedzenia), który ogranicza kreatywność.
Tylko naturalne tekstury, oświetlenie i najdrobniejsze detale. Brak plastikowego stylu AI. (Te same twarze AI, fryzury, gładkie powierzchnie bez tekstury itp.). Każde zdjęcie w zbiorze danych zostało przeze mnie starannie wybrane. Zero obrazów AI w zbiorze.
Mniej zdeformowanych obrazów. Bardziej logiczne. Lepsze tło i kompozycja.
Lepsze rozumienie prompta. Trening z naturalnymi napisami w języku naturalnym.
(v-pred) Lepsze i zrównoważone oświetlenie, wysoki kontrast. Czysta czerń 0 i biel 255 mogą znajdować się na tym samym obrazie, nawet w tym samym miejscu, ale bez przepełnień i przesycenia.

Obrazy na okładkę są surowymi wynikami, w domyślnej rozdzielczości 1MP. Bez skalowania, wtyczek, czy poprawiania malowania. Z metadanymi, 100% odtwarzalne.

Style na obrazach okładkowych pochodzą z wytrenowanego modelu bazowego, wywoływanego promptem. Nie pochodzą z mojego zbioru danych. Widać, że wytrenowany model zna te style, ale nie potrafi ich poprawnie wygenerować z powodu przeuczenia na danych anime. Ten model rozwiązał problem przeuczenia. Zobacz sekcję "jak i dlaczego to działa" poniżej.

Dlaczego brak domyślnego stylu?

Co to jest "domyślny styl": jeśli model ma domyślny styl (uprzedzenie), oznacza to, że niezależnie od prompta model musi generować te same elementy (twarze, tła, nastrój), które tworzą ten styl.
Zalety: jest łatwy w użyciu, nie musisz już wpisywać stylu w prompt.
Wady: nie możesz go nadpisać. Jeśli wpiszesz coś, co nie pasuje do domyślnego stylu, model po prostu to zignoruje. Styl domyślny zawsze będzie dominował i mieszał się z innymi stylami.
"brak domyślnego stylu" oznacza brak uprzedzenia, musisz określić styl, który chcesz, przez tagi lub LoRA. Nie będzie mieszania ani zanieczyszczenia stylami z tego modelu. Otrzymujesz styl dokładnie taki, jak zamierzałeś.

Dlaczego ten "dostrojony model bazowy" jest LoRĄ?

Nie jestem gigachadem i nie mam milionów obrazów treningowych. Dostrojenie całego modelu bazowego nie jest konieczne, wystarczy LoRA.
Oszczędzam dużo VRAM, więc mogę użyć większego batcha.
Musisz tylko pobrać mały plik 40MiB zamiast ogromnego punktu kontrolnego 7GiB, co oszczędza 99,4% danych i miejsca. ~~Dlatego mogę często to aktualizować~~.
Ta LoRA może wydawać się mała, ale jest potężna. Używa nowej architektury DoRA od Nvidii, która jest bardziej wydajna niż tradycyjna LoRA.

Jak zdobyć ten "dostrojony model bazowy"?

Prosto.

wytrenowany model bazowy + ta LoRA = "dostrojony model bazowy"

Wczytaj tę LoRĘ na wytrenowany model bazowy z pełną siłą. Wtedy wytrenowany model bazowy stanie się dostrojonym modelem bazowym. Zobacz "Jak używać" poniżej.

Udostępnianie mergów z tym modelem jest zabronione. Dla informacji, istnieją ukryte słowa wyzwalające, które drukują niewidoczny znak wodny. Sam zakodowałem znak wodny i detektor. Nie chcę go używać, ale mogę.

Ten model jest publikowany tylko na Civitai i TensorArt. Jeśli widzisz „mnie” i ten tekst na innych platformach, to są fałszywe i platforma, której używasz, jest piracka.

Zostaw opinię w sekcji komentarzy, aby każdy mógł ją zobaczyć. Nie pisz opinii w systemie recenzji Civitai, był tak źle zaprojektowany, że nikt nie może ich łatwo znaleźć ani zobaczyć.

Jak używać

Najnowsze wersje:

nbvp10 v0.271 (trenowany na NoobAI v-pred v1.0).
- Dokładne kolory i najdrobniejsze detale. To jak dotąd najlepszy model.
nbep10 v0.273 (trenowany na NoobAI eps v1.0). Wycofany.
- Mniejsze nasycenie i kontrast w porównaniu do modeli v-pred. Z powodu „małej wady konstrukcyjnej” standardowego epsylonu (eps). Ogranicza zakres kolorów modelu. Dlatego mamy później v-pred.
illus01 v1.198 (trenowany na Illustrious v0.1). Wycofany.
- Po prostu za stary...

Uwaga: najpierw ładuj tę LoRĘ w swojej kolejce LoR.

Ta LoRA używa nowej architektury DoRA od Nvidii, która jest bardziej wydajna niż tradycyjna LoRA. Jednak w przeciwieństwie do tradycyjnej LoRY ze statycznym wagami łatki, w DoRA wagi łatki są dynamicznie obliczane na podstawie wagi obecnie załadowanego modelu bazowego (która zmienia się przy ładowaniu LoR). Aby zminimalizować nieoczekiwane zmiany, ładuj tę LoRĘ jako pierwszą.

Dwa sposoby użycia tego modelu:

1). Użyj jako dostrojony model bazowy (zalecane):

Jeśli chcesz najdrobniejsze i naturalne detale oraz zbudować kombinację stylów, którą chcesz, z pełną kontrolą.

Po prostu ładuj tę LoRĘ najpierw na wytrenowany model bazowy z pełną siłą. Wtedy model bazowy stanie się dostrojonym modelem bazowym.

2). Użyj jako LoRA na innym dostrojonym modelu bazowym.

Bo czemu nie, to w końcu LoRA.

Rzeczy do zapamiętania:

Ważne: jeśli używasz modelu bazowego "illustrious". Musisz sprawdzić, na jakim wytrenowanym modelu bazowym naprawdę oparty jest twój model. Większość popularnych modeli "illustrious" anime jest oparta na (lub bliska) NoobAI, nie illustrious. Więcej informacji (dlaczego te modele są błędnie oznaczone i jak przetestować swój model bazowy) znajdziesz w "Dyskusji". LoRA musi pasować do wytrenowanego modelu bazowego. Niepasujący model obniży jakość obrazu.
Łączysz dwa modele bazowe. Jeśli Twój model bazowy ma bardzo silny domyślny styl, dodanie tej LoRY zwykle nie da oczekiwanego efektu. Może być konieczne dostosowanie innych wag (LoR, bloków U-net itp.).
Ten model nie może dodać naturalnych detali do modeli bazowych z silnie AI-stylizowanymi obrazami (wytrenowanych na obrazach AI, gdzie wszystko jest gładkie, błyszczące, bez tekstury i wygląda plastikowo). Wiem, że niektórzy wybierali ten model, aby pozbyć się gładkości stylu AI w obecnym modelu bazowym. Niestety nie zadziała, bo styl AI jest ekstremalnie przeuczony (uczysz od razu model tym samym, co AI, jeśli trenujesz na danych AI). Ponadto obrazy AI są uboższe w detale niż rzeczywiste, więc model nauczył się tłumić szczegóły. To poważny problem. Raz obecny styl AI, nie da się go pozbyć.
Ten model nie jest magicznym narzędziem, które pozwala na nakładanie wielu LoR bez złamania modelu. Nazwa modelu może wprowadzać w błąd.

Dlaczego i jak to działa:

Problem przeuczenia:

Modele anime trenowane na obrazach anime. Te obrazy są proste i zawierają tylko wysokopoziomowe "koncepcje", często abstrakcyjne. Brak tła, detali i tekstur.
Chcemy, aby model uczył się tylko wysokopoziomowych "koncepcji". Rzeczywistość jest taka, że model uczy się tego, co widzi, a nie co chcesz.
Po zobaczeniu 10+ milionów prostych, abstrakcyjnych obrazów anime, model nauczy się: 1) nie musi generować detali, bo dane tego nie wymagały; 2) musi generować proste obrazy z abstrakcyjnymi koncepcjami, nawet ich nie rozumiejąc. To prowadzi do zdeformowanych obrazów, czyli przeuczenia.

Rozwiązanie:

Szkol model na obrazach anime i rzeczywistych. Tak może się uczyć koncepcji, zachowując naturalne detale i tekstury, czyli mniej przeuczenia.
NoobAI robi to mieszając trochę realistycznych zdjęć cosplayu w zbiorze danych. (bodajże wspomniane przez twórców)
Ten model idzie dalej, trenowany na wszystkim: architektura, codzienne przedmioty, ubrania, krajobrazy itd. Pełne, wielopoziomowe podpisy w języku naturalnym, na wzór oryginalnego treningu SDXL.

Wynik:

Zobacz porównania bez: 1 (style artystów), 2 (style ogólne)
Mniej przeuczenia, mniej zdeformowanych obrazów. Bardziej naturalne tekstury, oświetlenie i detale. Możesz używać tysięcy wbudowanych tagów stylu (Danbooru, e621), oraz ogólnych stylów rozumianych przez oryginalny SDXL, uzyskując czyste i szczegółowe obrazy, niezależnie czy 2D, 3D, abstrakcyjne czy realistyczne.
Pełna kreatywność dzięki różnorodnemu zbiorowi danych. Brak domyślnego stylu, więc nie ogranicza kreatywności modelu bazowego ani innych LoR stylów.

Zbiór danych

najnowsza lub niedawne wersje

~7k obrazów łącznie. Nie tak duży (w porównaniu do gigachadów trenujących na milionach zdjęć), ale nie mały. Każde zdjęcie wybrane ręcznie przeze mnie.

Tylko normalne, ładne rzeczy. Brak szalonych stylów, których nie da się opisać. Zero obrazów AI, znaków wodnych itd.
Tylko wysokorozdzielcze obrazy. Średnia rozdzielczość 3.37 MP, ~1800x1800.
Wszystkie obrazy mają naturalne podpisy z najnowszego LLM Google.
Wszystkie postacie anime są najpierw tagowane przez wd tagger v3, potem poprawiane przez Google LLM.
Zawiera naturę, przestrzeń na zewnątrz i w pomieszczeniach, zwierzęta, przedmioty codziennego użytku, wiele rzeczy, z wyjątkiem prawdziwych ludzi.
Różne warunki oświetleniowe. Bardzo ciemne, jasne, a także bardzo ciemne i jasne jednocześnie.

Inne narzędzia

Kilka pomysłów, które miały być lub były częścią Stabilizera. Teraz są osobnymi LoRAMi. Dla lepszej elastyczności. Link kolekcji: https://civitai.com/collections/8274233.

Dark: LoRA faworyzująca ciemniejsze otoczenie. Użyteczna do naprawienia problemu nadmiernej jasności w niektórych modelach bazowych. Trenowana na obrazach o niskiej jasności. Brak uprzedzeń stylu, zatem brak mieszania stylów.

Contrast Controller: Ręcznie wykonana LoRA. Kontroluje kontrast niczym suwak na monitorze. W przeciwieństwie do innych "wzmacniaczy kontrastu" efekt jest stabilny, matematycznie liniowy i nie wpływa na styl.

Przydatna, gdy Twój model bazowy ma problem z przesyceniem lub chcesz bardzo kolorowe obrazy.

Przykład:

Style Strength Controller: Lub reduktor efektu przeuczenia. Może zmniejszać różne efekty przeuczenia (uprzedzenia wobec obiektów, jasności itd.), matematycznie. Lub je wzmacniać, jeśli chcesz.

Różnice między Stabilizer:

Stabilizer trenowany na danych z prawdziwego świata. Może tylko "redukuje" efekty przeuczenia dotyczące tekstur, detali i tła, dodając je z powrotem.
Style Controller nie pochodzi z treningu. Działa jak "cofnij" trening modelu bazowego, zmniejszając przeuczenie. Może matematycznie redukować wszystkie efekty przeuczenia, jak uprzedzenia wobec jasności, obiektów.

Stare wersje:

Więcej informacji znajdziesz w "dzienniku aktualizacji". Uważaj, że stare wersje mogą mieć zupełnie inne efekty.

Główna linia czasu:

Teraz ~: Naturalne detale i tekstury, stabilne rozumienie prompta i większa kreatywność. Nie ogranicza się już do czystego stylu 2D anime.
illus01 v1.23 / nbep11 0.138 ~: Lepszy styl anime z żywymi kolorami.
illus01 v1.3 / nbep11 0.58 ~: Lepszy styl anime.

Dziennik aktualizacji

(31.08.2025) NoobAI ep10 v0.273

Ta wersja trenowana od początku na NoobAI eps v1.0.

W porównaniu do wcześniejszej illus01 v1.198:

Lepsza i zrównoważona jasność w ekstremalnych warunkach. (jak nbvp v0.271)
Lepsze tekstury i detale. Więcej kroków treningu na etapach o wysokim SNR. (wersje illus01 pomijały te etapy dla lepszej kompatybilności, teraz wszystkie modele bazowe to NoobAI, więc już nie trzeba)

(24.08.2025) NoobAI v-pred v0.271:

W porównaniu do wcześniejszej v0.264:

Lepsze i zrównoważone oświetlenie w ekstremalnych warunkach, mniej uprzedzeń.
Wysoki kontrast, czysta czerń 0 i biel 255 na tym samym obrazku, nawet w tym samym miejscu, bez przepełnień i przesycenia. Teraz możesz mieć to wszystko naraz.
(stara v0.264 próbowała ograniczyć obraz między 10~250, by uniknąć przepełnień, ale miała zauważalne uprzedzenia, cały obraz mógł być zbyt ciemny lub jasny)
Jak v0.264, preferuj wysoką lub pełną siłę (0.9~1).

(17.08.2025) NoobAI v-pred v0.264:

Pierwsza wersja trenowana na NoobAI v-pred.
Daje lepsze oświetlenie, mniej przepełnienia.
Uwaga: preferuj wysoką lub pełną siłę (0.9~1).

(28.07.2025) illus01 v1.198

Głównie w porównaniu do v1.185c:

Koniec "c" wersji. Choć "wizualnie uderzające" jest dobre, miało problemy z kompatybilnością. Na przykład, jeśli twój model bazowy ma podobne ulepszenia kontrastu, nakładanie dwóch jest złe. Koniec z szalonymi efektami postprodukcji (wysoki kontrast i nasycenie itd.).
Zamiast tego więcej tekstur i detali. Filmowy poziom oświetlenia. Lepsza kompatybilność.
Ta wersja zmieniła wiele rzeczy, w tym przegląd zbioru danych, więc efekt jest dość inny niż w poprzednich wersjach.
Dla chcących powrotu efektów v1.185c. Można znaleźć czyste i dedykowane style artystyczne na tej stronie. Jeśli zbiór jest wystarczająco duży dla LoRY, mogę taką wytrenować.

(21.06.2025) illus01 v1.185c:

W porównaniu do v1.165c.

+100% przejrzystości i ostrości.
-30% obrazów zbyt chaotycznych (nie dających się opisać). Może ta wersja już nie daje bardzo wysokiego kontrastu, ale powinna być stabilniejsza w normalnym użyciu.

(10.06.2025): illus01 v1.165c

To wersja specjalna. Nie jest ulepszeniem v1.164. "c" oznacza "kolorowy", "kreatywny", czasem "chaotyczny".

Zbiór zawiera obrazy bardzo wizualnie uderzające, ale czasem trudne do opisania, np. bardzo kolorowe, wysoki kontrast, skomplikowane oświetlenie, obiekty, skomplikowane wzory wszędzie.

Otrzymujesz "wizualną uderzalność", ale kosztem "naturalności". Może wpływać na style z delikatnymi kolorami, itp. Ta wersja nie generuje idealnej tekstury „rysunek ołówkiem” jak v1.164.

(4.06.2025): illus01 v1.164

Lepsze rozumienie prompta. Teraz każdy obraz ma 3 naturalne podpisy z różnych perspektyw. Tagi Danbooru są weryfikowane przez LLM, wybierane są tylko ważne i łączone w naturalny podpis.
Antyprześwietlenie. Dodano bias, aby zapobiec wyjściu modelu na poziom #ffffff czystej bieli. Zazwyczaj #ffffff = prześwietlenie i utrata detali.
Zmiany w ustawieniach treningu. Lepiej kompatybilne z NoobAI, zarówno e-pred jak i v-pred.

(19.05.2025): illus01 v1.152

Kontynuacja poprawy oświetlenia, tekstur i detali.
+5K obrazów, więcej kroków treningu, co w efekcie daje silniejszy efekt.

(9.05.2025): nbep11 v0.205:

Szybka poprawka jasności i kolorów w v0.198. Teraz nie zmienia jasności i kolorów tak dramatycznie jak prawdziwe zdjęcie. v0.198 nie był zły, tylko zbyt kreatywny.

(7.05.2025): nbep11 v0.198:

Dodano więcej ciemnych obrazów. Mniej zdeformowanych ciał i tła w ciemnym otoczeniu.
Usunięto zwiększanie nasycenia i kontrastu. Już niepotrzebne. Używaj Contrast Controller.

(25.04.2025): nbep11 v0.172.

Te same nowości co w illus01 v1.93 ~ v1.121. Podsumowanie: nowy zbiór zdjęć "Touching Grass". Lepsze naturalne tekstury, tło, oświetlenie. Słabszy efekt postaci dla lepszej kompatybilności.
Lepsza dokładność i stabilność kolorów. (W porównaniu do nbep11 v0.160)

(17.04.2025): illus01 v1.121.

Powrót do illustrious v0.1. Illustrious v1.0 i nowsze wersje trenowano celowo na obrazach AI (ok. 30% zbioru), co nie jest idealne dla treningu LoRA. Nie zauważyłem tego, dopóki nie przeczytałem ich publikacji.
Mniejszy efekt stylu postaci. Powrót do poziomu v1.23. Postacie mają mniej detali w tej LoRZE, ale lepszą kompatybilność. To kompromis.
Inne rzeczy takie same jak w wersji v1.113 poniżej.

(10.04.2025): illus11 v1.113 ❌.

Aktualizacja: używaj tej wersji tylko jeśli Twój model bazowy oparty jest na Illustrious v1.1. W przeciwnym razie stosuj illus01 v1.121.

Trenowany na Illustrious v1.1.
Dodano nowy zbiór "Touching Grass". Lepsze naturalne tekstury, oświetlenie i efekt głębi ostrości. Lepsza stabilność struktury tła. Mniej zdeformowanych teł, jak zdeformowane pokoje, budynki.
Pełne podpisy w języku naturalnym z LLM.

(30.03.2025): illus01 v1.93.

v1.72 była trenowana zbyt mocno. Zmniejszyłem ogólną siłę. Powinna mieć lepszą kompatybilność.

(22.03.2025): nbep11 v0.160.

To samo co w illus v1.72.

(15.03.2025): illus01 v1.72

Ten sam nowy zestaw tekstur i oświetlenia jak w ani40z v0.4 poniżej. Bardziej naturalne oświetlenie i tekstury.
Dodano mały zbiór ~100 obrazów skupionych na ulepszaniu rąk, z różnym zadaniami jak trzymanie szklanki lub kubka itp.
Usunięto wszystkie obrazy z "prostym tłem" z zestawu danych. -200 obrazów.
Zmieniono narzędzie treningowe z kohya na onetrainer. Zmieniono architekturę LoRA na DoRA.

(4.03.2025) ani40z v0.4

Trenowany na Animagine XL 4.0 ani40zero.
Dodano ~1k obrazów skupionych na naturalnym dynamicznym oświetleniu i teksturach rzeczywistych.
Bardziej naturalne oświetlenie i naturalne tekstury.

ani04 v0.1

Wersja inicjalna dla Animagine XL 4.0. Głównie naprawia problemy z jasnością Animagine 4.0. Lepszy, wyższy kontrast.

illus01 v1.23

nbep11 v0.138

Dodano trochę futerkowych/nie-ludzkich/innych obrazów do zrównoważenia zbioru danych.

~~nbep11 v0.129~~

zła wersja, efekt zbyt słaby, zignoruj ją

nbep11 v0.114

Wprowadzono "pełny zakres kolorów". Automatycznie balansuje obraz w kierunku "normalnego i ładnego". To coś jak "jednoklikowe ulepszenie foto" w większości programów do edycji zdjęć. Minus: zapobiega dużym uprzedzeniom. Na przykład, jeśli chcesz 95% czerni i 5% jasnych obszarów, zamiast 50/50%.
Dodano trochę realistycznych danych. Żywsze detale, oświetlenie, mniej płaskich kolorów.

illus01 v1.7

nbep11 v0.96

Więcej obrazów treningowych.
Potem ponownie dostrojony na małym zbiorze tapet (rzeczywiste tapety gier, najwyższa jakość, ~100 obrazów). Lepsze detale (w skórze, włosach) i kontrast.

nbep11 v0.58

Więcej obrazów. Zmieniono parametry treningu, by były bliżej modelu bazowego NoobAI.

illus01 v1.3

nbep11 v0.30

Więcej obrazów.

nbep11 v0.11: Trenowany na NoobAI epsilon pred v1.1.

Poprawione tagi zbioru danych. Ulepszona struktura i rozkład wag LoRY. Powinien być stabilniejszy i mniej wpływać na kompozycję obrazu.

illus01 v1.1

Trenowany na illustriousXL v0.1.

nbep10 v0.10

Trenowany na NoobAI epsilon pred v1.0.

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

Portrait study - Companion (ROGER HAUSS)

Następny

✨ Lazy Embeddings dla WSZYSTKICH modeli illustrious NoobAI Pony SDXL LazyPositive LazyNegative (pozytywne, negatywne i nie tylko!) - lazynsfw

Użyj tego modelu