SDXL / Flux.1 D - Matowy (Vanta)Czarny - Eksperyment - Flux.1 D v2.0
Zalecane podpowiedzi
vantablack
Zalecane parametry
samplers
steps
cfg
resolution
other models
Wskazówki
Ten LoRA najlepiej używać w połączeniu z innymi, bardziej kolorowymi lub stylizowanymi LoRA.
Oczekuj losowych lub nietypowych efektów; czasem pogarsza jakość obrazu.
Może dodawać ciemne otoczenie przy obecności źródeł światła, by zwiększyć realizm.
Powodzenia z promptami, ponieważ nie ma specyficznych wskazówek co do promptów.
Najważniejsze informacje o wersji
Ostatnia próba i kilka zmian
Flux.1 D - V2.0
Ostatnia próba, by to uruchomić w Flux... a przez "uruchomić" rozumiem robić bałagan jak najwięcej. Najprawdopodobniej nigdy nie powtórzy tego co zrobiła wersja SDXL. Nawet po 6000 krokach i tylko z obserwacji było to dość oczywiste. SDXL to w zasadzie "okej, nauczę się tego, ale dorzucę coś od siebie", podczas gdy Flux walczy / kompensuje się szaleńczo wobec czegokolwiek, czego nie wie, jak obsłużyć lub czego dokładnie chcę się nauczyć. Z drugiej strony, po długim treningu generuje dokładnie te obrazy i to na tyle mocno, że kopiuje dane treningowe 1/1, co skutkuje niemal czernią. Flux potrafi perfekcyjnie skopiować obraz, nawet zdjęcia, już po kilku krokach.
Jak powiedziałem w ostatniej wersji Flux, w większości jest to coś, co chcę mieszać z innymi LoRA, które są bardziej kolorowe lub mają określony styl.
Te same obrazy co SDXL v.3.0 z kilkoma dodatkowymi dla wersji Flux (niektóre w formacie krajobrazowym). Ale... usunąłem 3 obrazy, które były prawdopodobnie odpowiedzialne za co najmniej 80% zdjęć moich lub innych osób. Chciałem to zrobić też w wersji SDXL, ale wtedy zrezygnowałem. Powód to dominacja tych obrazów, powodująca wiele dziwnego zachowania i uprzedzeń do tworzenia konkretnych obrazów. Widziałem to w wersji Flux v.1.0 i teraz ich nie ma. Popularność prawdopodobnie ucierpi, ale mnie to nie obchodzi.
Czuję, że wielu ludzi używa pewnej LoRA tylko dlatego, że jest w ich "pipeline". W niektórych przypadkach obrazy bez LoRA wyglądają lepiej i nawet byś nie zauważył. Stylowe LoRA to inna sprawa, bo dodają styl, który jest widoczny podczas generowania. To jednak ma potencjał wszystko pogorszyć, dlatego nie wybierałem specjalnie zdjęć, które zamieściłem, by pokazać, co mam na myśli. Jeśli dodasz coś z silnym blaskiem lub źródłem światła, jak świeca, Flux (i kilka modelów SDXL) automatycznie dodaje ciemne otoczenie, bo źródło światła potrzebuje ciemności, by być zauważalne (światło reflektora samochodu w słoneczny dzień niewiele da).
I nawet nie pytaj, czy działa to w wersjach NF4 czy QQUFUF 5.64.3255 K4 2 lub czort wie jakich. Plik nie jest duży, więc możesz sam przetestować. Trzymam się z daleka od tych modeli, chyba że dają więcej korzyści niż zwykła wersja FP8/16 Dev poza mniejszym zużyciem pamięci i/lub nieistotnym wzrostem prędkości (lub gorszym spowolnieniem).
Wiem, jak irytujące może być, gdy ktoś wydaje nową wersję modelu w krótkim czasie, gdy już się przyzwyczaiłeś. Nie będę tego dalej kontynuować, zobaczę, czy ja albo ktoś inny wyciągnie z tego coś użytecznego.
Poza tym, ilość pracy przy przygotowywaniu obrazów w Photoshopie nie jest warta tego, zwłaszcza gdy wiesz, że nic to nie zmieni. Wolę robić coś nowego, albo bardziej prawdopodobne - głupiego, co jest interesujące lub daje losowe efekty... albo po prostu "fluxify" stare modele, by zobaczyć, co się stanie.
Flux.1 D - V1.0
Po eksperymentach z Kohya i innych, ku mojemu zdziwieniu udanych testach ze dość dziwnymi konceptami LoRA dla Flux, pomyślałem, że spróbuję tego, żeby zobaczyć, czy działa. W sumie celem nie było stworzenie wersji Flux, bo Flux radzi sobie dobrze z kontrastem (w większości). Moją główną motywacją było pozbycie się sztucznego/udawanego wyglądu i myślałem, że taki "niezdefiniowany" zbiór danych załatwi sprawę. Cóż, czasami działa, a czasem jest jeszcze gorzej.
Jak wersja SDXL, służy bardziej do użycia z innymi LoRA, szczególnie tymi, które dodają dużo koloru.
Przepraszam za lenistwo w promptach i obrazach. Użyłem praktycznie tych samych rzeczy co w V.3.0, ale powinno wystarczyć do pokazania efektów. Czasem traci szczegóły i nic ciekawego nie dodaje (np. obraz meduzy czy papugi).
Ten sam seed dla odpowiadających obrazów
Pierwsze 2 obrazy są z LoRA i bez, potem odwrotnie, najpierw bez, potem z LoRA (czasem z różną siłą)
Czasem na początku są słowa wyzwalające, ale w Flux wątpię, by były potrzebne
Oparte na zbiorze V1.0, nie na nowym (nie chciałem używać za dużo zdjęć)
Nie jestem pewny, czy zrobię więcej LoRA dla Flux, ale dużo będę testować. Obecnie jest to mylące z tyloma wersjami i nie wydaje się, że warto poświęcać dużo czasu na coś, co za 10h może być nieaktualne.
Na marginesie: trenowano na 4060 TI (16 GB), z maksymalnym użyciem VRAM 14.4-15.2 GB, 3.95s/iteracja - 5.15s/iteracja, 512x, rank 4... więc nie potrzeba 4090. Oczywiście byłoby szybciej, ale jeśli możesz odpalić i zająć się czymś innym, to nie problem, chyba że chcesz testować coś dokładniej.
Jak zwykle, będę to używać od czasu do czasu, by zobaczyć, czy coś z tego wyciągnę. Bardziej z czystej ciekawości.
V.3.0
Po mojej małej wpadce z v2.0 upewniłem się, że tym razem to prawdziwa wersja, bez łączenia czy czegoś podobnego. Na początku byłem sceptyczny z powodu liczby dodanych obrazów, czy nie odejdzie zbyt daleko od pierwszej wersji, ale na szczęście nie.
Bardzo się cieszę, że wiele osób znalazło zastosowanie dla tej LoRA i zrobiło tyle obrazów. Biorąc pod uwagę, że nigdy nie miała robić tego, co obecnie robi, to miło zobaczyć, że ma inną funkcję albo można ją używać do czegoś jeszcze (jak wszystkie LoRA).
Prawdopodobnie (najpewniej) to będzie ostatnia wersja na dłuższy czas, bo dodanie więcej zdjęć nie zmieni głównego efektu. Większość dzieje się dzięki stosowaniu różnych modeli, kombinacji LoRA i promptów.
Skupie się bardziej na tworzeniu obrazów, by znaleźć więcej kombinacji (i trochę się zrelaksować), robić nowe dziwne LoRA, naprawiać stare itd. Pobierałem też mnóstwo rzeczy od innych, których na ogół nie miałem okazji użyć.
Dzięki za wszystkie przesłane obrazy i mam nadzieję na więcej, chociaż każda LoRA ma swój czas w tym szybko zmieniającym się sektorze AI, a czynnik atrakcyjności nieuchronnie się skończy. :)
V2.0
Małe ogłoszenie do V2.0 (02.04 lub 04.02, w zależności od kraju)
No cóż, oficjalnie jestem idiotą.
Zacząłem trenować inną LoRA, gdy zauważyłem, że w przykładowych obrazach nic się nie dzieje nawet po 2000 krokach, co jest praktycznie niemożliwe. Szukałem przyczyny i zauważyłem, że nie zmieniłem ustawienia LR warmup (lub nie ustawiłem go prawidłowo). Zazwyczaj nie używam warmupu, ale wcześniej testowałem, co to robiło, na zbiorze 4 obrazów. Zawsze mam ustawione 100 epok, ale model jest zapisywany co 500 kroków, nie co epokę. Warmup był na 32%, czyli 4 obrazy x 10 powtórzeń x 100 epok = 4000 kroków (32% warmup = 1280 kroków, podczas których niewiele się dzieje).
Ta LoRA miała te same ustawienia, ale z 60 obrazami (60 x 10 x 100 = 60000 - 32% warmup = 19200 kroków)... więc nawet po 12000 krokach nic się nie zaczęło, co oznacza, że trenowałem praktycznie na pusto. Wiele rzeczy to wyjaśnia. Ponieważ zasnąłem, nie zauważyłem tego, mimo że dziwiło mnie, że efekt pojawia się tak późno, co myślałem, że jest związane z samymi obrazami.
Tak... więc ta wersja jest niewypałem, a większość jej działania pochodzi z łączenia z V1.0.
Przetrenuję ją ponownie w weekend po powrocie z pracy, tym razem z właściwymi ustawieniami.
Przepraszam za to. Może to był niezamierzony prima aprilis :) .... :(
Dodałem trochę więcej zdjęć, bo ostatnio dużo tego używam i od jakiegoś czasu nie wrzucałem nowej LoRA, co jest kombinacją dużej ilości pracy i wyboru trudnych tematów, które "muszą" być wykonane w najbardziej skomplikowany sposób... wszystko inne byłoby nudne.
Poświęciłem też dużo czasu na rozbiórkę Pony, co w pewnym stopniu mnie zaskoczyło. Jeśli odrzucić całą zawartość furry, anime i pornografia, jest to niemal prostsze niż model Base XL, co jest dobre do dodawania konceptów i stylów przez trening LoRA, ale zna dużo bardziej złożone rzeczy, jak pozy, emocje, dziwne kąty itd... ale to zupełnie inna historia.
Nie wiem, ile jeszcze zdążę poznać treningu w tym roku. Może zrobię coś prostszego międzyczasie, ale kto wie. AI rozwija się szybko, więc może w miesiąc... albo tydzień pojawi się coś nowego.
Testowałem ten sam seed i ten sam model z wcześniej wygenerowanymi obrazami. Zmiana bywa subtelna w niektórych przypadkach, a ekstremalna w innych (a teraz wiem dlaczego: przeczytaj ogłoszenie)
Przepraszam również za brak większej różnorodności w prezentowanych obrazach. Czasem przygotowanie obrazów zajmuje więcej niż trening LoRA, ale to nie powinno zbytnio przeszkadzać. Więcej rzeczy pojawi się naturalnie.
V1.0
Próbowałem trochę nacisnąć AI, by zobaczyć, co wyłapie na obrazach prawie całkowicie czarnych z ledwie widocznym kształtem.
Przygotowanie zbioru w Photoshopie było prawie niemożliwe, bo praktycznie nic nie było widać. Oczywiście każdy ma inne ustawienia monitora itd., więc trudno powiedzieć, czy te obrazy były naprawdę tak ciemne, ale moje oczy mocno się męczyły. Nawet teraz patrzenie na wygenerowane obrazy jest trochę trudne, chociaż nie są tak ciemne jak obrazy treningowe.
Byłem zaskoczony, że model w ogóle coś wyłapał. Odłożę go na razie, aż wymyślę, co z nim zrobić. Z pewnością generuje dziwne rzeczy. Jakoś przekazywanie wygenerowanych obrazów do ControlNet IP-Adapter wzmacnia wszystko i daje losowe rezultaty.
Wskazówki do generowania:
Nie mam pojęcia... powodzenia.
Szczegóły modelu
Typ modelu
Model bazowy
Wersja modelu
Hash modelu
Wytrenowane słowa
Twórca
Dyskusja
Proszę się log in, aby dodać komentarz.






