SDXL / Flux.1 D - Matte (Vanta)Black - Eksperyment - Flux.1 D v1.0
Zalecane parametry
samplers
steps
cfg
resolution
other models
Wskazówki
Flux.1 D działa najlepiej w połączeniu z innymi modelami LoRA, które dodają kolor lub styl.
Model ma silną tendencję do odtwarzania danych treningowych, co może powodować obrazy niemal całkowicie czarne przy nadmiernym trenowaniu.
Dodanie źródeł światła, jak świeczki, powoduje naturalne dodanie ciemnych środowisk przez Flux, aby światło było widoczne.
Trening na obrazach niemal czarnych jest wyzwaniem, a przygotowanie zbioru danych wymaga starannej edycji zdjęć.
Używaj ControlNet IP-Adapter z wygenerowanymi obrazami, by wzmacniać efekty i uzyskiwać losowe rezultaty.
Model był trenowany efektywnie na 4060 TI (16GB) z wykorzystaniem VRAM między 14.4 a 15.2 GB.
Najważniejsze informacje o wersji
Wersja Flux
Flux.1 D - V2.0
Ostatnia próba, aby to działało z Flux... a przez "działało" mam na myśli roz***lić wszystko jak najbardziej. Najprawdopodobniej nigdy nie zrobi tego samego, co wersja SDXL. Nawet po 6000 krokach i samym tylko obserwowaniu było to dość oczywiste. SDXL to coś w stylu "ok, nauczę się tego, ale dodam coś od siebie", podczas gdy Flux mocno walczy / kompensuje wszystko, czego nie wie jak przetworzyć lub czego dokładnie chcę się nauczyć. Z drugiej strony, po długim treningu wytworzy te obrazy tak wiernie, że kopiuje dane treningowe 1:1, dając niemalże czarny efekt. Flux potrafi perfekcyjnie skopiować obraz, jak zdjęcia, nawet po kilku krokach.
Jak mówiłem w ostatniej wersji Flux, to przede wszystkim coś, co chcę mieszać z innymi, bardziej kolorowymi lub stylowymi LoRA.
Te same zdjęcia co SDXL v.3.0 z kilkoma dodatkowymi dla wersji Flux ( w formacie krajobrazu ). Ale... usunąłem 3 zdjęcia, które prawdopodobnie odpowiadały za przynajmniej 80% publikowanych przeze mnie lub innych osób obrazów. Chciałem to zrobić już w wersji SDXL, ale wtedy zrezygnowałem. Powód jest taki, że te zdjęcia były zbyt dominujące, powodując dziwne zachowania i tendencję do tworzenia specyficznych obrazów. Widziałem to w wersji Flux v.1.0 i teraz ich nie ma. Popularność może przez to trochę spaść, ale mam to gdzieś.
Czuję, że wiele osób używa pewnego LoRA po prostu dlatego, że jest w ich "procesie". W niektórych przypadkach obrazy bez LoRA wyglądają lepiej i nawet byś tego nie zauważył. Style LoRA to co innego, bo one dodają wyraźny styl podczas generowania obrazów. Ten model ma jednak duży potencjał na pogorszenie jakości, dlatego nie wybierałem starannie zdjęć, które wrzuciłem, aby pokazać, co mam na myśli. Jeśli dodasz coś z mocnym światłem lub źródłem światła, jak świeca, Flux (i kilka modeli SDXL) samo dodaje ciemne środowisko, ponieważ źródło światła potrzebuje ciemności, by być zauważalne (reflektor samochodu w słoneczny dzień niewiele da).
Nie pytaj, czy działa w wersjach NF4 lub QQUFUF 5.64.3255 K4 2, albo czymkolwiek innym. Plik nie jest duży, więc możesz sam przetestować. Trzymam się z daleka od takich modeli, chyba że oferują więcej niż tylko mniejsze zużycie pamięci FP8/16 Dev lub marginalny wzrost szybkości (lub gorszy spadek szybkości).
Wiem, jak irytujące jest, gdy ktoś wypuszcza wiele nowych wersji modelu w krótkim czasie, gdy się do nich przyzwyczaisz. Nie będę dalej tego rozwijał, tylko zobaczę, czy ja lub ktoś inny wyciągniemy coś wartościowego.
Poza tym, czas potrzebny na przygotowanie zdjęć w Photoshopie nie jest tego wart, szczególnie jeśli wiesz, że nic to nie zmieni. Wolę robić coś nowego, albo głupiego, ciekawego lub dającego losowe efekty... albo po prostu eksperymentować z fluxowaniem starych modeli, żeby zobaczyć, co się stanie.
Flux.1 D - V1.0
Po kilku eksperymentach z Kohya i innych, oraz zaskakująco udanych testach dziwnych koncepcyjnych LoRA dla Flux, postanowiłem spróbować tego, by zobaczyć, czy działa. W rzeczywistości nie zależało mi na wersji Flux, bo Flux dobrze radzi sobie z kontrastem (na ogół). Moim głównym celem było pozbycie się sztucznego, fałszywego wyglądu i pomyślałem, że tak "nieokreślony" zbiór danych się do tego nada. Cóż, czasem działa, a czasem pogarsza sytuację.
Tak jak w wersji SDXL, to model bardziej do łączenia z innymi LoRA, zwłaszcza tymi dodającymi dużo kolorów.
Przepraszam za lenistwo przy promptach i obrazach. Użyłem prawie tego samego, co w V.3.0, ale na początek wystarczy do pokazania efektów. Czasem zabija szczegóły i nie dodaje nic ciekawego (np. obraz meduzy czy papugi).
Ten sam seed dla odpowiadających sobie obrazów
Pierwsze 2 obrazy są z LoRA i bez, potem odwrotnie - najpierw bez, potem z LoRA (czasem z różną siłą)
Niektóre mają na początku słowa wyzwalające, ale wątpię, że są potrzebne w Flux
Oparte na zbiorze danych V1.0, nie na nowym (nie chciałem używać za dużo obrazów)
Nie jestem pewien, czy zrobię więcej LoRA dla Flux, ale będę dużo testować. To teraz naprawdę mylące z tyloma wersjami i nie czuję, by warto było poświęcać dużo czasu na coś, co może być przestarzałe za 10 godzin.
I mała uwaga: trenowane na 4060 TI (16 GB), z wykorzystaniem VRAM między 14.4 a 15.2 GB, 3.95s/iteracja - 5.15s/iteracja, 512x, ranga 4... więc nie potrzeba 4090. Oczywiście byłoby szybciej, ale jeśli możesz odpalić i zapomnieć, robiąc coś innego, to nie problem, chyba że chcesz testować coś specjalnego.
Jak zwykle, będę używać tego od czasu do czasu, by zobaczyć, czy coś sensownego z tego wyciągnę. Raczej tylko z ciekawości.
V.3.0
Po moim małym wpadce z v2.0 upewniłem się, że tym razem to prawdziwa wersja, bez scalania czy czegoś podobnego. Na początku byłem sceptyczny z powodu liczby dodanych obrazów, że wersja zbyt bardzo odbiegnie od pierwszej, ale na szczęście tak się nie stało.
Jestem naprawdę szczęśliwy, że wiele osób znalazło zastosowanie dla tej LoRA i zrobiło mnóstwo obrazów. Biorąc pod uwagę, że nigdy nie miała robić tego, co robi teraz, miło jest widzieć, że ma inne zastosowania (jak wszystkie LoRA).
To prawdopodobnie (najpewniej) ostatnia wersja na dłuższy czas, bo samo dodanie więcej obrazów nie zmieni głównego efektu. To głównie dzięki różnym modelom, kombinacjom LoRA i promptom.
Będę skupiać się na tworzeniu obrazów, by znaleźć więcej kombinacji (i trochę odpocząć), robić nowe dziwne LoRA, poprawiać stare itd. Pobierałem też sporo innych rzeczy od ludzi i głównie nie miałem czasu ich używać.
Dzięki za wszystkie dotychczasowe przesłane obrazki i mam nadzieję na więcej, choć każdy LoRA ma swój czas w tym szybko zmieniającym się świecie AI i popularność w końcu minie. :)
V2.0
Małe ogłoszenie do V2.0 ( 02.04 lub 04.02 w zależności od kraju )
Cóż, jestem oficjalnie idiotą.
Zacząłem trenować inny LoRA, gdy zauważyłem, że w próbkach nic się nie dzieje nawet po 2000 krokach, co jest praktycznie niemożliwe. Szukałem przyczyny i zauważyłem, że nie zmieniłem (lub nie ustawiłem poprawnie) ustawienia LR warmup. Normalnie nie używam warmupu, ale wcześniej testowałem, co to daje na zbiorze 4 obrazów. Mam ustawione 100 epok, ale model jest zapisywany co 500 kroków, a nie co epokę. Warm up ustawiony był na 32%, więc 4 obrazy x 10 powtórzeń x 100 epok = 4000 kroków (32% warmup = 1280 kroków, gdzie praktycznie nic się nie dzieje).
Ten LoRA miał takie same ustawienia, ale z 60 obrazami (60 x 10 x 100 = 60000 - 32% warmup = 19200 kroków)... więc nawet po 12000 krokach trening się nie rozpoczął, co znaczy, że trenowałem tylko puste powietrze. Wiele to wyjaśnia. Ponieważ zasnąłem, nie zauważyłem tego, choć byłem zdziwiony, że efekt pojawia się tak późno, sądząc, że to przez same obrazy.
Tak więc to kit i większość efektów pochodzi ze scalania z V1.0.
Wrócę do treningu w weekend po pracy, tym razem z poprawnymi ustawieniami.
Bardzo przepraszam. Może to niezamierzony żart primaaprilisowy :) .... :(
Dodałem kilka nowych zdjęć, bo ostatnio często tego używam i nie wrzucałem nowego LoRA od jakiegoś czasu, co jest chyba połączeniem zbyt wielu obowiązków w pracy i wybierania trudnych tematów wymagających skomplikowanego podejścia... wszystko inne byłoby nudne.
Dużo czasu poświęciłem też na rozkładanie Pony, co mnie zaskoczyło. Jeśli odstawisz na bok furry, anime i ogólnie porno, to jest prawie bardziej podstawowy niż Base XL, co jest dobre do dodawania koncepcji i stylów przez trening LoRA, ale zna znacznie bardziej złożone rzeczy, jak pozycjonowanie, emocje, dziwne kąty itd... ale to zupełnie inna historia.
Nie wiem, ile jeszcze treningów uda mi się zrobić w tym roku. Może zrobię coś łatwiejszego międzyczasie, ale kto wie. AI szybko się rozwija, więc za miesiąc... albo tydzień może być coś nowego.
Testowałem ten sam seed i ten sam model na wcześniej wygenerowanych obrazach. Zmiana jest subtelna w niektórych przypadkach, a ekstremalna w innych (teraz wiem dlaczego: przeczytaj ogłoszenie)
Przepraszam, że nie zrobiłem więcej wariantów pokazanych obrazów. Czasem przygotowanie zdjęć trwa dłużej niż trening LoRA, ale tu nie powinno mieć to dużego znaczenia. Więcej rzeczy pojawi się naturalnie.
V1.0
Próbowałem trochę popchnąć AI, by zobaczyć, co wyciągnie z treningu na prawie całkowicie czarnych obrazach z ledwo widocznym kształtem.
Przygotowanie zbioru danych w Photoshopie było prawie niemożliwe, bo praktycznie nic nie było widać. Oczywiście każdy ma inne ustawienia monitora itd., więc trudno powiedzieć, czy zdjęcia faktycznie były tak ciemne, ale moje oczy bardzo się męczyły. Nawet teraz patrzenie na wygenerowane obrazy jest trudne, choć nie są tak ciemne jak treningowe.
Byłem zaskoczony, że model cokolwiek wychwycił. Odłożę go na bok na razie, poczekam, co z nim zrobić. Robi dziwne rzeczy. Jakoś wsadzanie wygenerowanych obrazów do ControlNet IP-Adapter wzmacnia wszystko i daje losowe efekty.
Wskazówki do generowania:
Nie mam pojęcia... powodzenia.
Szczegóły modelu
Typ modelu
Model bazowy
Wersja modelu
Hash modelu
Twórca
Dyskusja
Proszę się log in, aby dodać komentarz.






