SDXL / Flux.1 D - Matowy (Vanta)Czarny - Eksperyment - SDXL v3.0
Zalecane negatywne podpowiedzi
SDXL_TI_my_eyes_are_bleeding_2.0
Zalecane parametry
samplers
steps
cfg
resolution
other models
Zalecane parametry wysokiej rozdzielczości
denoising strength
Wskazówki
Flux.1 D najlepiej używać w połączeniu z innymi LoRA, które dodają kolor lub styl, ze względu na tendencję do tworzenia ciemniejszych, fotorealistycznych obrazów.
Należy oczekiwać nieprzewidywalnych i eksperymentalnych efektów — czasem kopiuje dane treningowe 1:1 lub generuje niemal czarne obrazy.
Model działa dobrze na średniej klasy GPU, jak 4060 TI z 16 GB VRAM, bez konieczności posiadania najnowszego 4090.
ControlNet IP-Adapter może wzmacniać generowane obrazy, ale czasem powoduje losowe efekty.
Nie zalecano jednoznacznych, spójnych promptów pozytywnych lub negatywnych; zalecane jest eksperymentowanie.
Najważniejsze informacje o wersji
Właściwie nowa wersja (mam taką nadzieję)
Flux.1 D - V2.0
Ostatnia próba sprawienia, by działał w Flux... a przez działanie rozumiem maksymalne namieszanie. Prawdopodobnie nigdy nie będzie robił tego samego, co wersja SDXL. Nawet po 6000 krokach i już na podstawie obserwacji było to całkiem oczywiste. SDXL to mniej więcej "okej, nauczę się tego, ale nadam temu swój własny charakter", podczas gdy Flux walczy / kompensuje jak szalony z czymkolwiek, czego nie wie jak przetworzyć, lub czego dokładnie chcę się nauczyć. Z drugiej strony, po długim treningu potrafi wygenerować te obrazy dokładnie, nawet do tego stopnia, że kopiuje dane treningowe 1:1, co skutkuje niemal czernią. Flux potrafi idealnie skopiować obraz, jak zdjęcia, nawet po kilku krokach.
Jak mówiłem w poprzedniej wersji Flux, w dużej mierze chcę go mieszać z innymi LoRA, które są bardziej kolorowe lub mają określony styl.
Te same obrazy co w SDXL v.3.0 plus sporo dodatkowych dla wersji Flux (między innymi w formacie krajobrazu). Jednak usunąłem 3 obrazy, które prawdopodobnie odpowiadały za przynajmniej 80% obrazów publikowanych przeze mnie lub innych osób. Chciałem to zrobić także w wersji SDXL, ale wtedy zrezygnowałem. Powodem było to, że owe obrazy były zbyt dominujące, powodując dużo dziwnych zachowań i tendencyjność do tworzenia określonych obrazów. Zauważyłem to już w wersji Flux v.1.0 i teraz ich nie ma. Popularność prawdopodobnie ucierpi, ale mnie to nie obchodzi.
Wydaje mi się, że wiele osób używa pewnej LoRA tylko dlatego, że jest w ich „pipeline”. W niektórych przypadkach obrazy bez LoRA wyglądają lepiej, a nikt by o tym nie wiedział. LoRA stylów to inna kwestia, bo dodają styl wyraźnie widoczny podczas generowania obrazów. Ten model ma jednak potencjał, by wszystko pogorszyć, dlatego nie wybierałem specjalnie obrazów, które zamieszczałem, żeby pokazać, co mam na myśli. Jeśli dodajesz coś, co ma mocne światło lub źródło światła jak świeca, Flux (i kilka modeli SDXL) sam tworzy ciemne otoczenie, ponieważ źródło światła zawsze potrzebuje pewnego rodzaju ciemności, żeby było zauważalne (światło samochodu w słoneczny dzień niewiele da).
I nawet nie pytaj, czy działa to w wersjach NF4 lub QQUFUF 5.64.3255 K4 2 czy jakichkolwiek innych. Plik nie jest duży, więc możesz sam przetestować. Trzymam się z dala od tych modeli, chyba że oferują coś więcej niż standardowa wersja FP8/16 Dev poza niższym zużyciem pamięci i/lub nieznacznym przyspieszeniem (lub co gorsza spowolnieniem).
Wiem, jak irytujące bywa, gdy ktoś wydaje nową wersję modelu w krótkim czasie, zwłaszcza gdy się do niej przyzwyczaiłeś. Nie będę dalej rozwijał tego modelu, tylko zobaczę, czy ja lub ktoś inny wyciągniemy z niego coś przydatnego.
Poza tym ilość pracy potrzebna do przygotowania obrazów w Photoshopie nie jest tego warta, szczególnie gdy wiesz, że to nic nie zmieni. Wolę robić coś nowego lub bardziej głupiego, co jest ciekawe lub tworzy losowe efekty... albo po prostu "fluxyfikować" stare modele, by zobaczyć, co się stanie.
Flux.1 D - V1.0
Po zabawie z Kohya i innych, ku mojemu zaskoczeniu, udanych testach z dość dziwnymi koncepcyjnymi LoRA dla Flux postanowiłem sprawdzić, czy ten model w ogóle działa. Tak naprawdę nie chciałem stworzyć wersji Flux, ponieważ Flux radzi sobie dobrze z kontrastem (w większości). Moim głównym celem było pozbycie się sztucznego/fałszywego wyglądu i uznałem, że tak "niezdefiniowany" zestaw danych się do tego nada. I czasem to działa, czasem nawet pogarsza sprawę.
Podobnie jak wersja SDXL, nadaje się bardziej do używania z innymi LoRA, zwłaszcza tymi, które dodają dużo koloru.
Wybaczcie moje lenistwo przy promptach i obrazach. Użyłem w zasadzie tych samych rzeczy co w V.3.0, ale na potrzeby pokazowe powinno wystarczyć. Czasami traci szczegóły i nie dodaje nic szczególnie interesującego (np. obraz meduzy lub papugi).
Ten sam seed dla odpowiadających sobie obrazów
Pierwsze 2 obrazy to z LoRA i bez, potem odwrotnie, czyli najpierw bez, potem z LoRA (czasem o różnych siłach)
Niektóre mają słowa trigger na początku, ale w Flux wątpię, że są potrzebne
Na podstawie zestawu danych V1.0, nie nowego (nie chciałem używać za dużo obrazów)
Nie jestem pewien, czy zrobię więcej LoRA dla Flux, ale zamierzam sporo testować. To naprawdę mylące przy tylu różnych wersjach i nie wydaje się, że warto poświęcać dużo czasu na coś, co za 10 godzin może być przestarzałe.
A tak przy okazji: Trening był przeprowadzony na 4060 TI (16 GB), między 14.4 a 15.2 GB zużycia VRAM, 3.95s/it - 5.15s/it, 512x, Rank 4... więc nie potrzebujesz 4090. Oczywiście byłoby szybciej, ale jeśli możesz po prostu startować i zapomnieć o tym robiąc coś innego, to nie problem, chyba że chcesz testować coś aktywnie.
Tak jak zawsze, będę go używał od czasu do czasu, żeby zobaczyć, czy uda mi się z tego coś wartościowego wyciągnąć. Raczej po prostu zaspokoić moją ciekawość.
V.3.0
Po mojej małej wpadce z v2.0 tym razem zadbałem, by to był naprawdę pełnowartościowy model, bez łączenia czy czegoś innego. Na początku byłem sceptyczny ze względu na liczbę dodanych obrazów, obawiałem się, że wersja zbyt odbiegnie od pierwszej, ale na szczęście tak się nie stało.
Bardzo cieszy mnie, że wiele osób znalazło zastosowanie dla tej LoRA i stworzyło mnóstwo obrazów. Biorąc pod uwagę, że model nigdy nie miał robić tego, co teraz robi, miło widzieć, że ma inne przeznaczenie lub że można go wykorzystywać do czegoś innego (jak wszystkie LoRA).
Prawdopodobnie będzie to ostatnia wersja na dłuższy czas, ponieważ samo dodanie więcej obrazów nie zmieni głównego efektu. Większość osiąga się za pomocą różnych modeli, kombinacji LoRA i promptów.
Skupię się bardziej na faktycznym tworzeniu obrazów, by znaleźć więcej kombinacji (i trochę się odstresować), tworzyć nowe dziwne LoRA, naprawiać stare itd. W dodatku pobrałem sporo materiałów od innych i nie miałem na większość z nich okazji.
Dzięki za wszystkie dotychczas opublikowane obrazy i mam nadzieję na więcej, mimo że każda LoRA ma swój czas w tym szybko zmieniającym się sektorze AI i czar przemija. :)
V2.0
Małe ogłoszenie do V2.0 (02.04 lub 04.02, w zależności od kraju)
No cóż, oficjalnie jestem idiotą.
Zacząłem trenować kolejną LoRA, gdy zauważyłem, że w próbkach nie dzieje się nic nawet po 2000 krokach, co jest praktycznie niemożliwe. Szukałem przyczyny i zobaczyłem ustawienie, którego nie zmieniłem z powrotem (lub właściwego ustawienia) – LR warmup. Normalnie nie używam warmupu, ale testowałem to na zestawie 4 obrazów. Zawsze mam ustawione 100 epok, ale model jest zapisywany co 500 kroków, nie co epokę. Warmup był ustawiony na 32%, więc 4 obrazy × 10 powtórzeń × 100 epok = 4000 kroków (32% warmupu = 1280 kroków, gdzie niewiele się dzieje).
Teraz, ta LoRA miała te same ustawienia, ale z 60 obrazami (60 × 10 × 100 = 60000 - 32% warmupu = 19200 kroków)... więc nawet po 12000 krokach nie zaczęła działać, co oznacza, że właściwie trenowałem tylko powietrze. Wyjaśnia to wiele. Ponieważ zasnąłem, nie zauważyłem tego, choć dziwne było, że efekt pojawił się tak późno, co sądziłem, że wynika ze zdjęć.
Tak... to niewypał i większość tego, co robi, pochodzi z łączenia z V1.0.
Przetrenuję go ponownie w weekend, kiedy wrócę z pracy, tym razem z właściwymi ustawieniami.
Bardzo przepraszam. Może to był po prostu niezamierzony primaaprilisowy żart :) .... :(
Dodałem jeszcze trochę obrazów, ponieważ ostatnio sporo go używam, a nie dodawałem nowej LoRA od jakiegoś czasu, co wynika z tego, że mam dużo pracy i wybieram tylko nerwowe, skomplikowane tematy, które także "muszą" być tworzone w najbardziej zagmatwany sposób... inaczej byłoby nudno.
Poświęciłem też sporo czasu na rozbieranie Pony, co mnie w pewnym sensie zaskoczyło. Jeśli odłożysz na bok wszystko, co furry, anime i ogólnie porno, jest prawie bardziej podstawowy niż Base XL, co jest dobre do dodawania koncepcji i stylów poprzez trening LoRA, ale potrafi znacznie więcej rzeczy jak pozycjonowanie, emocje, dziwne kąty itd... ale to zupełnie inna historia.
Nie wiem, ile jeszcze zdążę wytrenować w tym roku. Może zrobię coś łatwiejszego pomiędzy, ale kto wie. AI pędzi szybko, więc może pojawi się coś nowego za miesiąc... albo tydzień.
Testowałem ten sam seed i ten sam model z wcześniej wygenerowanymi obrazami. Zmiana jest w niektórych przypadkach subtelna, w innych ekstremalna (i teraz wiem dlaczego: patrz ogłoszenie)
Przepraszam też, że nie stworzyłem więcej wariantów obrazów pokazywanych. Czasem przygotowanie obrazów zajmuje dłużej niż trening LoRA, ale w tym przypadku chyba nie ma to wielkiego znaczenia. Więcej rzeczy i tak przyjdzie z czasem.
V1.0
Próbowałem trochę nacisnąć AI, żeby zobaczyć, co wychwyci na obrazach niemal całkowicie czarnych, z ledwo widocznym kształtem.
Przygotowanie zestawu danych w Photoshopie było prawie niemożliwe, bo właściwie nic nie było widać. Oczywiście każdy ma inne ustawienia monitora, więc trudno powiedzieć, czy te obrazy były naprawdę tak ciemne, ale bardzo męczyły moje oczy. Nawet teraz patrzenie na wygenerowane obrazy jest trudne, choć nie są tak ciemne jak obrazy treningowe.
Byłem naprawdę zaskoczony, że model w ogóle coś wychwycił. Na razie odłożę go na bok, aż wymyślę, co z nim zrobić. Z pewnością robi dziwne rzeczy. Jakoś włożenie wygenerowanych obrazów do ControlNet IP-Adapter wzmacnia wszystko i generuje losowe wyniki.
Wskazówki dotyczące generowania:
Nie mam pojęcia... powodzenia.
Szczegóły modelu
Dyskusja
Proszę się log in, aby dodać komentarz.






