modele/SDXL / Flux.1 D - Matowa (Vanta)Czarna - Eksperyment - SDXL v1.0

SDXL / Flux.1 D - Matowa (Vanta)Czarna - Eksperyment - SDXL v1.0

|
7/13/2025
|
1:49:39 AM
| Discussion|
0
Sylwetka kobiety stojącej na ciemnym, mglistym polu, zwrócona twarzą do ogromnego eterycznego potwora mononoke przypominającego lisa z świecącymi niebieskimi oczami i siedmioma ogonami pod nastrojowym kinowym oświetleniem.
Sylwetka kobiety z dużymi anielskimi skrzydłami wznosząca się ku słońcu ponad chmurami, oświetlona złotym blaskiem i zrzucająca pióra.
Kobiecy anioł z dużymi rozpostartymi ciemnymi skrzydłami wyłaniający się nad gęstymi chmurami, oświetlony ciepłym światłem krwawego księżyca, zrzucający pióra w nastrojowej, kinowej atmosferze.
Postać kobieca z ciemnymi, lśniącymi skrzydłami vanta black wznosi się nad chmurami, zrzucając pióra wśród atmosferycznej mgły i kinowego oświetlenia.
Bogini cyborg idąca po powierzchni małej planety o zachodzie słońca, niosąca neonową przezroczystą plastikową torbę z kosmiczną, niebieską chmurą w tle
Beduińska księżniczka z kapturem i blond włosami trzymająca świecącą przezroczystą kulę Pokeball na oświetlonej słońcem łące o zachodzie, otoczona złotym światłem i atmosferyczną mgłą.
Cieniowa postać ubrana w ciemną, poszarpaną tkaninę stoi w brzozowym lesie, trzymając świecącą czerwoną kulę, otoczona głębokimi cieniami i kinową mgłą.
Zakapturzona, bez twarzy rycerka w szczegółowej średniowiecznej zbroi stoi na mglistym, szarym łąkowym, trzymając świecącą czerwonobiałą kulę, z starożytną kamienną fontanną i skalistymi wzgórzami w tle.
Ciemna przezroczysta postać kobiety-grzyba z gładką kulistą złotą kulą w dłoni stoi w słabo oświetlonym brzozowym lesie z atmosferycznym kinowym oświetleniem i głębokimi cieniami.
Ciemna, okryta kapturem kobieta grzyb stoi w lesie brzozowym trzymając czarną włócznię, otoczona przez czerwono zabarwione liście i kinową mgłę atmosferyczną.
Zbliżenie fotorealistycznego ślimaka z neonowym różowym i niebieskim subsurface scattering na skorupie i ciele, na tle kinowego zachodu słońca z atmosferyczną mgłą i ziarnem filmu.
Zbliżenie starego android mouse z dużymi, popękanymi uszami, znoszonym ogrodniczkami i delikatnym uśmiechem, stojącego w burzowym, ciemnym otoczeniu z dramatycznym podświetleniem z tyłu.

Zalecane podpowiedzi

detailed, clear, no light

Zalecane negatywne podpowiedzi

noise

Zalecane parametry

samplers

DPM++ 2M Karras

steps

10 - 20

cfg

3

clip skip

2

resolution

512x512, 768x1024

other models

- SDXL - Corrupted_V1.3_LORAfied_V1.0.fp16.safete.fp16 (c938b9bc15), SDXL - T - starlightXLAnimated_v3 (00a14cdeaa), SDXL - T - roxl_v20 (df67355c65), SDXL - albedobaseXL_v20 (a928fee35b), SDXL - opendallev11_v11 (7cef300d71)

Wskazówki

Flux.1 D najlepiej używać zmieszanego z innymi LoRA, które dodają kolor lub styl, ze względu na tendencję do generowania ciemniejszych, fotograficznych obrazów.

Spodziewaj się nieprzewidywalnych i eksperymentalnych rezultatów - czasem kopiuje dane treningowe 1:1 lub generuje prawie całkowicie czarne obrazy.

Model dobrze działa na średniej klasy GPU, takich jak 4060 TI z 16GB VRAM, niekoniecznie potrzebuje najnowszego 4090.

ControlNet IP-Adapter może ulepszyć wygenerowane obrazy, ale może też dawać losowe efekty.

Nie zalecano wyraźnych, konsekwentnych pozytywnych lub negatywnych promptów; zalecana jest eksperymentacja.

Flux.1 D - V2.0

Ostatnia próba, aby to uruchomić w Flux... i przez uruchomić rozumiem zrobić jak największy bałagan. Najprawdopodobniej nigdy nie zrobi tego samego co wersja SDXL. Nawet po 6000 krokach i samych obserwacjach było to dość oczywiste. SDXL to trochę tak jak „ok, nauczę się tego, ale dodam coś od siebie”, podczas gdy Flux walczy / kompensuje na potęgę z czymkolwiek, czego nie wie jak obsłużyć lub co dokładnie chcę, by się nauczył. Z drugiej strony, po długim treningu na pewno wygeneruje te obrazy, i to mocno, do tego stopnia, że kopiuje dane treningowe 1/1, co skutkuje prawie czarnym obrazem. Flux potrafi idealnie skopiować obraz, jak zdjęcia, nawet po kilku krokach.

Jak powiedziałem w ostatniej wersji Flux, w większości przypadków to coś, co chcę mieszać z innymi LoRA, które są bardziej kolorowe lub mają określony styl.

Te same obrazy co w SDXL v.3.0 plus kilka dodanych dla wersji Flux (niektóre w formacie krajobrazu). Usunąłem jednak 3 obrazy, które najpewniej odpowiadały za co najmniej 80% zdjęć zamieszczanych przeze mnie lub innych osób. Chciałem to zrobić już w wersji SDXL, ale wtedy się jednak na to nie zdecydowałem. Powód jest taki, że te obrazy były po prostu zbyt dominujące, powodując wiele dziwnych zachowań i tendencję do tworzenia określonych obrazów. Widziałem to w wersji Flux v.1.0 i teraz ich nie ma. Popularność może na tym ucierpieć, ale mam to gdzieś.

Czuję, że wielu ludzi po prostu używa pewnej LoRA, bo jest w ich „procesie”. W niektórych przypadkach obrazy bez LoRA wyglądają lepiej i nigdy byś się nie domyślił. Style LoRA to inna bajka, bo one dodają konkretny styl, który jest wyraźnie widoczny przy generowaniu obrazów. To tutaj ma duży potencjał na pogorszenie wszystkiego, dlatego nie wybierałem specjalnie obrazów, które zamieściłem, żeby pokazać co mam na myśli. Jeśli dodasz coś z silnym światłem lub źródłem światła, na przykład świecę, Flux (i kilka modeli SDXL) sam dodaje ciemne otoczenie, bo źródło światła zawsze potrzebuje jakiegoś mroku, żeby być zauważalne (światło samochodu w słoneczny dzień niewiele zdziała).

Nie pytaj nawet, czy działa w NF4 czy QQUFUF wersja 5.64.3255 K4 2 albo co tam jeszcze. Plik nie jest za duży, możesz przetestować sam. Trzymam się z dala od tych modeli, chyba że zaoferują więcej korzyści niż zwykła wersja FP8/16 Dev poza tylko mniejszym zużyciem pamięci i/lub nieistotnym wzrostem prędkości (albo jeszcze gorszym spadkiem).

Wiem, jak irytujące może być, gdy ktoś szybko wypuszcza nową wersję jakiegokolwiek modelu, jeśli właśnie się do niej przyzwyczaiłeś. Nie zamierzam dalej rozwijać tego modelu, po prostu zobaczę, czy ja albo ktoś inny wyciągnie z tego coś pożytecznego.

Poza tym ilość pracy związana z przygotowaniem obrazów w Photoshopie nie jest tego warta, szczególnie jeśli wiesz, że nic to nie zmieni. Wolę zrobić coś nowego, albo raczej głupiego, co jest ciekawe lub tworzy losowe efekty... albo po prostu „fluxify” stare modele żeby zobaczyć, co z tego wyjdzie.


Flux.1 D - V1.0

Po kilku próbach z Kohya i innych, ku mojemu zaskoczeniu, udanych testach z dość dziwnymi koncepcyjnymi LoRA dla Flux, pomyślałem, że spróbuję tego zobaczyć, czy działa. W sumie nie zależało mi na wersji Flux, bo Flux radzi sobie dobrze z kontrastem (w większości). Głównie chciałem pozbyć się sztucznego/fejkowego wyglądu i pomyślałem, że tak „niezdefiniowany” zestaw danych się sprawdzi. Cóż, czasem to działa, czasem pogarsza sprawę.

Podobnie jak wersja SDXL, to coś bardziej na dołączanie do innych LoRA, zwłaszcza tych dodających dużo koloru.

Przepraszam za lenistwo w promptach i obrazach. Użyłem praktycznie tych samych materiałów co w V.3.0, ale to wystarczy na pokaz. Czasami traci szczegóły i nie dodaje niczego szczególnie interesującego (np. obraz meduzy albo papugi).

  • Ten sam seed dla odpowiadających obrazów

  • Pierwsze 2 obrazy są z i bez LoRA, potem odwrotnie — najpierw bez, potem z LoRA (czasem o różnej sile)

  • Niektóre mają na początku słowa triggerowe, ale w Flux raczej nie są potrzebne

  • Oparte na zestawie danych V1.0, nie na nowym (nie chciałem używać za dużo obrazów)

Nie jestem pewien, czy zrobię więcej LoRA dla Flux, ale zamierzam dużo testować. To teraz naprawdę mylące z tyloma wersjami i nie wydaje się, by było warto tracić dużo czasu na coś, co może stać się przestarzałe za 10 godzin.

I tak na marginesie: to było trenowane na 4060 TI (16 GB), zużycie VRAM między 14.4 a 15.2 GB, 3.95s/iteracja - 5.15s/iteracja, 512x, ranga 4... więc nie potrzeba 4090. Oczywiście byłoby szybciej, ale jeśli możesz uruchomić i zapomnieć, robiąc coś innego w międzyczasie, to nie problem, chyba że chcesz coś specjalnie testować.

Jak zawsze, będę używał tu i ówdzie, żeby zobaczyć, czy uda mi się z tego coś sensownego wyciągnąć. Raczej coś dla zaspokojenia mojej ciekawości.


V.3.0

Po mojej małej wpadce z v2.0 upewniłem się, że tym razem to prawdziwa wersja, bez scalania czy innych sztuczek. Na początku byłem sceptyczny ze względu na ilość dodanych obrazów, że nie oddali się za bardzo od pierwszej wersji, ale na szczęście tak nie było.

Bardzo się cieszę, że wielu ludzi znalazło zastosowanie dla tej LoRA i stworzyło tyle obrazów. Biorąc pod uwagę, że nie było to zamierzone do tego, co robi teraz, fajnie widzieć, że ma inne zastosowania (jak wszystkie LoRA).

To prawdopodobnie (najprawdopodobniej) będzie ostatnia wersja przez jakiś czas, bo samo dodawanie kolejnych obrazów nie zmienia głównego efektu. Większość robi się przez kombinację różnych modeli, LoRA i promptów.

Skupię się bardziej na faktycznym tworzeniu obrazów, by znaleźć więcej kombinacji (i trochę odpocząć), robić nowe dziwne LoRA, naprawiać stare itd. Pobrałem też mnóstwo materiałów od ludzi i w większości nie miałem okazji ich użyć.

Dzięki ponownie za wszystkie dotychczas zamieszczone obrazy i mam nadzieję zobaczyć więcej, choć każda LoRA ma swoje ograniczone życie w tym szybko zmieniającym się sektorze AI i okres fascynacji nieuchronnie się skończy. :)


V2.0


Małe ogłoszenie do V2.0 (02.04 lub 04.02 w zależności od kraju)

No cóż, oficjalnie jestem idiotą.

Zacząłem trenować kolejną LoRA, gdy zauważyłem, że nic się nie dzieje na obrazkach testowych nawet po 2000 krokach, co jest prawie niemożliwe. Szukałem powodu i odkryłem ustawienie, którego nie zmieniłem (albo nie ustawiłem poprawnie) — LR warmup. Normalnie nie używam warmupu, ale wcześniej testowałem, co on robi, na zestawie 4 obrazów. Zawsze ustawiałem 100 epoch, ale model był zapisywany co 500 kroków a nie co epoch. Warmup był ustawiony na 32%, więc 4 obrazy x 10 powtórzeń x 100 epoch = 4000 kroków (32% warmup = 1280 kroków, gdzie niewiele się dzieje).

Teraz ta LoRA miała te same ustawienia, ale 60 obrazów (60 x 10 x 100 = 60000 - 32% warmup = 19200 kroków)... więc nawet po 12000 kroków nie zaczęła się naprawdę uczyć, co oznacza, że trenowałem właściwie na puste powietrze. To wiele wyjaśnia. Ponieważ zasnąłem, tego nie zauważyłem, chociaż dziwiło mnie, że efekt pojawiał się tak późno, myślałem, że to przez same obrazy.

Tak więc to bubel i większość obecnego efektu pochodzi z łączenia z V1.0.

Wrócę do treningu w weekend po pracy, tym razem z poprawnymi ustawieniami.

Bardzo przepraszam. Może to był niezamierzony żart primaaprilisowy :) .... :(


Dodałem kilka obrazów, bo ostatnio używam tej LoRA dużo, a nie wrzuciłem nowej od jakiegoś czasu, co wynika z tego, że miałem dużo pracy i wybierałem tylko stresujące, skomplikowane tematy, które "muszą" być zrobione w najbardziej zawiły sposób... wszystko inne byłoby nudne.

Dużo czasu poszło też na rozbiórkę Pony, co mnie w niektórych aspektach zaskakuje. Jeśli odłożysz na bok wszystko, co dotyczy furry, anime i pornografii, model jest prawie bardziej podstawowy niż Base XL, co jest dobre do dodawania koncepcji i stylów przez trening LoRA, ale zna dużo bardziej skomplikowane rzeczy jak pozycjonowanie, emocje, dziwne kąty itd... ale to już zupełnie inna historia.

Nie wiem, ile jeszcze uda mi się potrenować w tym roku. Może zrobię coś łatwiejszego w międzyczasie, ale kto wie. AI bardzo szybko się rozwija, więc może być coś nowego za miesiąc... albo tydzień.

  • Testowałem ten sam seed i ten sam model z wcześniej wygenerowanymi obrazami. Zmiana jest czasem subtelna, czasem ekstremalna (teraz wiem dlaczego: zobacz ogłoszenie)

  • Przepraszam też, że nie zrobiłem więcej wariantów pokazanych obrazów. Czasem przygotowanie obrazów trwa dłużej niż trening LoRA, ale to chyba tu nie ma większego znaczenia. Więcej materiałów i tak naturalnie się pojawi.


V1.0

Próbowałem trochę nacisnąć AI, aby zobaczyć, co wyłapie ze zdjęć treningowych, które są prawie całkiem czarne i mają tylko słaby kontur.

Przygotowanie takiego zestawu danych w Photoshopie było prawie niemożliwe, bo właściwie nic nie widziałem. Oczywiście każdy ma inne ustawienia monitora itd., więc trudno stwierdzić, czy te obrazy były naprawdę tak ciemne, ale miało to bardzo duże obciążenie na oczy. Nawet teraz patrzenie na wygenerowane obrazy jest trochę trudne, choć nie są tak ciemne jak treningowe.

Byłem właściwie zaskoczony, że model cokolwiek przejął. Odłożę go na razie na bok, aż wymyślę, co z nim zrobić. Na pewno robi dziwne rzeczy. Jakoś obrazki generowane przez ControlNet IP-Adapter wzmacniają wszystko i dają losowe rezultaty.

Wskazówki do generowania:

  • Nie mam pojęcia... powodzenia.

Poprzedni
SpaceShips by ChronoKnight - [FLUX] - v1.0
Następny
Faceless Androids autorstwa ChronoKnight - [FLUX] - v1.0

Szczegóły modelu

Typ modelu

LORA

Model bazowy

SDXL 1.0

Wersja modelu

SDXL v1.0

Hash modelu

b9ef3a8c75

Wytrenowane słowa

vntblk
black
dark
background

Dyskusja

Proszę się log in, aby dodać komentarz.