Zbliżone selfie uśmiechniętej bułgarskiej kobiety z naturalnie promienną skórą w miękkim świetle okiennym, noszącej srebrne kolczyki i bezrękawnik z wysokim kołnierzem w minimalistycznym lofcie.
Wypolerowana biała metaliczna robotyczna postać z widocznymi stawami serwo i geometrycznym pancerzem, z fragmentarycznym krystalicznym halo nad głową, czarnym dymem wirującym w oczodołach oraz okrągłą dziurką klucza odsłaniającą złożone przekładnie na twarzy na tle gradientu od indygo do ultrafioletu.
Kobieta w żółtym kombinezonie biologicznym stoi na skalistym, jałowym terenie i wpatruje się w kolosalną żółtą organiczną sferę z połączonymi strukturami przypominającymi jaja i żyłami pod zachmurzonym niebem.

Zalecane parametry

samplers

dpmpp_2m, DPM++ 2M

steps

40

cfg

1

Wskazówki

Dla ComfyUI z modelem Flux: CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength między 0.8 a 1.0 (zwykle 1.0; zmniejszyć do 0.87, jeśli jakość dłoni się pogorszy).

Dla ComfyUI z modelem SD3.5: CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength między 0.5 a 1.0 (zwykle 0.7).

Rozważ rozszerzenie zestawu danych o bardziej różnorodne pozy, aby poprawić dokładność anatomiczną w przyszłych aktualizacjach.

Sponsorzy twórcy

Jeśli chcesz wesprzeć pracę i przyszłe aktualizacje modelu Flux, odwiedź i przekaż darowiznę na https://ko-fi.com/danrisi.

Głównym celem było tworzenie bardziej „żywych” obrazów z żywszymi emocjami i bardziej dynamicznymi pozami oraz lekko amatorską jakością (może też generować obrazy wysokiej jakości).

P.S: Dziękuję wszystkim za opinie! Zauważyłem komentarze (nie tylko tutaj) dotyczące problemów z anatomią i gromadzę raporty oraz przykłady od Was wszystkich. Rozważam kilka możliwości rozwiązania tego problemu:

  1. Trening pełnego checkpointu, co może być rozsądniejszym podejściem dla spójnych ulepszeń.

  2. Rozszerzenie zestawu danych o więcej zdjęć przedstawiających różnorodne pozy, aby pomóc w dopracowaniu dokładności anatomicznej.

Doceniam Wasz wkład - naprawdę pomaga kształtować przyszłe aktualizacje

P.S.2: Przeniosłem trening na RunPod dla uzyskania spójnych, wysokiej jakości rezultatów. Jeśli chcesz wesprzeć moją pracę i przyszłe aktualizacje, możesz mnie znaleźć na Ko-fi. Planuję dopracować model, a nie tylko LoRa. https://ko-fi.com/danrisi

Ustawienia, których używam w ComfyUI dla Flux:
CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength= od 0.8 do 1.0 działa dobrze, ale zwykle używam 1, a jeśli jakość rąk się pogarsza, ustawiam 0.87

Ustawienia, których używam w ComfyUI dla SD3.5:
CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength= od 0.5 do 1.0 działa dobrze, ale zwykle używam 0.7

V2 - Flux

Przynosi jeszcze więcej realizmu i wszechstronności do twoich kreacji, ze znaczącymi ulepszeniami stabilności, anatomii i ogólnej jakości. Ta aktualizacja sprawia, że LoRA jest bardziej adaptacyjna, pozwalając osiągnąć różne poziomy jakości w zależności od promptów — od realistycznej wysokiej rozdzielczości po celowo niższą jakość estetyczną.

Trenowany na 1048 obrazach.

Co nowego:

Poprawki stabilności: Nowa wersja jest bardziej stabilna i lepiej współpracuje z tekstowymi promptami, zapewniając płynniejszy i bardziej przewidywalny wynik.

Udoskonalone dłonie i anatomia: Dłonie i anatomia ciała są bardziej dopracowane, co zwiększa realizm.

Elastyczność jakości: Przy odpowiednich promptach można dostosować zarówno wysoką, jak i niższą jakość estetyczną (przykłady dostępne).



V1.2 dla SD3.5 - Duża

Postanowiłem przygotować wersję dla SD3.5 z niemal tymi samymi ustawieniami. Moim zdaniem wygląda dobrze, choć zauważyłem pewne problemy z anatomią (w niektórych momentach nawet gorsze niż w Flux), ale estetyka (kolory, kontrast i inne elementy) wygląda nawet lepiej niż w Flux. Widzę potencjał w SD3.5, może kolejne wersje też będą na SD3.5.

V1.2

Zmieniono połowę obrazów w zestawie danych, zmieniono styl promptów, poprawiono dłonie, mniej efektów „latarki” w nocnych scenach oraz ogólnie poprawiono jakość LoRa (mam taką nadzieję).
W tej wersji nie jest już konieczne używanie mnóstwa „trigger words” jak w V1. Wystarczy dodać kilka z wymienionych w trigger words.

V1

Wytrenowano kolejną amatorską lorę (co już było robione wiele razy tutaj).

Wciąż użyłem zdjęć ze swojego zestawu z lat 2000 oraz dodałem kolejne 700 zdjęć. Jak dotąd wyszło całkiem dobrze, ale istnieje kontrowersyjny punkt dotyczący optymalizacji jakości — miałem nadzieję, że pomoże to kontrolować jakość, ale widzę, że raczej tylko zaciemniło model. W zestawie danych jest wiele różnych stopni jakości, takich jak:

1) Zdjęcie wysokiej rozdzielczości, wykonane telefonem, bez widocznych artefaktów, wyraźne i ostre

2) Zdjęcie niskiej rozdzielczości, amatorskie, wykonane aparatem cyfrowym, bez widocznych artefaktów jpeg, lekko zaszumione

3) Zdjęcie średniej rozdzielczości, wykonane telefonem, lekka ziarnistość spowodowana słabym oświetleniem, bez znaczących artefaktów cyfrowych

oraz inne ich kombinacje i wariacje. Myślę, że takie usunę w następnej wersji. Ale ta działa najlepiej dla mnie:

Zdjęcie niskiej rozdzielczości, amatorskie, wykonane aparatem cyfrowym, bez widocznych artefaktów jpeg, lekko zaszumione

Poprzedni
Frieren フリーレン - 葬送のフリーレン - v2.0-alpha [FLUX]
Następny
Crimson Acryllic FLUX - V1

Szczegóły modelu

Typ modelu

LORA

Model bazowy

Flux.1 D

Wersja modelu

Flux - v2

Hash modelu

b1c4ddf956

Wytrenowane słowa

amateurish photo
low lighting
in motion
overexposed
underexposed
GoPro lens
eerie atmosphere
smeared background
smeared foreground

Twórca

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa UltraRealistic Lora Project - Flux - v2

Zbliżone selfie uśmiechniętej bułgarskiej kobiety z naturalnie promienną skórą w miękkim świetle okiennym, noszącej srebrne kolczyki i bezrękawnik z wysokim kołnierzem w minimalistycznym lofcie.
Wypolerowana biała metaliczna robotyczna postać z widocznymi stawami serwo i geometrycznym pancerzem, z fragmentarycznym krystalicznym halo nad głową, czarnym dymem wirującym w oczodołach oraz okrągłą dziurką klucza odsłaniającą złożone przekładnie na twarzy na tle gradientu od indygo do ultrafioletu.
Kobieta w żółtym kombinezonie biologicznym stoi na skalistym, jałowym terenie i wpatruje się w kolosalną żółtą organiczną sferę z połączonymi strukturami przypominającymi jaja i żyłami pod zachmurzonym niebem.

Obrazy z estetyczny

Photorealistic image of a Chinese girl in traditional hanfu attire adorned with flower blossom jewelry and long dark hair, set against an ancient art-inspired background.
Kobieta o nieuporządkowanych brązowych włosach w kucyku, ubrana w turkusowy płaszcz przeciwdeszczowy, podarte dżinsy i skórzane buty, siedząca zamyślona na dużej skale nad mglistym brzegiem rzeki, z widocznym oddechem na zimnym powietrzu.
Młoda elficka czarownica o niebieskich oczach i opadających ciemnych włosach, nosząca duży kapelusz czarownicy i ciemnoniebieskie ubranie z ozdobnym obszyciem, stoi w ruinach zamku otoczona magicznym wirującym tornadem.
Księżniczka ubrana w złotą zbroję jedzie na szczegółowym metalicznym dinozaurze z niebieskimi ozdobami z kamieni szlachetnych i czerwonymi, nietoperzowymi skrzydłami o zachodzie słońca, osadzona w fantastycznym górskim krajobrazie z kolorowymi kwiatami.
Dziewczyna w stylu anime stojąca pod gradientowym niebem podczas zachodu słońca, oglądająca jasną spadającą gwiazdę z rozproszonymi chmurami i gwiazdami powyżej.
Sylwetki łodyg dzikich kwiatów na tle dramatycznego pomarańczowego nieba zachodzącego słońca z okrągłymi refleksami bokeh w makrofotografii o małej głębi ostrości
Spokojny minimalistyczny górski krajobraz z ząbkowanymi szczytami odbijającymi się w spokojnym jeziorze przy wczesnym świetle świtu, otoczony lekką mgłą i czystym niebem.
Portret w stylu anime Disney młodej kobiety z długim splecionym warkoczem, delikatnie uśmiechającej się w sylwecie na tle jasnego, kinowego światła z efektami bokeh.
Sylwetka wojownika stojącego w drzwiach starożytnej świątyni o zmierzchu, z ciemnymi kolumnami i niebem zmierzchu z dalekimi chmurami i blaskiem ognia w tle.
Krajobraz w stylu anime przedstawiający poszukiwacza przygód stojącego na oświetlonej słońcem ścieżce otoczonej wysokimi górskimi kanionami z barwnymi jesiennymi drzewami i tradycyjną świątynią w tle.

Obrazy z fotorealistyczny

Photorealistic image of a Chinese girl in traditional hanfu attire adorned with flower blossom jewelry and long dark hair, set against an ancient art-inspired background.
Balon na gorące powietrze w kształcie dużego zielonego kaktusa z kolczastą teksturą unoszący się na zachmurzonym niebiesko-szarym niebie, z wiklinowym koszem niosącym ludzi, a wokół latają ptaki.
Pręgowany kot noszący małą złotą koronę, siedzący elegancko przy eleganckim stole zastawionym złotymi pucharami i porcelanową zastawą w wystawnym dworze.
Gotycka japońska kobieta z długimi białymi włosami i bladą skórą, ubrana w szczegółowe czarne kimono z białym kwiatowym haftem, z ciemną szminką i niebieskimi oczami, stojąca w pomieszczeniu z drewnianymi drzwiami przesuwanymi w tle.
Scena w ciemnej piwnicy z migoczącym telewizorem CRT wyświetlającym duże oczy, z zniekształconą postacią czającą się za nim i kasetą VHS na podłodze.
Hiper-detaliczny portret dziewczyny z czerwono-różowymi włosami, ubraną w tradycyjne japońskie złoto-czarne kimono, trzymającą zimne ognie na tle rozświetlonego fajerwerkami nocnego nieba Kioto.
Hiperrealistyczna postać kobieca z czarnymi włosami i niebieskimi oczami stoi pewnie wśród gruzów i eksplodującego miejskiego tła, ubrana w szczegółowy czarno-biały strój ze złotymi akcesoriami.
Młoda kobieta z mokrymi włosami i przezroczystą mokrą sukienką idąca nocą po miejskiej ulicy podczas burzy deszczowej o ciemnoniebieskich tonach.
Fotorealistyczny portret całej postaci muskularnego chromowego obcego paladyna stojącego na placu w futurystycznym krajobrazie miejskim z detaliczną zbroją i refleksyjnymi powierzchniami.

Obrazy z seksowny

Moda wysokiej klasy w neonowej tematyce, przedstawiająca blondynkę w dramatycznej pozycji siedzącej, ubraną na czarno i noszącą choker, z pomarańczowym i turkusowym oświetleniem oraz grafiką cyfrowych zakłóceń na oczach.
Blondynka z piegami i uśmiechem siedząca na dworze w bordowej koszulce z dekoltem w serek i kwiecistej mikroskopowej spódniczce w naturalnym świetle
Portret zbliżeniowy młodej kobiety o niebieskich oczach, ubrane w szczegółową zbroję w stylu celtyckim w lesie, z realistyczną teksturą skóry i miękkim naturalnym światłem.
Portret z bliska eleganckiej dorosłej Hiszpanki z ciemnobrązowymi oczami, jasnobrązowymi włosami ułożonymi w quiff, noszącej niebieskie kolczyki z kamieni szlachetnych i stylowy ciemny makijaż gotycki, na tle jasnoniebieskiego wirującego bokeh.
Stylizowana dziewczyna z anime z długimi czarnymi włosami i wyrazistymi zielonymi oczami, ubrana w czarny strój i pończochy do ud ozdobione czerwonymi kwiatowymi tatuażami, trzymająca katanę na czerwonym tle.
Piękna elfka z długimi blond włosami, zielonymi oczami i spiczastymi uszami w magicznym leśnym otoczeniu, ubrana w szczegółowe zielono-złote ubranie z koroną.
Czerwona krew cieknąca w stylu flat z minimalistycznym odwróconym tłem, z gładkimi, błyszczącymi teksturami i podświetleniami w kolorze punktowym.
Sylwetka uwodzicielskiej krwawej czarodziejki w błyszczącej czerwieni na stonowanym szarym tle z designem flat i neonowymi akcentami.
Szczegółowy profil boczny prehistorycznego dinozaura plemiennego ozdobionego żywymi pomarańczowymi i czarnymi ozdobnymi piórami oraz dekoracjami w stylu płaskich kolorów z odwróconym tłem.
Wróżka o srebrnych włosach w zielonej obcisłej sukience i tiarze, stojąca w mistycznym lesie pod pełnią księżyca z świecącymi żółtymi skrzydłami i krążącymi wokół niej duszkami.

Obrazy z styl

Zdeterminowany polski łucznik celujący z łuku z strzałą, owinięty w flagę Polski na tle ciemnej fantazji z oświetleniem krawędziowym.
Model 3D robota Iron Giant stojącego na zewnątrz w nocy, zwróconego twarzą do chłopca w żółtej bluzie z kapturem, z gwiaździstym niebem i górskim krajobrazem w tle.
Szczegółowa ilustracja dziewczyny z czarnymi włosami w dynamicznej, abstrakcyjnej kompozycji z atramentu i kredy z krągłą sylwetką i żywymi wargami
Szczegółowy obraz olejny czarnego kruka siedzącego na poskręcanej, bezlistnej gałęzi drzewa na tle żywego nieba o zachodzie słońca z pomarańczowymi i czerwonymi chmurami, odległymi górami oraz delikatnie świecącym księżycem.
Zbliżenie portretu zmysłowej młodej kobiety z płonącymi oczami i diabolicznym uśmiechem, wykonany w gotyckim, mrocznym stylu z płomiennymi pomarańczowymi i czarnymi teksturami przypominającymi węgiel.
Zdjęcie całej postaci tancerki baletowej z fioletowymi włosami w plisowanej sukience na wypolerowanej podłodze z wstążkami i płatkami.
Kobieta z krótkimi niebieskimi włosami w czarnej mini sukience w parku rozrywki.
Kobieta w legginsach ze zwierzęcym wzorem i satynowej koszulce na ramiączkach w ręcznie wykonanym salonie.
Dolna część ciała w złotych botkach i wielokolorowej sukience.
Stylowa dziewczyna anime z ciemnymi włosami związanymi w kucyk, ubrana w białą koszulę, czerwone spodnie z wysokim stanem i czarną kurtkę. Obraz wygenerowany przez AI przy użyciu Stable Diffusion.

Obrazy z kobieta

A woman with dark hair and a red headband wearing a red and white gingham mini dress and black biker boots, sitting on a concrete ledge at night against a textured urban wall with city lights in the background.
Spokojna chińska kobieta z długimi czarnymi włosami ozdobionymi ozdobną biżuterią i tradycyjnym strojem, z zamkniętymi oczami, z mitycznym stworzeniem za nią.
Szczupła kobieta w czerwonej, długiej, dopasowanej sukni z rozcięciem i frędzlami, nosząca czarne rękawiczki i pończochy, futurystyczne okulary na głowie oraz opaskę z piór, na tle w stylu art deco w odcieniach niebieskiego.
Zbliżenie orzechowego oka kobiety ukazujące szczegółowe rzęsy, gładką teksturę skóry i delikatny makijaż.
Portret rudowłosej kobiety z uderzającymi niebieskimi oczami, piegami i długimi, falującymi włosami, ubranej w zieloną bluzkę.
Widok z tyłu na kobietę z włosami upiętymi w kok, ubraną w białą sukienkę z odkrytymi ramionami, stojącą refleksyjnie obok okna, przez które do przyciemnionego pokoju wpada ciepłe światło słoneczne.
Obraz w stylu impresjonizmu przedstawiający kobietę w ciemnej kawiarni nocą, pijącą wino, z tętniącym życiem placem widocznym przez okno.
Kobieta z ciemnymi blond kręconymi, rozwianymi przez wiatr włosami siedzi na skale pośród rozbijających się fal, obserwując zachód słońca nad magiczną doliną z wirującymi chmurami i górami.
Kobieta o nieuporządkowanych brązowych włosach w kucyku, ubrana w turkusowy płaszcz przeciwdeszczowy, podarte dżinsy i skórzane buty, siedząca zamyślona na dużej skale nad mglistym brzegiem rzeki, z widocznym oddechem na zimnym powietrzu.
Kobieta ze świecącą złotą biżuterią na zębach i neonowo świecącymi oczami wydycha gęsty zielony dym, który tworzy upiorne, świecące czaszki za nią w ciemnym otoczeniu.