modele/UltraRealistic Lora Project - Flux - v2

UltraRealistic Lora Project - Flux - v2

Zofia Nowak

10/8/2025

12:53:42 AM

| Discussion|

Powiązane słowa kluczowe i tagi

Zbliżone selfie uśmiechniętej bułgarskiej kobiety z naturalnie promienną skórą w miękkim świetle okiennym, noszącej srebrne kolczyki i bezrękawnik z wysokim kołnierzem w minimalistycznym lofcie.

Wypolerowana biała metaliczna robotyczna postać z widocznymi stawami serwo i geometrycznym pancerzem, z fragmentarycznym krystalicznym halo nad głową, czarnym dymem wirującym w oczodołach oraz okrągłą dziurką klucza odsłaniającą złożone przekładnie na twarzy na tle gradientu od indygo do ultrafioletu.

Kobieta w żółtym kombinezonie biologicznym stoi na skalistym, jałowym terenie i wpatruje się w kolosalną żółtą organiczną sferę z połączonymi strukturami przypominającymi jaja i żyłami pod zachmurzonym niebem.

Zalecane parametry

samplers

dpmpp_2m, DPM++ 2M

steps

cfg

Wskazówki

Dla ComfyUI z modelem Flux: CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength między 0.8 a 1.0 (zwykle 1.0; zmniejszyć do 0.87, jeśli jakość dłoni się pogorszy).

Dla ComfyUI z modelem SD3.5: CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength między 0.5 a 1.0 (zwykle 0.7).

Rozważ rozszerzenie zestawu danych o bardziej różnorodne pozy, aby poprawić dokładność anatomiczną w przyszłych aktualizacjach.

Sponsorzy twórcy

Jeśli chcesz wesprzeć pracę i przyszłe aktualizacje modelu Flux, odwiedź i przekaż darowiznę na https://ko-fi.com/danrisi.

Głównym celem było tworzenie bardziej „żywych” obrazów z żywszymi emocjami i bardziej dynamicznymi pozami oraz lekko amatorską jakością (może też generować obrazy wysokiej jakości).

P.S: Dziękuję wszystkim za opinie! Zauważyłem komentarze (nie tylko tutaj) dotyczące problemów z anatomią i gromadzę raporty oraz przykłady od Was wszystkich. Rozważam kilka możliwości rozwiązania tego problemu:

Trening pełnego checkpointu, co może być rozsądniejszym podejściem dla spójnych ulepszeń.
Rozszerzenie zestawu danych o więcej zdjęć przedstawiających różnorodne pozy, aby pomóc w dopracowaniu dokładności anatomicznej.

Doceniam Wasz wkład - naprawdę pomaga kształtować przyszłe aktualizacje

P.S.2: Przeniosłem trening na RunPod dla uzyskania spójnych, wysokiej jakości rezultatów. Jeśli chcesz wesprzeć moją pracę i przyszłe aktualizacje, możesz mnie znaleźć na Ko-fi. Planuję dopracować model, a nie tylko LoRa. https://ko-fi.com/danrisi

Ustawienia, których używam w ComfyUI dla Flux:
CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength= od 0.8 do 1.0 działa dobrze, ale zwykle używam 1, a jeśli jakość rąk się pogarsza, ustawiam 0.87

Ustawienia, których używam w ComfyUI dla SD3.5:
CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength= od 0.5 do 1.0 działa dobrze, ale zwykle używam 0.7

V2 - Flux

Przynosi jeszcze więcej realizmu i wszechstronności do twoich kreacji, ze znaczącymi ulepszeniami stabilności, anatomii i ogólnej jakości. Ta aktualizacja sprawia, że LoRA jest bardziej adaptacyjna, pozwalając osiągnąć różne poziomy jakości w zależności od promptów — od realistycznej wysokiej rozdzielczości po celowo niższą jakość estetyczną.

Trenowany na 1048 obrazach.

Co nowego:

Poprawki stabilności: Nowa wersja jest bardziej stabilna i lepiej współpracuje z tekstowymi promptami, zapewniając płynniejszy i bardziej przewidywalny wynik.

Udoskonalone dłonie i anatomia: Dłonie i anatomia ciała są bardziej dopracowane, co zwiększa realizm.

Elastyczność jakości: Przy odpowiednich promptach można dostosować zarówno wysoką, jak i niższą jakość estetyczną (przykłady dostępne).

V1.2 dla SD3.5 - Duża

Postanowiłem przygotować wersję dla SD3.5 z niemal tymi samymi ustawieniami. Moim zdaniem wygląda dobrze, choć zauważyłem pewne problemy z anatomią (w niektórych momentach nawet gorsze niż w Flux), ale estetyka (kolory, kontrast i inne elementy) wygląda nawet lepiej niż w Flux. Widzę potencjał w SD3.5, może kolejne wersje też będą na SD3.5.

V1.2

Zmieniono połowę obrazów w zestawie danych, zmieniono styl promptów, poprawiono dłonie, mniej efektów „latarki” w nocnych scenach oraz ogólnie poprawiono jakość LoRa (mam taką nadzieję).
W tej wersji nie jest już konieczne używanie mnóstwa „trigger words” jak w V1. Wystarczy dodać kilka z wymienionych w trigger words.

Wytrenowano kolejną amatorską lorę (co już było robione wiele razy tutaj).

Wciąż użyłem zdjęć ze swojego zestawu z lat 2000 oraz dodałem kolejne 700 zdjęć. Jak dotąd wyszło całkiem dobrze, ale istnieje kontrowersyjny punkt dotyczący optymalizacji jakości — miałem nadzieję, że pomoże to kontrolować jakość, ale widzę, że raczej tylko zaciemniło model. W zestawie danych jest wiele różnych stopni jakości, takich jak:

1) Zdjęcie wysokiej rozdzielczości, wykonane telefonem, bez widocznych artefaktów, wyraźne i ostre

2) Zdjęcie niskiej rozdzielczości, amatorskie, wykonane aparatem cyfrowym, bez widocznych artefaktów jpeg, lekko zaszumione

3) Zdjęcie średniej rozdzielczości, wykonane telefonem, lekka ziarnistość spowodowana słabym oświetleniem, bez znaczących artefaktów cyfrowych

oraz inne ich kombinacje i wariacje. Myślę, że takie usunę w następnej wersji. Ale ta działa najlepiej dla mnie:

Zdjęcie niskiej rozdzielczości, amatorskie, wykonane aparatem cyfrowym, bez widocznych artefaktów jpeg, lekko zaszumione

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

Frieren フリーレン - 葬送のフリーレン - v2.0-alpha [FLUX]

Następny

Crimson Acryllic FLUX - V1

Użyj tego modelu