UltraRealistic Lora Project - Flux - v2
Powiązane słowa kluczowe i tagi
Zalecane parametry
samplers
steps
cfg
Wskazówki
Dla ComfyUI z modelem Flux: CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength między 0.8 a 1.0 (zwykle 1.0; zmniejszyć do 0.87, jeśli jakość dłoni się pogorszy).
Dla ComfyUI z modelem SD3.5: CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength między 0.5 a 1.0 (zwykle 0.7).
Rozważ rozszerzenie zestawu danych o bardziej różnorodne pozy, aby poprawić dokładność anatomiczną w przyszłych aktualizacjach.
Sponsorzy twórcy
Jeśli chcesz wesprzeć pracę i przyszłe aktualizacje modelu Flux, odwiedź i przekaż darowiznę na https://ko-fi.com/danrisi.
Głównym celem było tworzenie bardziej „żywych” obrazów z żywszymi emocjami i bardziej dynamicznymi pozami oraz lekko amatorską jakością (może też generować obrazy wysokiej jakości).
P.S: Dziękuję wszystkim za opinie! Zauważyłem komentarze (nie tylko tutaj) dotyczące problemów z anatomią i gromadzę raporty oraz przykłady od Was wszystkich. Rozważam kilka możliwości rozwiązania tego problemu:
Trening pełnego checkpointu, co może być rozsądniejszym podejściem dla spójnych ulepszeń.
Rozszerzenie zestawu danych o więcej zdjęć przedstawiających różnorodne pozy, aby pomóc w dopracowaniu dokładności anatomicznej.
Doceniam Wasz wkład - naprawdę pomaga kształtować przyszłe aktualizacje
P.S.2: Przeniosłem trening na RunPod dla uzyskania spójnych, wysokiej jakości rezultatów. Jeśli chcesz wesprzeć moją pracę i przyszłe aktualizacje, możesz mnie znaleźć na Ko-fi. Planuję dopracować model, a nie tylko LoRa. https://ko-fi.com/danrisi
Ustawienia, których używam w ComfyUI dla Flux:
CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength= od 0.8 do 1.0 działa dobrze, ale zwykle używam 1, a jeśli jakość rąk się pogarsza, ustawiam 0.87
Ustawienia, których używam w ComfyUI dla SD3.5:
CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength= od 0.5 do 1.0 działa dobrze, ale zwykle używam 0.7
V2 - Flux
Przynosi jeszcze więcej realizmu i wszechstronności do twoich kreacji, ze znaczącymi ulepszeniami stabilności, anatomii i ogólnej jakości. Ta aktualizacja sprawia, że LoRA jest bardziej adaptacyjna, pozwalając osiągnąć różne poziomy jakości w zależności od promptów — od realistycznej wysokiej rozdzielczości po celowo niższą jakość estetyczną.
Trenowany na 1048 obrazach.
Co nowego:
Poprawki stabilności: Nowa wersja jest bardziej stabilna i lepiej współpracuje z tekstowymi promptami, zapewniając płynniejszy i bardziej przewidywalny wynik.
Udoskonalone dłonie i anatomia: Dłonie i anatomia ciała są bardziej dopracowane, co zwiększa realizm.
Elastyczność jakości: Przy odpowiednich promptach można dostosować zarówno wysoką, jak i niższą jakość estetyczną (przykłady dostępne).
V1.2 dla SD3.5 - Duża
Postanowiłem przygotować wersję dla SD3.5 z niemal tymi samymi ustawieniami. Moim zdaniem wygląda dobrze, choć zauważyłem pewne problemy z anatomią (w niektórych momentach nawet gorsze niż w Flux), ale estetyka (kolory, kontrast i inne elementy) wygląda nawet lepiej niż w Flux. Widzę potencjał w SD3.5, może kolejne wersje też będą na SD3.5.
V1.2
Zmieniono połowę obrazów w zestawie danych, zmieniono styl promptów, poprawiono dłonie, mniej efektów „latarki” w nocnych scenach oraz ogólnie poprawiono jakość LoRa (mam taką nadzieję).
W tej wersji nie jest już konieczne używanie mnóstwa „trigger words” jak w V1. Wystarczy dodać kilka z wymienionych w trigger words.
V1
Wytrenowano kolejną amatorską lorę (co już było robione wiele razy tutaj).
Wciąż użyłem zdjęć ze swojego zestawu z lat 2000 oraz dodałem kolejne 700 zdjęć. Jak dotąd wyszło całkiem dobrze, ale istnieje kontrowersyjny punkt dotyczący optymalizacji jakości — miałem nadzieję, że pomoże to kontrolować jakość, ale widzę, że raczej tylko zaciemniło model. W zestawie danych jest wiele różnych stopni jakości, takich jak:
1) Zdjęcie wysokiej rozdzielczości, wykonane telefonem, bez widocznych artefaktów, wyraźne i ostre
2) Zdjęcie niskiej rozdzielczości, amatorskie, wykonane aparatem cyfrowym, bez widocznych artefaktów jpeg, lekko zaszumione
3) Zdjęcie średniej rozdzielczości, wykonane telefonem, lekka ziarnistość spowodowana słabym oświetleniem, bez znaczących artefaktów cyfrowych
oraz inne ich kombinacje i wariacje. Myślę, że takie usunę w następnej wersji. Ale ta działa najlepiej dla mnie:
Zdjęcie niskiej rozdzielczości, amatorskie, wykonane aparatem cyfrowym, bez widocznych artefaktów jpeg, lekko zaszumione
Szczegóły modelu
Typ modelu
Model bazowy
Wersja modelu
Hash modelu
Wytrenowane słowa
Twórca
Dyskusja
Proszę się log in, aby dodać komentarz.






