UltraReal Fine-Tune - v4
Zalecane podpowiedzi
d1g1cam, amateur photo, low-lit, Low-resolution photo, shot on a mobile phone
Zalecane parametry
samplers
steps
cfg
Wskazówki
Używaj samplerów DPM++ 2M dla płynnych i spójnych wyników.
Celuj w 30–50 kroków, aby uchwycić drobne szczegóły bez nadmiernego przetwarzania.
Beta Scheduler pozostaje najlepszym wyborem dla tego checkpointu.
Używaj złożonych promptów z jasnymi, oddzielonymi przecinkami frazami; zachowaj zwięzłość i opisowość.
Niższe CFG o 0.1 lub 0.2 może czasem poprawić szczegóły, ale może wydłużyć czas generowania.
Unikaj używania UltraRealPhoto LoRA z tym checkpointem, aby zapobiec przesadzonym obrazom; zamiast tego używaj Realism Amplifier.
Wysoka rozdzielczość w promptach może pomóc uniknąć artefaktów niskiej rozdzielczości.
Najważniejsze informacje o wersji
zwiększona estetyka, nieznacznie zmniejszona anatomia
V4
Dobrze, co nowego w tej wersji? Podkręciłem suwak estetyki, dodałem więcej różnorodności wiekowej i poprawiłem sposób, w jaki model radzi sobie z cechami azjatyckimi. Ale – jak to zwykle bywa – zauważyłem, że ręce są trochę bardziej niezdarne. Cóż, nie da się wygrać ze wszystkim.
Zdecydowanie polecam łączenie tego modelu z moimi LoRA, takimi jak realism amplifier, 2000s analog core i innymi, ponieważ ten checkpoint najlepiej działa jako baza dla stylizowanych LoRA. Możliwe, że zrobię jeszcze jedną wersję (bo serio, trochę nie wyszły mi v3 i v4), ale najpierw zajmę się dostrajaniem Flex.Alpha.
Dostępne wersje: bf16, fp8, q8_0 - pruned fp16 oraz q4_k_m - pruned fp8
P.S: Nie używaj mojego UltraRealPhoto LoRA z tym checkpointem - ma ogromny wpływ na styl, przez co obraz staje się przesadzony. Jeśli korzystasz z UltraReal Fine-Tune, wybierz Realism Amplifier dla najlepszych rezultatów. UltraRealPhoto LoRa została stworzona do poprawy słabych cieni, światła i twarzy, ale te elementy są już uwzględnione w checkpoint, więc możesz po prostu dodać amplifier dla lepszego realizmu.
Aktualizacja V3 (Eksperymentalna)
To wydanie to krok naprzód, choć wciąż jest to praca w toku. Skupiłem się na poprawie kilku kluczowych aspektów, takich jak akty, stopy i anatomia dolnej części ciała. Wyniki są lepsze niż wcześniej, ale jeszcze nie na poziomie, do którego dążę. Niemniej ta wersja oferuje zauważalne ulepszenia jakości i tekstury, zapewniając bardziej szczegółowe i dopracowane efekty w porównaniu do poprzednich wersji.
Zalecane ustawienia:
CFG Scale: 3 (zamiast 2.5 używanych we wcześniejszych wersjach)
Steps: 50 (pomaga zapewnić stabilność, choć drobne niestabilności w dłoniach i palcach nadal występują)
CFG 0.9 vs. 1.0: Niższe CFG o 0.1 lub nawet 0.2 czasami poprawia szczegóły (nie zawsze, więc warto eksperymentować), choć może wydłużyć czas generowania.
Odnośnie nagich postaci: wciąż nie działają prawidłowo, ale aktywnie nad tym pracuję i spodziewam się poprawy w następnej wersji.
Dobre wieści - mam już przygotowane zestawy danych dla V3.5, którą planuję wydać znacznie szybciej niż przerwę pomiędzy V2 a V3. Dzięki większemu doświadczeniu i opiniom z tej wersji jestem pewien, że kolejna aktualizacja przyniesie znaczące ulepszenia.
Jak zawsze bardzo doceniam wasze wsparcie i opinie – są nieocenione podczas dalszego doskonalenia tego projektu ❤️
P.S.: Mam wrażenie, że im bardziej dostrajam Flux, tym bardziej pogarsza się w innych obszarach. Myślę też o próbie dostrojenia Flex Alpha (projekt wygląda bardzo obiecująco).
Co nowego w v2.0?
Ulepszona anatomia: Ręce, stopy i pozy zostały znacznie poprawione, oferując bardziej naturalne i dokładne rezultaty. Pożegnaj się z przesadnie zdeformowanymi kończynami!
Lepsze tekstury i jakość: Ulepszone detale skóry, bogatsze tekstury i ostrzejsze efekty ogólnie. Rozmyte obrazy zdarzają się rzadziej niż w poprzedniej wersji lub przy użyciu samych LoRA.
Poprawione renderowanie tekstu: Podjęto wysiłki, by poprawić generowanie tekstu na obrazach, co jest znacznie lepsze niż wcześniej. Jednak wciąż mogą występować artefakty i czasami pojawiają się dziwne symbole zamiast czytelnych słów. To nadal praca w toku.
Rozszerzony zestaw danych: Większy i bardziej zróżnicowany zestaw danych (1800 obrazów) wprowadza lepszą równowagę stylów, oświetlenia i kompozycji.
Dodane warianty checkpointów
Dla zapewnienia kompatybilności z różnymi środowiskami pracy dodałem kilka wariantów checkpointów:
BF16
FP8
Quant 8 (Q8)
Quant 4 (Q4)
NF4
Z moich testów wynika, że Quant 8 (Q8) oferuje trochę lepszą jakość od FP8, zapewniając bardziej szczegółowe detale przy zachowaniu kontrolowanego zużycia zasobów, ale pozostałe również działają dobrze. Wybierz wersję, która najlepiej pasuje do Twojej konfiguracji.
Znane ograniczenia
Możliwości NSFW: W tej wersji nadal słabo rozwinięte. Jednak drobne dostrojenie skoncentrowane na treściach NSFW jest już w przygotowaniu.
Renderowanie tekstu: Choć generowanie tekstu jest lepsze, okazjonalnie mogą pojawiać się artefakty jak dziwne symbole lub niekompletne słowa. Zauważyłem, że użycie t5xxl fp16 zamiast fp8 znacznie pomaga przy tekście.
Wskazówki dla najlepszych rezultatów
Sampler: Używaj samplerów DPM++ 2M dla płynnych i spójnych wyników.
Steps: Celuj w 30–50 kroków, aby uzyskać drobne szczegóły bez nadmiernej obróbki.
Scheduler: Beta Scheduler pozostaje najlepszym wyborem dla tego checkpointu.
Wskazówki dotyczące promptówNajlepszy styl promptów to złożone prompty z jasnymi, oddzielonymi przecinkami frazami. Możesz być kreatywny w opowiadaniu historii, ale niepotrzebne opisy typu „this crap added more vintage to her style” nie poprawią wyników. Zachowaj zwięzłość i opisowość, skupiając się na istotnych detalach wizualnych dla najlepszych efektów.
Plany na przyszłość
Jestem zobowiązany do dalszego rozwijania tego fine-tune. Następna aktualizacja prawdopodobnie skupi się na:
Rozszerzeniu możliwości NSFW
Poprawie rzadkich przypadków, takich jak dynamiczne pozy i scenariusze oświetleniowe
Ulepszeniu renderowania tekstu dla ostrzejszych, dokładniejszych rezultatów
P.S: Jeśli nadal nie masz realistycznego efektu, spróbuj dodać mój ultrareal lora, zwykle bardzo pomaga
Ultra-Realistyczny Flux Fine-Tune v1
To mój pierwszy eksperyment w dostrajaniu checkpointu, oparty na fundamentach mojej UltraReal LoRA i rozszerzonym zestawie danych. Cel? Podnieść realizm na wyższy poziom, znajdując złoty środek między amatorską estetyką a profesjonalną, wysokiej jakości wizualizacją.
Choć to tylko pierwsza wersja i widzę pole do dalszych ulepszeń – wyniki są dobre, ale nie idealne (ręce i stopy czasem mogą być zdeformowane, lecz sytuacja nie jest krytyczna, nadal lepiej niż w domyślnym Flux). Ten fine-tune nie jest tylko do amatorskich efektów; błyszczy profesjonalną jakością, oferując wyjątkowe detale, realistyczne cienie i oświetlenie. To wszechstronny model, który odblokowuje szersze możliwości generowania realistycznych obrazów.
To wciąż praca w toku i dzielę się nim, aby zebrać opinie i zobaczyć, jak inni kreatywnie go wykorzystują. Jeśli go przetestujesz, chętnie poznam Twoje wrażenia lub zobaczę efekty!
Załadowałem też obie wersje: fp16 (w ComfyUI lepiej używać z e5m2) oraz fp8 i Q4_0
🌟 Co nowego w tym fine-tune?
Rozszerzony zestaw danych: Prawie dwukrotnie większy od oryginalnej LoRA, obejmujący szeroki zakres stylów, oświetlenia i kompozycji.
Ulepszony realizm: Ostrzejsze detale, bogatsze tekstury i bardziej naturalne oświetlenie, zmniejszające różnicę między obrazami generowanymi przez AI a rzeczywistością.
Wszechstronność: Od casualowych, amatorskich ujęć po kinowe rendery profesjonalnej jakości - ten fine-tune dostosowuje się do różnych potrzeb twórczych.
Poprawiona anatomia: Lepsze ręce, kończyny i bardziej naturalne pozy w porównaniu do bazowego modelu Flux.
💡 Wskazówki dla najlepszych rezultatów
Używaj samplerów DPM++ 2M dla płynnych i spójnych wyników.
Celebuj 30–50 kroków dla uzyskania drobnych detali bez przesady.
Wybierz Beta Scheduler dla optymalnej wydajności renderowania.
⚡ Dlaczego Fine-Tune?
Ten fine-tune został stworzony, aby pokonać niektóre ograniczenia domyślnego modelu Flux. Poprawia zdolność modelu do obsługi złożonych scen, zachowując spójną jakość w różnych promptach. Cel jest prosty: uczynić ultra-realistyczne generowanie obrazów dostępnym, niezawodnym i wizualnie oszałamiającym, bez konieczności ciągłych korekt.
P.S: Planuję dalej trenować ten model, aby stworzyć ostateczny checkpoint z najlepszą anatomią i realizmem. Ta wersja nie radzi sobie najlepiej z NSFW (naprawione w następnej wersji).
P.S.S: Na razie mogą się zdarzać obrazy o niskiej rozdzielczości (nie wiem dokładnie, co to wywołuje, ale będę szukać rozwiązania). Wydaje się jednak, że używanie wysokiej rozdzielczości w promptach pomaga.
Szczegóły modelu
Dyskusja
Proszę się log in, aby dodać komentarz.


