modele/⋅ ⊣ Realities Edge XL ⊢ ⋅ LIGHTNING + Turbo! - 👁‍🗨V7 (BakedVAE)👁‍🗨

⋅ ⊣ Realities Edge XL ⊢ ⋅ LIGHTNING + Turbo! - 👁‍🗨V7 (BakedVAE)👁‍🗨

Zofia Nowak

11/1/2025

12:52:27 AM

| Discussion|

Powiązane słowa kluczowe i tagi

Groźne niebo pełne ciemnych wirujących chmur tworzących dramatyczny wir nad piaszczystym krajobrazem pustyni pod kinowym nocnym niebem z głębokimi cieniami i oświetleniem w stylu film noir.

Zalecane negatywne podpowiedzi

blur, anime, drawing, low detail

Zalecane parametry

samplers

DPM+ 3M SDE Karras, DPM++ 2M Karras, DPM++ 2M SDE Karras

steps

30 - 40

cfg

4.5 - 15

resolution

768x1344, 1024x1296, 1920x816, 768x1024

vae

sdxl-vae-fp16-fix - unknown, sdxl_vae_0.9_FP16Fix.safetensors (79e225b92f)

Zalecane parametry wysokiej rozdzielczości

upscaler

sharp upscaler, regular SD upscale, Ultimate SD upscale, 4x_NMKD-Siax_200k

upscale

1 - 1.5

denoising strength

0.5 - 0.65

Wskazówki

Najlepiej działają krótkie i zwięzłe prompty.

Zbalansuj niskie CFG z wyższą niż przeciętna siłą denoisingu dla ostrych upscale'ów.

Używaj ToMe (łączenie tokenów) w A1111 dla znacznie szybszego generowania SDXL (uwaga: zmienia seed).

Testuj swój ulubiony sampler, chociaż zalecany jest DPM+ 3M SDE Karras.

Dobrze działa z maksymalistycznymi promptami w stylu OpenAI oraz minimalistycznymi promptami LAION.

Używaj różnych rozdzielczości, w tym 768x1344, 1024x1296 oraz anamorfotycznej 1920x816, zależnie od potrzeb.

Najważniejsze informacje o wersji

Baked FIXED FP16 VAE
Nowa architektura i kierunek treningu, korzystający z złożonych operacji łączenia w Supermerger oraz treningu LoRas
Znacznie lepsze OCZY, twarze i tekstura skóry.
Lepsza anatomia i wyraźniejsze twarze średnio- i dalekozasięgowe w tłumie
Świetna przy 20 krokach, ale czasem 40 jest lepsze!
Prawdopodobnie jeszcze lepsze dłonie przy łatwych (krótkich) promptach; im dłuższy (bardziej złożony) prompt, tym wyższe ryzyko złych dłoni
NIE używaj z nim negatywów typu SD1.5, tylko bardzo krótkie negatywy, jeśli są potrzebne. Zawsze lepiej nic lub po prostu "rozmyte" dla lepszych, wyższej jakości wyników.

PRZECZYTAJ "O TEJ WERSJI" dla INFO O GENEROWANIU -->

Nowa V7 ma obie zoptymalizowane wersje: TURBO oraz LIGHTNING - superszybkie!
Mój NAJLEPSZY MODEL SDXL do tej pory - krótkie i zwięzłe prompty działają najlepiej!
TURBO V2 - teraz jeszcze lepsza jakość przy niższej liczbie kroków!
Aktualizacja LCM: 1-2 sekundy na generację! PRZECZYTAJ "O TEJ WERSJI" -->
Aktualizacja VAE z poprawką FP16 dla lepszych detali: https://huggingface.co/madebyollin/sdxl-vae-fp16-fix
Wersja 5 jest dostępna! Wszystko lepsze - ciesz się!
Wersja 4 jest dostępna! Jeszcze lepszy fotorealizm... PONOWNIE!
Wersja 3 wymaga DPM+ 3M SDE i ma nową, lepszą licencję!
Kompatybilność obrazów między COMFYUI a A1111 - ten sam obraz wszędzie! To zmienia nasiona i bez tych zmian nie uzyskasz tego samego obrazu co ja! Czytaj więcej tutaj: https://github.com/Mikubill/sd-webui-controlnet/discussions/2039

↓ Ustawienia i zalecenia poniżej ↓

Łatwy i jednocześnie złożony, ten model jest bardzo wszechstronny w odpowiednich rękach. Lepszy fotorealizm w XL jest już tutaj.

⋅ ⊣ Dlaczego?

Nie szukaj dalej. Era ostrych, wszechstronnych modeli dla XL nadeszła, w dużej mierze dzięki tej niesamowitej społeczności. Ten model buduje na wiedzy dostarczonej przez model bazowy SDXL 1.0 oraz niesamowitej bazie, którą nam zapewnił - dzięki zespołowi StabilityAI!

Ale jak wielu zauważyło, zawsze jest miejsce na ulepszenia. Ten model ma na celu wyniesienie generacji XL na nowy poziom, na którym można rozwijać się dalej i tworzyć naprawdę fajne obrazy - czy to fotografie, czy sztukę cyfrową.

Realities Edge (RE) stabilizuje niektóre z najsłabszych elementów bazowej wersji SDXL 1.0, a mianowicie detale i brak tekstury. Czasami baza XL dawała fragmenty zamazania przeplatanego z ostrymi częściami, a do tego szczupłe postacie i trochę zniekształconą anatomię. Różnorodność i zakres twarzy oraz etniczności pozostawiały wiele do życzenia, ale jest to duży krok naprzód od czasów wersji 1.5. Wreszcie sztuka we wszystkich swoich różnych stylach i formach. Baza SDXL jest znacznie bardziej zdolna niż poprzednicy i stanowi ogromną aktualizację, z którą możemy eksperymentować, ale są style artystyczne, z którymi model nadal ma problemy. Dodania do RE w tym zakresie są duże.

SDXL zostało udostępnione nam wszystkim tutaj. Teraz budujemy dalej.

⋅ ⊣ Co?

Metodyczny chaoswarp* najlepszych dostępnych modeli na Civitai, połączony z niestandardowymi, nieopublikowanymi Loras XL, które trenowałem w ostatnich tygodniach, zaowocował tym modelem. Potrafi generować fotorealizm i naturalną fotografię, ale to tylko powierzchnia. RE radzi sobie z NSFW i ma świetne informacje o anatomii w połączeniu z Loras dla lepszej tekstury skóry oraz bardziej realistycznych twarzy, oczu i ust. Cały szereg korekt anatomicznych został głównie poprawiony dla pań, a także znacznie ulepszono dłonie, osiągając oszałamiający realizm. Mężczyźni nadal mają pole do poprawy, ale z tą bazą sądzę, że poprawki pojawią się szybko.

Realities Edge to przede wszystkim maszyna artystyczna. Bombastyczne obrazy olejne, artystyczna fotografia atmosferyczna, futurystyczne 3D, wszelkie formy sztuki cyfrowej i wszystko pośrednie. Jeśli coś było wyrażone w sztuce w jakimś okresie historii ludzkości, RE powinno być w stanie sobie z tym poradzić lub przynajmniej dać świetną bazę do nauki własnych rzeczy! Lory są łatwiej dostępne niż kiedykolwiek, a SDXL jest najłatwiejszą platformą do treningu (choć trudną do opanowania 😉).

RE ma szeroki wybór stylów artystycznych, z których większość jest ostra i żywa, gotowa do dalszych modyfikacji i skalowania, jeśli jest to potrzebne. Ilustracje, wektory, obrazy olejne, akwarele, vintage'owe aparaty jak Kodak i Ektachrome; fotografia produktowa, concept art, makro, portrety, zwierzęta, komiksy, postaci, styl zachodni, styl wschodni, średniowieczny, RPG jak D&D, części mechaniczne, obcy - wszystko to można łączyć, modyfikować, mieszać i ponownie syntetyzować w dowolne kombinacje, jakie tylko wyobrazisz sobie.

⋅ ⊣ Jak?

Opierając się mocno na fantastycznych modelach XL twórcy społecznościowego socalguitarist, wzbogaconych o duże ilości moich kwasowych Loras usuwających słabą jakość, niską rozdzielczość, niesymetryczne oczy i airbrushową teksturę skóry, a także dodających potrzebny impuls kreatywności i zakresu stylów, których brakuje bazowemu modelowi od StabilityAI. Wraz z połączonym treningiem społeczności, ten model błyszczy.

Było około 17 iteracji zanim doszło się do tego modelu. Modele były łączone standardowo w Checkpoint, używając zarówno Weighted sum, jak i Add difference, ale główną pracę wykonano w MBW (blokowe łączenie). Wiele Loras trenowano z Kohyaa-ss z dim rank 256 dla najostrzejszych detali i najwyższej jakości, kosztem miejsca na dysku.

Mówiąc o tym. Całkowita waga modelu to około 170GB.

Model potrafi tworzyć podstawowe anime, ale nie martw się, podczas pracy powstała Lora anime, która zostanie wydana pod koniec sierpnia. Ale to temat na osobny post.

REFINER NIE JEST POTRZEBNY

⋅ ⊣ Możliwości i zalecenia:

Fotorealizm, 3D, 2.5D, ilustracje, fotomanipulacje, portrety i wiele więcej
Możliwości NSFW
Dobrze współpracuje z Loras - zarówno jako baza do trenowania, jak i do renderowania
Świetnie radzi sobie z obu typami promptów CLIP: maksymalistycznymi w stylu OpenAI i minimalistycznymi, narracyjnymi promptami LAION (pisanymi bardziej naturalnym językiem bez ciągłych przecinków)
Świetne oświetlenie, znakomicie działa z łatwymi, krótkimi promptami i agresywnymi (ale krótkimi) negatywnymi promptami
Bardzo niskie ryzyko przepalenia generacji nawet przy wyższym CFG - zalecane 5.5-15
Znakomicie reaguje na hires.fix ze skalowaniem 1.0-1.5 i wyżej. Lubię robić to bez skalowania, pozwalając działać ostremu upscalerowi i mniejszej liczbie kroków. Jeśli masz VRAM, zwiększ skalowanie, daj czadu!
Ulubione zakresy rozdzielczości to 768x1344 i 1024x1296. Dobrze działa też przy większych rozdzielczościach na krajobrazy. Działa także z obiektywami anamorfotycznymi w rozdzielczościach 1920x816 lub podobnych. Testuj, co działa najlepiej dla Ciebie.
Zalecany DPM+ 3M SDE Karras, ale zawsze testuj swój ulubiony sampler!
Wszystkie tryby img2img działają bardzo dobrze, a zrównoważenie niskiego CFG z wyższą niż przeciętna siłą denoisingu daje ostry i wyraźny upscale pełen interesujących detali, korzystając z regularnego SD upscale. Ciekawe, co można zrobić z Ultimate SD upscale?
Lubi Clip Skip 1-4. Często używam 2.
Zna niektórych celebrytów - dobra baza do LoRA!
Używaj z ToMe (łączenie tokenów) w A1111 (jestem pewien, że jest też zaimplementowane w Comfy) dla znacznie szybszego generowania SDXL - ale zmienia seed!

* = Słowo "chaoswarp" definiuje duże ilości kawy i wiele nocy spędzonych przed komputerem, wymyślając coraz bardziej złożone prompt’y, składane style, opowieści i postacie w złożone obrazy. W mgle późnych godzin pojawiają się pomysły i eksperymenty, które rozwijają się tak szybko, że zapamiętanie dokładnych kroków jest obecnie niemożliwe.

Generuj z rozwagą.

"Jak ReV i RV, ale dla XL - niesamowite!"

- jakiś gość w internecie

                         ⋅ ⊣ tack och på återseende ⊢ ⋅

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

Dissolve Style [FLUX+SDXL+SD1.5] - SDXL

Następny

RPGDriderXL - v1.0 SDXL

Użyj tego modelu