modele/⋅ ⊣ Realities Edge XL ⊢ ⋅ LIGHTNING + Turbo! - 👁‍🗨V7 (BakedVAE)👁‍🗨

⋅ ⊣ Realities Edge XL ⊢ ⋅ LIGHTNING + Turbo! - 👁‍🗨V7 (BakedVAE)👁‍🗨

|
11/1/2025
|
12:52:27 AM
| Discussion|
0
Groźne niebo pełne ciemnych wirujących chmur tworzących dramatyczny wir nad piaszczystym krajobrazem pustyni pod kinowym nocnym niebem z głębokimi cieniami i oświetleniem w stylu film noir.

Zalecane negatywne podpowiedzi

blur, anime, drawing, low detail

Zalecane parametry

samplers

DPM+ 3M SDE Karras, DPM++ 2M Karras, DPM++ 2M SDE Karras

steps

30 - 40

cfg

4.5 - 15

resolution

768x1344, 1024x1296, 1920x816, 768x1024

vae

sdxl-vae-fp16-fix - unknown, sdxl_vae_0.9_FP16Fix.safetensors (79e225b92f)

Zalecane parametry wysokiej rozdzielczości

upscaler

sharp upscaler, regular SD upscale, Ultimate SD upscale, 4x_NMKD-Siax_200k

upscale

1 - 1.5

denoising strength

0.5 - 0.65

Wskazówki

Najlepiej działają krótkie i zwięzłe prompty.

Zbalansuj niskie CFG z wyższą niż przeciętna siłą denoisingu dla ostrych upscale'ów.

Używaj ToMe (łączenie tokenów) w A1111 dla znacznie szybszego generowania SDXL (uwaga: zmienia seed).

Testuj swój ulubiony sampler, chociaż zalecany jest DPM+ 3M SDE Karras.

Dobrze działa z maksymalistycznymi promptami w stylu OpenAI oraz minimalistycznymi promptami LAION.

Używaj różnych rozdzielczości, w tym 768x1344, 1024x1296 oraz anamorfotycznej 1920x816, zależnie od potrzeb.

Najważniejsze informacje o wersji

  • Baked FIXED FP16 VAE

  • Nowa architektura i kierunek treningu, korzystający z złożonych operacji łączenia w Supermerger oraz treningu LoRas

  • Znacznie lepsze OCZY, twarze i tekstura skóry.

  • Lepsza anatomia i wyraźniejsze twarze średnio- i dalekozasięgowe w tłumie

  • Świetna przy 20 krokach, ale czasem 40 jest lepsze!

  • Prawdopodobnie jeszcze lepsze dłonie przy łatwych (krótkich) promptach; im dłuższy (bardziej złożony) prompt, tym wyższe ryzyko złych dłoni

  • NIE używaj z nim negatywów typu SD1.5, tylko bardzo krótkie negatywy, jeśli są potrzebne. Zawsze lepiej nic lub po prostu "rozmyte" dla lepszych, wyższej jakości wyników.

PRZECZYTAJ "O TEJ WERSJI" dla INFO O GENEROWANIU -->

  • Nowa V7 ma obie zoptymalizowane wersje: TURBO oraz LIGHTNING - superszybkie!

  • Mój NAJLEPSZY MODEL SDXL do tej pory - krótkie i zwięzłe prompty działają najlepiej!

  • TURBO V2 - teraz jeszcze lepsza jakość przy niższej liczbie kroków!

  • Aktualizacja LCM: 1-2 sekundy na generację! PRZECZYTAJ "O TEJ WERSJI" -->

  • Aktualizacja VAE z poprawką FP16 dla lepszych detali: https://huggingface.co/madebyollin/sdxl-vae-fp16-fix

  • Wersja 5 jest dostępna! Wszystko lepsze - ciesz się!

  • Wersja 4 jest dostępna! Jeszcze lepszy fotorealizm... PONOWNIE!

  • Wersja 3 wymaga DPM+ 3M SDE i ma nową, lepszą licencję!

  • Kompatybilność obrazów między COMFYUI a A1111 - ten sam obraz wszędzie! To zmienia nasiona i bez tych zmian nie uzyskasz tego samego obrazu co ja! Czytaj więcej tutaj: https://github.com/Mikubill/sd-webui-controlnet/discussions/2039

Ustawienia i zalecenia poniżej

Łatwy i jednocześnie złożony, ten model jest bardzo wszechstronny w odpowiednich rękach. Lepszy fotorealizm w XL jest już tutaj.

⊣ Dlaczego?

Nie szukaj dalej. Era ostrych, wszechstronnych modeli dla XL nadeszła, w dużej mierze dzięki tej niesamowitej społeczności. Ten model buduje na wiedzy dostarczonej przez model bazowy SDXL 1.0 oraz niesamowitej bazie, którą nam zapewnił - dzięki zespołowi StabilityAI!

Ale jak wielu zauważyło, zawsze jest miejsce na ulepszenia. Ten model ma na celu wyniesienie generacji XL na nowy poziom, na którym można rozwijać się dalej i tworzyć naprawdę fajne obrazy - czy to fotografie, czy sztukę cyfrową.

Realities Edge (RE) stabilizuje niektóre z najsłabszych elementów bazowej wersji SDXL 1.0, a mianowicie detale i brak tekstury. Czasami baza XL dawała fragmenty zamazania przeplatanego z ostrymi częściami, a do tego szczupłe postacie i trochę zniekształconą anatomię. Różnorodność i zakres twarzy oraz etniczności pozostawiały wiele do życzenia, ale jest to duży krok naprzód od czasów wersji 1.5. Wreszcie sztuka we wszystkich swoich różnych stylach i formach. Baza SDXL jest znacznie bardziej zdolna niż poprzednicy i stanowi ogromną aktualizację, z którą możemy eksperymentować, ale są style artystyczne, z którymi model nadal ma problemy. Dodania do RE w tym zakresie są duże.

SDXL zostało udostępnione nam wszystkim tutaj. Teraz budujemy dalej.

⊣ Co?

Metodyczny chaoswarp* najlepszych dostępnych modeli na Civitai, połączony z niestandardowymi, nieopublikowanymi Loras XL, które trenowałem w ostatnich tygodniach, zaowocował tym modelem. Potrafi generować fotorealizm i naturalną fotografię, ale to tylko powierzchnia. RE radzi sobie z NSFW i ma świetne informacje o anatomii w połączeniu z Loras dla lepszej tekstury skóry oraz bardziej realistycznych twarzy, oczu i ust. Cały szereg korekt anatomicznych został głównie poprawiony dla pań, a także znacznie ulepszono dłonie, osiągając oszałamiający realizm. Mężczyźni nadal mają pole do poprawy, ale z tą bazą sądzę, że poprawki pojawią się szybko.


Realities Edge to przede wszystkim maszyna artystyczna. Bombastyczne obrazy olejne, artystyczna fotografia atmosferyczna, futurystyczne 3D, wszelkie formy sztuki cyfrowej i wszystko pośrednie. Jeśli coś było wyrażone w sztuce w jakimś okresie historii ludzkości, RE powinno być w stanie sobie z tym poradzić lub przynajmniej dać świetną bazę do nauki własnych rzeczy! Lory są łatwiej dostępne niż kiedykolwiek, a SDXL jest najłatwiejszą platformą do treningu (choć trudną do opanowania 😉).

RE ma szeroki wybór stylów artystycznych, z których większość jest ostra i żywa, gotowa do dalszych modyfikacji i skalowania, jeśli jest to potrzebne. Ilustracje, wektory, obrazy olejne, akwarele, vintage'owe aparaty jak Kodak i Ektachrome; fotografia produktowa, concept art, makro, portrety, zwierzęta, komiksy, postaci, styl zachodni, styl wschodni, średniowieczny, RPG jak D&D, części mechaniczne, obcy - wszystko to można łączyć, modyfikować, mieszać i ponownie syntetyzować w dowolne kombinacje, jakie tylko wyobrazisz sobie.

⊣ Jak?

Opierając się mocno na fantastycznych modelach XL twórcy społecznościowego socalguitarist, wzbogaconych o duże ilości moich kwasowych Loras usuwających słabą jakość, niską rozdzielczość, niesymetryczne oczy i airbrushową teksturę skóry, a także dodających potrzebny impuls kreatywności i zakresu stylów, których brakuje bazowemu modelowi od StabilityAI. Wraz z połączonym treningiem społeczności, ten model błyszczy.

Było około 17 iteracji zanim doszło się do tego modelu. Modele były łączone standardowo w Checkpoint, używając zarówno Weighted sum, jak i Add difference, ale główną pracę wykonano w MBW (blokowe łączenie). Wiele Loras trenowano z Kohyaa-ss z dim rank 256 dla najostrzejszych detali i najwyższej jakości, kosztem miejsca na dysku.

Mówiąc o tym. Całkowita waga modelu to około 170GB.

Model potrafi tworzyć podstawowe anime, ale nie martw się, podczas pracy powstała Lora anime, która zostanie wydana pod koniec sierpnia. Ale to temat na osobny post.

REFINER NIE JEST POTRZEBNY

⊣ Możliwości i zalecenia:

  • Fotorealizm, 3D, 2.5D, ilustracje, fotomanipulacje, portrety i wiele więcej

  • Możliwości NSFW

  • Dobrze współpracuje z Loras - zarówno jako baza do trenowania, jak i do renderowania

  • Świetnie radzi sobie z obu typami promptów CLIP: maksymalistycznymi w stylu OpenAI i minimalistycznymi, narracyjnymi promptami LAION (pisanymi bardziej naturalnym językiem bez ciągłych przecinków)

  • Świetne oświetlenie, znakomicie działa z łatwymi, krótkimi promptami i agresywnymi (ale krótkimi) negatywnymi promptami

  • Bardzo niskie ryzyko przepalenia generacji nawet przy wyższym CFG - zalecane 5.5-15

  • Znakomicie reaguje na hires.fix ze skalowaniem 1.0-1.5 i wyżej. Lubię robić to bez skalowania, pozwalając działać ostremu upscalerowi i mniejszej liczbie kroków. Jeśli masz VRAM, zwiększ skalowanie, daj czadu!

  • Ulubione zakresy rozdzielczości to 768x1344 i 1024x1296. Dobrze działa też przy większych rozdzielczościach na krajobrazy. Działa także z obiektywami anamorfotycznymi w rozdzielczościach 1920x816 lub podobnych. Testuj, co działa najlepiej dla Ciebie.

  • Zalecany DPM+ 3M SDE Karras, ale zawsze testuj swój ulubiony sampler!

  • Wszystkie tryby img2img działają bardzo dobrze, a zrównoważenie niskiego CFG z wyższą niż przeciętna siłą denoisingu daje ostry i wyraźny upscale pełen interesujących detali, korzystając z regularnego SD upscale. Ciekawe, co można zrobić z Ultimate SD upscale?

  • Lubi Clip Skip 1-4. Często używam 2.

  • Zna niektórych celebrytów - dobra baza do LoRA!

  • Używaj z ToMe (łączenie tokenów) w A1111 (jestem pewien, że jest też zaimplementowane w Comfy) dla znacznie szybszego generowania SDXL - ale zmienia seed!

* = Słowo "chaoswarp" definiuje duże ilości kawy i wiele nocy spędzonych przed komputerem, wymyślając coraz bardziej złożone prompt’y, składane style, opowieści i postacie w złożone obrazy. W mgle późnych godzin pojawiają się pomysły i eksperymenty, które rozwijają się tak szybko, że zapamiętanie dokładnych kroków jest obecnie niemożliwe.

Generuj z rozwagą.

"Jak ReV i RV, ale dla XL - niesamowite!"

- jakiś gość w internecie

                         ⋅ ⊣ tack och på återseende ⊢ ⋅

Poprzedni
Dissolve Style [FLUX+SDXL+SD1.5] - SDXL
Następny
RPGDriderXL - v1.0 SDXL

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

SDXL 1.0

Wersja modelu

👁‍🗨V7 (BakedVAE)👁‍🗨

Hash modelu

83d30d3dfb

Twórca

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa ⋅ ⊣ Realities Edge XL ⊢ ⋅ LIGHTNING + Turbo! - 👁‍🗨V7 (BakedVAE)👁‍🗨

Groźne niebo pełne ciemnych wirujących chmur tworzących dramatyczny wir nad piaszczystym krajobrazem pustyni pod kinowym nocnym niebem z głębokimi cieniami i oświetleniem w stylu film noir.

Obrazy z 3d

3D renderowana umięśniona kobieta z piegami i czarnymi włosami w błyszczącym kombinezonie, pozująca na prostym czerwonym tle z kinowym oświetleniem i stylem atompunk.
Zbliżenie fotorealistycznego portretu stylowej hipsterskiej dziewczyny z ciemnym makijażem, wyraźną linią szczęki i kuszącym naszyjnikiem.
Realistyczny obraz 3D Tify Lockhart siedzącej z jedną nogą uniesioną, ubranej w biały stanik sportowy i czarne spodnie dresowe, pokazujący błyszczącą skórę i pot na prostym białym tle.
Bardzo szczegółowy żółw noszący jetpack, latający nad tętniącym życiem kanałem miejskim otoczonym kolorowymi budynkami pod niebieskim niebem.
Żywy żółty klasyczny samochód pędzący po mokrej miejskiej ulicy z dużą eksplozją w tle pod pochmurnym niebem.
Loona z Helluva Boss siedząca na fotelu gamingowym z dużymi smutnymi czerwonymi oczami, trzymająca płonący znak z napisem 'Need Buzz to generate more Loona' w pokoju do gier.
Kompaktowa futurystyczna sypialnia z metalicznym i industrialnym designem, z nieuporządkowanym łóżkiem obok dużego panoramicznego okna z widokiem na neonowo oświetloną panoramę cyberpunkowego miasta nocą.
Fotorealistyczny obraz stylowej kobiety w efektownej czerwonej sukience i okularach przeciwsłonecznych, stojącej pewnie w terminalu lotniska otoczonej przez wysoką, chaotyczną stertę kolorowych walizek na wózku bagażowym.
Realistyczna 3D dziewczyna ćma z czarno-białymi rozdwojonymi włosami, szerokimi czerwonymi oczami i wyrazem zdumienia z śliną, pochylona nad świecącą żarówką na drewnianym stole.
Trójwymiarowa wizualizacja średniowiecznej kobiecej kuszniczki z plecionymi brązowymi włosami, brązowymi oczami, ubranej w jasnobrązowe średniowieczne ubrania i skórzaną zbroję, trzymającej kuszę z poważnym, bocznym spojrzeniem.

Obrazy z sztuka

Futurystyczny krajobraz miejski z wysokimi drapaczami chmur z pomarańczowymi i niebieskimi światłami wśród gęstej mgły, skoncentrowany na dużej unoszącej się okrągłej konstrukcji ponad chmurami.
Zbliżenie abstrakcyjnego portretu przedstawiającego twarz z zamkniętymi oczami, wykonane tuszem trójkolorowym z eksplodującymi pociągnięciami pędzla, rozpryskami pomarańczowego, niebieskiego, czerwonego i czarnego, wyrażające emocjonalną intensywność i chaotyczną energię.
Szczegółowa cyfrowa ilustracja głowy mandryla z jaskrawoczerwoną twarzą, żółtymi oczami, misternymi czarno-białymi wzorami i pióropodobną teksturą futra na czarnym tle.
Czerwono-czarny szkic smoka górującego nad osobą w deszczu w nocy.
Abstrakcyjny obraz akrylowy złotej rybki pod wodą z uderzającymi czerwonymi, białymi i czarnymi kolorami na ciemnym tle
Portret zdeterminowanego dowódcy wojskowego o rudych włosach i niebieskich oczach, ubranego w elegancki granatowy mundur ze złotymi akcentami, łączący styl epoki napoleońskiej i cyberpunk, stojącego w zadymionej miejskiej twierdzy.
Szczegółowy portret pieprzniętej elfiej hemomancerki ubranej w szkarłatny kaptur i szaty, z krwistoczerwonymi oczami i skomplikowanymi magicznymi symbolami wirującymi w ciemnej jaskini leśnej.
Sylwetka kobiety stojącej na tle beżowego tła z żywymi kolorowymi fraktalnymi rozbryskami farby w kolorach czerwonym, żółtym, niebieskim, pomarańczowym i fioletowym wokół niej.
Stylowa kobieta w czarnym skórzanym bralecie i spodniach z wysokim stanem i szerokimi nogawkami, stojąca pewnie z wyciągniętymi ramionami. Ma długie warkocze i jaskrawozielone koturny. Tło zawiera zielone tony z wzorami cieni.
Minimalistyczna płaska grafika wektorowa przedstawiająca sylwetkę szczupłej kobiety spacerującej po plaży Cap Canaille, Południowa Francja, z dużym niebieskim niebem wypełnionym białymi chmurami i smugami kondensacyjnymi nad wybrzeżem Côte d'Azur.

Obrazy z model bazowy

Fotorealistyczna scena postaci nieumarłych, w tym zombie i szkieletów, spacerujących przez upiorny cmentarz oświetlony świecącymi lampionami jack-o'-lantern pod ciemnym, złowrogim niebem.

Obrazy z fotorealistyczny

Kobieta w kwiecistym czerwonym kimonie z długimi czarnymi włosami ozdobionymi ozdobami do włosów i biżuterią, siedząca w pomieszczeniu przy drewnianym stole z książkami, gałęzie liści klonu za nią.
Fotorealistyczny obraz ciemnoskórej kobiety z długimi białymi włosami i niebieskimi oczami, ubranej w żółtą sukienkę i misterną złotą biżuterię, siedzącej na zewnątrz i opierającej się o dużego tygrysa pod niebieskim niebem.
Fotorealistyczny portret młodej kobiety o ciemnych włosach, noszącej misterną biżuterię w stylu barokowym, otoczoną złotą ramą z płomieniami u dołu.
Fotorealistyczna postać elfa z długimi warkoczami i spiczastymi uszami siedząca w przytulnej fantastycznej restauracji, trzymająca gigantyczny kotlet hamburgerowy i drewniany kufel piwa.
Biały stary van jadący po mokrej miejskiej ulicy w nocy z rozmyciem ruchu i refleksami na nawierzchni drogi.
Fotorealistyczne drzewo sosnowe pokryte mchem z żywymi, świecącymi niebieskimi oczami, otoczone mgłą i gęstym lasem pod pochmurnym niebem.
Czarno-białe zbliżenie kobiety z mokrymi, deszczem musniętymi włosami częściowo rozpadającymi się na kolorowe, tęczowe cząsteczki unoszące się w lewo.
Jasnoczerwony fortepian koncertowy stojący samotnie na rozległym, turkusowym solnisku z lustrzanym odbiciem pod czystym niebem.
Zbliżony portret muskularnego brodatego mężczyzny noszącego zużyty stalowy kombinezon mecha z detalami rdzy, ostrym focusem i lekkim bokeh w tle na ulicach miasta.
Portret zbliżeniowy europejskiej kobiety z rudymi włosami, naturalną teksturą skóry i miękkim kinowym światłem, stojącej na rozmytym tle zimowego lasu.

Obrazy z portrait

Portret pięknej kobiety na techno rave z dramatycznym oświetleniem błyskowym i nastrojową atmosferą klubu nocnego.
Portret kobiety z kwiatami we włosach i ramionach, promieniejącej w słonecznym, kolorowym kwiecistym polu podczas złotej godziny
Fotorealistyczny portret młodej kobiety o ciemnych włosach, noszącej misterną biżuterię w stylu barokowym, otoczoną złotą ramą z płomieniami u dołu.
Portret dwóch uśmiechniętych dziewczynek z kucykami w bluzach z kapturem, wykonany w wysokiej jakości stylu anime.
Portret dziewczyny w kremowym swetrze na białym tle z miękkim oświetleniem podkreślającym jej naturalny wygląd.
Portret w stylu mrocznej fantasy elfki o czerwonych oczach, z misterną biżuterią, świecącym tajemniczym symbolem trzeciego oka na czole, unoszącej się na energii psychicznej z galaktycznymi planetami w tle.
Portret zbliżeniowy niezwykłej Modraszki o świcie, z detalami piór, żywym niebieskim grzebieniem i ostrym okiem z subtelnym efektem rozmycia ruchu.
Zbliżenie portretu kota ragdoll z jasnoniebieskimi oczami otoczonego miękkimi różowymi kwiatami, głęboka ostrość i oświetlenie punktowe.
Zbliżenie portretu pięknego cyborga z luminiscencyjnymi niebieskimi oczami, długimi, płynnymi brązowymi włosami, misternymi detalami złotej ażurowej zbroi, dwoma świecącymi motylami unoszącymi się przy jej głowie oraz odłamkiem połamanej szyby osadzonym blisko klatki piersiowej, oświetlonym dramatycznym światłem bocznym.
Portret czarnoskórej kobiety wystylizowanej na boginię, noszącej złotą biżuterię i złoty strój z krótkimi ciemnymi włosami.