modele/⋅ ⊣ Realities Edge XL ⊢ ⋅ LIGHTNING + Turbo! - 👁‍🗨V7 (BakedVAE)👁‍🗨

⋅ ⊣ Realities Edge XL ⊢ ⋅ LIGHTNING + Turbo! - 👁‍🗨V7 (BakedVAE)👁‍🗨

|
11/1/2025
|
12:52:27 AM
| Discussion|
0
Groźne niebo pełne ciemnych wirujących chmur tworzących dramatyczny wir nad piaszczystym krajobrazem pustyni pod kinowym nocnym niebem z głębokimi cieniami i oświetleniem w stylu film noir.

Zalecane negatywne podpowiedzi

blur, anime, drawing, low detail

Zalecane parametry

samplers

DPM+ 3M SDE Karras, DPM++ 2M Karras, DPM++ 2M SDE Karras

steps

30 - 40

cfg

4.5 - 15

resolution

768x1344, 1024x1296, 1920x816, 768x1024

vae

sdxl-vae-fp16-fix - unknown, sdxl_vae_0.9_FP16Fix.safetensors (79e225b92f)

Zalecane parametry wysokiej rozdzielczości

upscaler

sharp upscaler, regular SD upscale, Ultimate SD upscale, 4x_NMKD-Siax_200k

upscale

1 - 1.5

denoising strength

0.5 - 0.65

Wskazówki

Najlepiej działają krótkie i zwięzłe prompty.

Zbalansuj niskie CFG z wyższą niż przeciętna siłą denoisingu dla ostrych upscale'ów.

Używaj ToMe (łączenie tokenów) w A1111 dla znacznie szybszego generowania SDXL (uwaga: zmienia seed).

Testuj swój ulubiony sampler, chociaż zalecany jest DPM+ 3M SDE Karras.

Dobrze działa z maksymalistycznymi promptami w stylu OpenAI oraz minimalistycznymi promptami LAION.

Używaj różnych rozdzielczości, w tym 768x1344, 1024x1296 oraz anamorfotycznej 1920x816, zależnie od potrzeb.

Najważniejsze informacje o wersji

  • Baked FIXED FP16 VAE

  • Nowa architektura i kierunek treningu, korzystający z złożonych operacji łączenia w Supermerger oraz treningu LoRas

  • Znacznie lepsze OCZY, twarze i tekstura skóry.

  • Lepsza anatomia i wyraźniejsze twarze średnio- i dalekozasięgowe w tłumie

  • Świetna przy 20 krokach, ale czasem 40 jest lepsze!

  • Prawdopodobnie jeszcze lepsze dłonie przy łatwych (krótkich) promptach; im dłuższy (bardziej złożony) prompt, tym wyższe ryzyko złych dłoni

  • NIE używaj z nim negatywów typu SD1.5, tylko bardzo krótkie negatywy, jeśli są potrzebne. Zawsze lepiej nic lub po prostu "rozmyte" dla lepszych, wyższej jakości wyników.

PRZECZYTAJ "O TEJ WERSJI" dla INFO O GENEROWANIU -->

  • Nowa V7 ma obie zoptymalizowane wersje: TURBO oraz LIGHTNING - superszybkie!

  • Mój NAJLEPSZY MODEL SDXL do tej pory - krótkie i zwięzłe prompty działają najlepiej!

  • TURBO V2 - teraz jeszcze lepsza jakość przy niższej liczbie kroków!

  • Aktualizacja LCM: 1-2 sekundy na generację! PRZECZYTAJ "O TEJ WERSJI" -->

  • Aktualizacja VAE z poprawką FP16 dla lepszych detali: https://huggingface.co/madebyollin/sdxl-vae-fp16-fix

  • Wersja 5 jest dostępna! Wszystko lepsze - ciesz się!

  • Wersja 4 jest dostępna! Jeszcze lepszy fotorealizm... PONOWNIE!

  • Wersja 3 wymaga DPM+ 3M SDE i ma nową, lepszą licencję!

  • Kompatybilność obrazów między COMFYUI a A1111 - ten sam obraz wszędzie! To zmienia nasiona i bez tych zmian nie uzyskasz tego samego obrazu co ja! Czytaj więcej tutaj: https://github.com/Mikubill/sd-webui-controlnet/discussions/2039

Ustawienia i zalecenia poniżej

Łatwy i jednocześnie złożony, ten model jest bardzo wszechstronny w odpowiednich rękach. Lepszy fotorealizm w XL jest już tutaj.

⊣ Dlaczego?

Nie szukaj dalej. Era ostrych, wszechstronnych modeli dla XL nadeszła, w dużej mierze dzięki tej niesamowitej społeczności. Ten model buduje na wiedzy dostarczonej przez model bazowy SDXL 1.0 oraz niesamowitej bazie, którą nam zapewnił - dzięki zespołowi StabilityAI!

Ale jak wielu zauważyło, zawsze jest miejsce na ulepszenia. Ten model ma na celu wyniesienie generacji XL na nowy poziom, na którym można rozwijać się dalej i tworzyć naprawdę fajne obrazy - czy to fotografie, czy sztukę cyfrową.

Realities Edge (RE) stabilizuje niektóre z najsłabszych elementów bazowej wersji SDXL 1.0, a mianowicie detale i brak tekstury. Czasami baza XL dawała fragmenty zamazania przeplatanego z ostrymi częściami, a do tego szczupłe postacie i trochę zniekształconą anatomię. Różnorodność i zakres twarzy oraz etniczności pozostawiały wiele do życzenia, ale jest to duży krok naprzód od czasów wersji 1.5. Wreszcie sztuka we wszystkich swoich różnych stylach i formach. Baza SDXL jest znacznie bardziej zdolna niż poprzednicy i stanowi ogromną aktualizację, z którą możemy eksperymentować, ale są style artystyczne, z którymi model nadal ma problemy. Dodania do RE w tym zakresie są duże.

SDXL zostało udostępnione nam wszystkim tutaj. Teraz budujemy dalej.

⊣ Co?

Metodyczny chaoswarp* najlepszych dostępnych modeli na Civitai, połączony z niestandardowymi, nieopublikowanymi Loras XL, które trenowałem w ostatnich tygodniach, zaowocował tym modelem. Potrafi generować fotorealizm i naturalną fotografię, ale to tylko powierzchnia. RE radzi sobie z NSFW i ma świetne informacje o anatomii w połączeniu z Loras dla lepszej tekstury skóry oraz bardziej realistycznych twarzy, oczu i ust. Cały szereg korekt anatomicznych został głównie poprawiony dla pań, a także znacznie ulepszono dłonie, osiągając oszałamiający realizm. Mężczyźni nadal mają pole do poprawy, ale z tą bazą sądzę, że poprawki pojawią się szybko.


Realities Edge to przede wszystkim maszyna artystyczna. Bombastyczne obrazy olejne, artystyczna fotografia atmosferyczna, futurystyczne 3D, wszelkie formy sztuki cyfrowej i wszystko pośrednie. Jeśli coś było wyrażone w sztuce w jakimś okresie historii ludzkości, RE powinno być w stanie sobie z tym poradzić lub przynajmniej dać świetną bazę do nauki własnych rzeczy! Lory są łatwiej dostępne niż kiedykolwiek, a SDXL jest najłatwiejszą platformą do treningu (choć trudną do opanowania 😉).

RE ma szeroki wybór stylów artystycznych, z których większość jest ostra i żywa, gotowa do dalszych modyfikacji i skalowania, jeśli jest to potrzebne. Ilustracje, wektory, obrazy olejne, akwarele, vintage'owe aparaty jak Kodak i Ektachrome; fotografia produktowa, concept art, makro, portrety, zwierzęta, komiksy, postaci, styl zachodni, styl wschodni, średniowieczny, RPG jak D&D, części mechaniczne, obcy - wszystko to można łączyć, modyfikować, mieszać i ponownie syntetyzować w dowolne kombinacje, jakie tylko wyobrazisz sobie.

⊣ Jak?

Opierając się mocno na fantastycznych modelach XL twórcy społecznościowego socalguitarist, wzbogaconych o duże ilości moich kwasowych Loras usuwających słabą jakość, niską rozdzielczość, niesymetryczne oczy i airbrushową teksturę skóry, a także dodających potrzebny impuls kreatywności i zakresu stylów, których brakuje bazowemu modelowi od StabilityAI. Wraz z połączonym treningiem społeczności, ten model błyszczy.

Było około 17 iteracji zanim doszło się do tego modelu. Modele były łączone standardowo w Checkpoint, używając zarówno Weighted sum, jak i Add difference, ale główną pracę wykonano w MBW (blokowe łączenie). Wiele Loras trenowano z Kohyaa-ss z dim rank 256 dla najostrzejszych detali i najwyższej jakości, kosztem miejsca na dysku.

Mówiąc o tym. Całkowita waga modelu to około 170GB.

Model potrafi tworzyć podstawowe anime, ale nie martw się, podczas pracy powstała Lora anime, która zostanie wydana pod koniec sierpnia. Ale to temat na osobny post.

REFINER NIE JEST POTRZEBNY

⊣ Możliwości i zalecenia:

  • Fotorealizm, 3D, 2.5D, ilustracje, fotomanipulacje, portrety i wiele więcej

  • Możliwości NSFW

  • Dobrze współpracuje z Loras - zarówno jako baza do trenowania, jak i do renderowania

  • Świetnie radzi sobie z obu typami promptów CLIP: maksymalistycznymi w stylu OpenAI i minimalistycznymi, narracyjnymi promptami LAION (pisanymi bardziej naturalnym językiem bez ciągłych przecinków)

  • Świetne oświetlenie, znakomicie działa z łatwymi, krótkimi promptami i agresywnymi (ale krótkimi) negatywnymi promptami

  • Bardzo niskie ryzyko przepalenia generacji nawet przy wyższym CFG - zalecane 5.5-15

  • Znakomicie reaguje na hires.fix ze skalowaniem 1.0-1.5 i wyżej. Lubię robić to bez skalowania, pozwalając działać ostremu upscalerowi i mniejszej liczbie kroków. Jeśli masz VRAM, zwiększ skalowanie, daj czadu!

  • Ulubione zakresy rozdzielczości to 768x1344 i 1024x1296. Dobrze działa też przy większych rozdzielczościach na krajobrazy. Działa także z obiektywami anamorfotycznymi w rozdzielczościach 1920x816 lub podobnych. Testuj, co działa najlepiej dla Ciebie.

  • Zalecany DPM+ 3M SDE Karras, ale zawsze testuj swój ulubiony sampler!

  • Wszystkie tryby img2img działają bardzo dobrze, a zrównoważenie niskiego CFG z wyższą niż przeciętna siłą denoisingu daje ostry i wyraźny upscale pełen interesujących detali, korzystając z regularnego SD upscale. Ciekawe, co można zrobić z Ultimate SD upscale?

  • Lubi Clip Skip 1-4. Często używam 2.

  • Zna niektórych celebrytów - dobra baza do LoRA!

  • Używaj z ToMe (łączenie tokenów) w A1111 (jestem pewien, że jest też zaimplementowane w Comfy) dla znacznie szybszego generowania SDXL - ale zmienia seed!

* = Słowo "chaoswarp" definiuje duże ilości kawy i wiele nocy spędzonych przed komputerem, wymyślając coraz bardziej złożone prompt’y, składane style, opowieści i postacie w złożone obrazy. W mgle późnych godzin pojawiają się pomysły i eksperymenty, które rozwijają się tak szybko, że zapamiętanie dokładnych kroków jest obecnie niemożliwe.

Generuj z rozwagą.

"Jak ReV i RV, ale dla XL - niesamowite!"

- jakiś gość w internecie

                         ⋅ ⊣ tack och på återseende ⊢ ⋅

Poprzedni
Dissolve Style [FLUX+SDXL+SD1.5] - SDXL
Następny
RPGDriderXL - v1.0 SDXL

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

SDXL 1.0

Wersja modelu

👁‍🗨V7 (BakedVAE)👁‍🗨

Hash modelu

83d30d3dfb

Twórca

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa ⋅ ⊣ Realities Edge XL ⊢ ⋅ LIGHTNING + Turbo! - 👁‍🗨V7 (BakedVAE)👁‍🗨

Groźne niebo pełne ciemnych wirujących chmur tworzących dramatyczny wir nad piaszczystym krajobrazem pustyni pod kinowym nocnym niebem z głębokimi cieniami i oświetleniem w stylu film noir.

Obrazy z 3d

3D renderowana umięśniona kobieta z piegami i czarnymi włosami w błyszczącym kombinezonie, pozująca na prostym czerwonym tle z kinowym oświetleniem i stylem atompunk.
Zbliżenie fotorealistycznego portretu stylowej hipsterskiej dziewczyny z ciemnym makijażem, wyraźną linią szczęki i kuszącym naszyjnikiem.
Realistyczny obraz 3D Tify Lockhart siedzącej z jedną nogą uniesioną, ubranej w biały stanik sportowy i czarne spodnie dresowe, pokazujący błyszczącą skórę i pot na prostym białym tle.
Bardzo szczegółowy żółw noszący jetpack, latający nad tętniącym życiem kanałem miejskim otoczonym kolorowymi budynkami pod niebieskim niebem.
Żywy żółty klasyczny samochód pędzący po mokrej miejskiej ulicy z dużą eksplozją w tle pod pochmurnym niebem.
Loona z Helluva Boss siedząca na fotelu gamingowym z dużymi smutnymi czerwonymi oczami, trzymająca płonący znak z napisem 'Need Buzz to generate more Loona' w pokoju do gier.
Kompaktowa futurystyczna sypialnia z metalicznym i industrialnym designem, z nieuporządkowanym łóżkiem obok dużego panoramicznego okna z widokiem na neonowo oświetloną panoramę cyberpunkowego miasta nocą.
Fotorealistyczny obraz stylowej kobiety w efektownej czerwonej sukience i okularach przeciwsłonecznych, stojącej pewnie w terminalu lotniska otoczonej przez wysoką, chaotyczną stertę kolorowych walizek na wózku bagażowym.
Realistyczna 3D dziewczyna ćma z czarno-białymi rozdwojonymi włosami, szerokimi czerwonymi oczami i wyrazem zdumienia z śliną, pochylona nad świecącą żarówką na drewnianym stole.
Trójwymiarowa wizualizacja średniowiecznej kobiecej kuszniczki z plecionymi brązowymi włosami, brązowymi oczami, ubranej w jasnobrązowe średniowieczne ubrania i skórzaną zbroję, trzymającej kuszę z poważnym, bocznym spojrzeniem.

Obrazy z sztuka

Zbliżenie abstrakcyjnego portretu przedstawiającego twarz z zamkniętymi oczami, wykonane tuszem trójkolorowym z eksplodującymi pociągnięciami pędzla, rozpryskami pomarańczowego, niebieskiego, czerwonego i czarnego, wyrażające emocjonalną intensywność i chaotyczną energię.
Szczegółowa cyfrowa ilustracja głowy mandryla z jaskrawoczerwoną twarzą, żółtymi oczami, misternymi czarno-białymi wzorami i pióropodobną teksturą futra na czarnym tle.
Czerwono-czarny szkic smoka górującego nad osobą w deszczu w nocy.
Abstrakcyjny obraz akrylowy złotej rybki pod wodą z uderzającymi czerwonymi, białymi i czarnymi kolorami na ciemnym tle
Portret zdeterminowanego dowódcy wojskowego o rudych włosach i niebieskich oczach, ubranego w elegancki granatowy mundur ze złotymi akcentami, łączący styl epoki napoleońskiej i cyberpunk, stojącego w zadymionej miejskiej twierdzy.
Szczegółowy portret pieprzniętej elfiej hemomancerki ubranej w szkarłatny kaptur i szaty, z krwistoczerwonymi oczami i skomplikowanymi magicznymi symbolami wirującymi w ciemnej jaskini leśnej.
Sylwetka kobiety stojącej na tle beżowego tła z żywymi kolorowymi fraktalnymi rozbryskami farby w kolorach czerwonym, żółtym, niebieskim, pomarańczowym i fioletowym wokół niej.
Stylowa kobieta w czarnym skórzanym bralecie i spodniach z wysokim stanem i szerokimi nogawkami, stojąca pewnie z wyciągniętymi ramionami. Ma długie warkocze i jaskrawozielone koturny. Tło zawiera zielone tony z wzorami cieni.
Minimalistyczna płaska grafika wektorowa przedstawiająca sylwetkę szczupłej kobiety spacerującej po plaży Cap Canaille, Południowa Francja, z dużym niebieskim niebem wypełnionym białymi chmurami i smugami kondensacyjnymi nad wybrzeżem Côte d'Azur.
Sylwetka kobiety w sukni z złotej folii, stojąca na jeziorze z ogromnym złotym księżycem w tle, osadzona w azjatyckim krajobrazie.

Obrazy z model bazowy

Fotorealistyczna scena postaci nieumarłych, w tym zombie i szkieletów, spacerujących przez upiorny cmentarz oświetlony świecącymi lampionami jack-o'-lantern pod ciemnym, złowrogim niebem.

Obrazy z fotorealistyczny

Zbliżenie fotorealistycznej głowy reptilian humanoida z bardzo szczegółową, teksturowaną łuskowatą skórą oświetloną dramatycznym ciepłym światłem.
Portret niskiej średniowiecznej damy noszącej wzmocnioną zbroję brigandine z metalową napierśnikiem i naramiennikami na ramionach, stojącej na średniowiecznym rynku z żółtymi oczami i krótkimi czarnymi włosami.
Fotorealistyczny obraz modelki ze skrzydłami pozującej dramatycznie w szpilkach, w dymnym, vintage'owym stylu filmu podczas pokazu mody.
Portret całej sylwetki kobiety o rudych włosach i piegach, ubranej w musztardową długą sukienkę z krótkimi falbanianymi rękawami, stojącej pośród liści dżungli na ciemnym tle.
Fotorealistyczny syberyjski husky w śnieżnym kamuflażu spec-ops stojący w zaśnieżonym sosnowym lesie z błyskami światła.
Fotorealistyczne zbliżenie pół-człowieka pół-cyborga w żywym czerwonym szlafroku trzymającej dwa miecze samurajskie w ciemnym, zadymionym noir mieście lat 40.
Fotografia makro pokazująca sylwetki łodyg dzikich kwiatów na tle dużego pomarańczowego zachodu słońca z kulistymi światłami bokeh w tle.
Sylwetka mężczyzny noszącego świecącą, bioluminescencyjną koronę cierniową z fioletowymi światłami na ciemnoniebieskim tle.

Obrazy z portrait

Ilustracja dziewczyny z ciemnymi, płynącymi włosami, ubraną w czerwoną koszulę, na tle żywego czerwonego splashu.
Kobieta trzymająca zapaloną świecę na całkowicie czarnym, ciemnym tle, oświetlająca połowę jej twarzy ciepłym światłem świecy.
Portret kobiety o platynowo blond włosach i fioletowych oczach, ubranej w czarny crop top z odsłoniętymi ramionami, stojącej na tle żółtawo-brązowej, teksturowanej ściany, z tatuażem na górnej części ramienia i umięśnioną sylwetką.
Sylwetka mężczyzny noszącego świecącą, bioluminescencyjną koronę cierniową z fioletowymi światłami na ciemnoniebieskim tle.
Zbliżenie portretu kobiety o zielonych oczach leżącej na łóżku, oświetlonej ciepłym światłem złotej godziny wewnątrz.
Czarno-biały portret młodej chińskiej kobiety w kinowym oświetleniu, z wyraźnie ostro zogniskowanymi oczami i delikatnym rozmyciem ruchu na ciele oraz tle.
Kinowy portret zbliżeniowy królewskiego lwa w ozdobnej średniowiecznej zbroi z misternymi zdobieniami.
Portret kobiety przypominającej Levy Tran w stylu diesel-punk, ubranej w czapkę i kurtkę, stojącej przed zabytkową pomarańczowo-niebieską ciężarówką, z kinowym oświetleniem i ostrymi realistycznymi detalami.
Zbliżenie hiper-szczegółowego portretu głowy i ramion pięknej damy z pieprzykami, rubinowymi oczami, krótkimi włosami, ciemnym makijażem i dużym uśmiechem pod miękkim oświetleniem.
Portret Sailor Mars z czarnymi włosami i zmęczonymi oczami, ubrana w czerwono-białe serafuku, trzyma pistolet z rozpryskami krwi na twarzy i broni na czarnym tle.