Astronauta w zużytym skafandrze kosmicznym stoi na białej pustyni przed ogromnym statkiem gwiezdnym w kształcie rekina z szeroko otwartym otworem przypominającym usta i dużymi silnikami.

Zalecane parametry

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, Euler, DPM++ SDE, 2M SDE Karras

steps

4 - 40

cfg

2.5 - 7

resolution

1536x1536, 1024x1024

vae

ae.safetensors

Zalecane parametry wysokiej rozdzielczości

upscale

1.5 - null

Wskazówki

Użyj więcej niż 8 kroków, aby poprawić drobne detale, ale wynik nie zmienia się znacząco po 8 krokach.

Dodanie promptów stylu może pomóc modelowi wygenerować bardziej schludny i czysty efekt.

Spróbuj zwiększyć skalę guidance, aby uzyskać czystsze obrazy.

Unikaj używania terminów 'jakość' takich jak 4K, 8K, arcydzieło, wysoka rozdzielczość, jeśli chcesz naturalny wygląd w fotografii.

Do skalowania spróbuj upscale latent po node i skaluj latent o 1.5, by uzyskać obrazy o wyższej rozdzielczości.

Używaj optymalizatora pagedlion8bit do treningu na karcie 24GB, zamroź parametry time_in, vector_in oraz modulacji, aby zapobiec de-destylacji.

Zakończ trening po kilku tysiącach kroków przy LR 5e-6, aby uniknąć uszkodzonych bloków i scalaj bloki z wcześniejszych checkpointów, aby naprawić uszkodzenia.

Najważniejsze informacje o wersji

Dostrojenie modelu schnell, bez użycia modelu dev w jakikolwiek sposób. Licencja Apache 2.0!

Trenowany z kohya z użyciem niestandardowego harmonogramu sigma oraz zamrożeniem parametrów czasu i modulacji, by zapobiec degradacji destylacji czasu.

➤ Suma kroków treningu : 1 360 641

➤ Aktywny czas treningu: 1192,61 godzin (49,7 dni)

Sponsorzy twórcy

Model dostępny również na: RunDiffusion oraz Runware.ai

Wielkie podziękowania dla RunDiffusion za sponsoring mocy obliczeniowej potrzebnej do treningu tego modelu!

Dla dostępu API sprawdź Runware.ai.

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Pliki Safetensor: 💾BF16 💾FP8 💾bnb FP4

Pliki GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Linki do 🤗VAE 🤗T5xxl 🤗CLIP L

Model dostępny również na: RunDiffusion oraz Runware.ai

PixelWave FLUX.1 schnell wersja 04 to estetyczne dostrojenie FLUX.1-schnell. Obrazy treningowe zostały ręcznie wybrane, aby zapewnić, że model ma skłonność do przyciągających uwagę obrazów z pięknymi kolorami, teksturami i oświetleniem.

  • Trenowany na oryginalnym modelu schnell, więc licencja Apache 2.0!

  • Brak specjalnych wymagań do uruchomienia. Wspiera FLUX LoRAs

  • Euler Normal, 8 kroków.

Możesz użyć większej liczby kroków, aby poprawić drobne detale, ale wyjście niewiele się zmienia po 8 krokach.

Podziękowania dla RunDiffusion

Wielkie podziękowania dla RunDiffusion (współtwórców Juggernaut) za sponsoring mocy obliczeniowej, która umożliwiła trening tego modelu! Opracowanie sposobu trenowania schnell bez de-destylacji modelu wymagało wielu eksperymentów, a możliwość wykorzystania chmurowych zasobów RunDiffusion znacznie to ułatwiła.

Dla osób potrzebujących dostępu do API tego modelu, współpracujemy z Runware.ai

Wersję FLUX.1-dev 04 uczyniłem na razie ekskluzywną dla RunDiffusion i Runware. Po wydaniu wersji 05 w przyszłości planuję udostępnić otwarte wagi dev 04.

Wdzięczny za ich wsparcie w wypuszczeniu tego modelu, proszę sprawdź ich!

Trenowanie

Trenowanie odbywało się za pomocą kohya_ss/sd-scripts. Możesz znaleźć mój fork Kohya tutaj, który zawiera także zmiany w submodule sd-scripts, upewnij się, że sklonujesz oba.

Używaj zakładki fine tuning. Najlepsze wyniki osiągnąłem z optymalizatorem pagedlion8bit, który działał na mojej karcie 4090 GPU 24GB. Inne optymalizatory miały trudności z nauką.

Zamroziłem parametry time_in, vector_in oraz mod/modulację, co zatrzymuje 'de-destylację'.

Unikam trenowania pojedynczych bloków powyżej 15. Możesz ustawić, które bloki trenować w sekcji FLUX.

LR 5e-6 szybko trenuje, ale musisz przerwać trening po kilku tysiącach kroków, ponieważ zaczyna uszkadzać bloki i spowalniać naukę.

Możesz wtedy połączyć bloki z wcześniejszego checkpointa, zastępując uszkodzone i kontynuować trening.

Objawy uszkodzonych bloków: tekstura papieru na większości obrazów, utrata detali tła.

Kontakt

W sprawach biznesowych lub komercyjnych prosimy o kontakt pod adresem pixelwave@rundiffusion.com. Licencjonowanie doprawek flux, projekty szkoleniowe dla klientów, komercyjny rozwój AI. Zespół potrafi to wszystko!

PixelWave Flux.1-dev 03 dopracowany!

Pliki Safetensor: 💾BF16 💾FP8 💾NF4

Pliki GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Linki do 🤗VAE 🤗T5xxl 🤗CLIP L

Pliki 'diffusers' to w rzeczywistości wersje GGUF Q8_0 i Q4_K_M. Pliki GGUF dostępne także na huggingface.

Dopracowywałem wersję 03 z bazowego FLUX.1-dev przez ponad 5 tygodni na mojej 4090. Jest w stanie tworzyć różne style sztuki, fotografii oraz anime. Odkryty trik pomagający z LoRAs.

Do pokazowych obrazów używałem dpmpp 2m sgm uniform 30 kroków. Jeśli chcesz czyściejszy efekt, spróbuj zwiększyć guidance. Wspominanie stylu też pomaga, aby model nie musiał zgadywać.

Polecam także dodanie upscale latent po node i skalowanie latent o 1.5, np. generowanie obrazu o rozmiarze 1536x1536 zamiast 1024x1024.

PixelWave Flux.1-schnell 03

Pliki Safetensor: 💾FP8 💾NF4

Pliki GGUF: przejdź do huggingface

Do obrazów pokazowych używałem dpmpp 2m sgm uniform 8 kroków.

Możesz zacząć od 4 kroków, ale jest mniej błędów w anatomii przy większej liczbie kroków.

PixelWave Flux.1-dev 02

Pliki Safetensor: 💾BF16 💾FP8

Pliki GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Wersja 02 znacznie poprawiła czarne i ciemne obrazy oraz zapewnia bardziej niezawodne wyniki z mniejszą liczbą problemów z rękami.

Zalecam używanie dpmpp_2s_ancestral, beta, 14 kroków. Lub euler, simple, 20 kroków.

Węzły Comfyui-GGUF

PixelWave 11 SDXL. Uniwersalny dopracowany model. Świetny do stylów sztuki i fotografii.

Używam 20 kroków, DPM++ SDE, CFG 4 do 6 lub 40 kroków, 2M SDE Karras

Wersja przyspieszona - 5+ kroków, DPM++ SDE Karras, 2.5 CFG

Zalecany PAG⚡Zalecana skala 1.5, z CFG 3. Link do workflow

🔗Link do rozszerzonej galerii 🖼️

Link do przewodnika po promptach.⭐ Nie musisz używać terminów „jakość” takich jak 4K, 8K, arcydzieło, wysoka rozdzielczość, wysoka jakość itp. Chyba że chcesz, zalecam unikanie słów takich jak 'żywy, intensywny, jasny, wysoki kontrast, neon, dramatyczny' dla stylów fotograficznych, jeśli zależy Ci na bardziej naturalnym wyglądzie. Może to spowodować, że obrazy będą wyglądać "przegotowane", ale to po prostu CLIP podąża za Twoim promptem. 🙂 Jeśli jednak chcesz żywe, neonowe zdjęcia, PixelWave je dostarczy!

Wersja 10 skupiała się na trenowaniu modeli CLIP, co poprawia wiarygodność, pozwala na szeroki wachlarz stylów i lepsze podążanie za promptami.

Dziękuję moim przyjaciołom, którzy pomogli testować: masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Przewodnik: Skalowanie promptów za pomocą LM Studio i Mikey Nodes

Przewodnik: Dodaj więcej szczegółów do obrazu wykorzystując metodę skip step

Nie jest potrzebny model refiner.

Ten model nie jest mieszanką innych modeli.

Stworzyłem także Mikey Nodes, które zawierają wiele przydatnych węzłów. Możesz zainstalować je przez comfy manager.

Poprzedni
Smol Dragons [LoRA 1.5+SDXL] - SDXL
Następny
ICBINP - „I Can't Believe It's Not Photography” - LCM

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

Flux.1 S

Wersja modelu

FLUX.1-schnell 04

Hash modelu

565b846820

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa PixelWave - FLUX.1-schnell 04

Astronauta w zużytym skafandrze kosmicznym stoi na białej pustyni przed ogromnym statkiem gwiezdnym w kształcie rekina z szeroko otwartym otworem przypominającym usta i dużymi silnikami.

Obrazy z anime

Zbliżenie portretu drobnej elfki z długimi srebrnymi kucykami, zielonkawymi oczami i delikatnymi rysami twarzy, ubranej w białą pelerynkę z złotą lamówką i czerwone kolczyki, stojącej w lesie.
Delikatna wróżka przypominająca Tinkerbell z misternymi przezroczystymi skrzydłami, spokojnie śpiąca na żywych kwiatach, ubrana w szczegółowy zielony strój.
Y'shtola Rhul z Final Fantasy XIV ubrana w czarną, bezrękawną chińską sukienkę z uszami i ogonem kota na tle nocnego nieba z wiszącymi latarniami.
Futurystyczny sci-fi klasztor i miasto zbudowane w stromych klifach bujnego wąwozu z rzeką poniżej, z latającą maszyną i samotną kobietą przechodzącą po wąskim moście.
Żywa ara siedząca na gałęzi w tropikalnym lesie deszczowym, w stylu anime z miękkimi pastelowymi tonami i wysokim kontrastem.
Dziewczyna z pięknymi oczami i grzywką siedząca na trawie, światło słoneczne i cienie liści przeplatają się na niej i na ziemi.
Portret retro futurystycznej dziewczyny z długimi kręconymi włosami, świecącymi jasnymi oczami, noszącej szczegółową zbroję i świecące kolczyki z kamieniami szlachetnymi pod światłem księżyca w nocy.
Portret w stylu anime dziewczyny z długimi niebieskimi włosami i pięknymi oczami, skąpanej w promieniach słońca, z jesiennymi liśćmi rzucającymi misternie cienie na jej opaloną skórę.
Postać egipska w stylu anime klęcząca na pustyni, o opalonej skórze, białych włosach, czerwonych oczach, ubrana w biały szatę i egipski kołnierz, promień słońca w tle.
Dziewczyna anime z krótkimi włosami stojąca na niebieskim polu kwiatów nocą, z świecącym niebieskim światłem i galaktyką na niebie, światła miasta w oddali.

Obrazy z model bazowy

Fotorealistyczna scena postaci nieumarłych, w tym zombie i szkieletów, spacerujących przez upiorny cmentarz oświetlony świecącymi lampionami jack-o'-lantern pod ciemnym, złowrogim niebem.

Obrazy z sztuka cyfrowa

Cyfrowa sztuka uroczego ciemnoszarego kota z jasnoniebieskimi oczami siedzącego na gałęzi drzewa otoczonego pomarańczowymi jesiennymi liśćmi. Kot ma świecącą aureolę nad głową i nosi obrożę z zawieszką.
Zacięta kobieta w świecącym, zaawansowanym technologicznie egzoszkielecie strzela energetycznymi wybuchami wśród ogromnej eksplozji w neonu oświetlonym dystopijnym pejzażu miasta.
Zbliżenie cyfrowego obrazu małej dziewczynki o brązowych włosach trzymającej białego królika na tle zaśnieżonej wioski zimą, wykonane w klasycznym stylu sztuki.
Widok zza długiej popękanej ścieżki prowadzącej przez dystopijne miasto zniszczone przez eksplozję atomową z ogromną chmurą grzybową i płonącymi ruinami.
Biały jednorożec z świecącym różowym rogiem i opadającą różową grzywą, czerwone oczy z kolorową twardówką, przedstawiony na ciemnym tle w stylu sztuki cyfrowej.
Zbliżenie cyfrowej sztuki czarnego kota ze świecącymi żółtymi oczami, przedstawionego za pomocą płaskich kolorów, wysokiego kontrastu i minimalnej pracy liniowej.
Fotorealistyczny portret modnej kobiety z kręconymi blond włosami, ubraną w żywe tkaniny i misterną biżuterię, na tle ozdobnego gobelinu.
Futurystyczna cyborg dziewczyna z długimi białymi włosami nosząca świecący, wysokotechnologiczny scifi kombinezon z świetlistymi niebieskimi panelami i zbroją, widziana z boku w ciemnym środowisku.
Gotycka katedra otoczona świecącymi pomarańczowymi płomieniami i boskim światłem, z postaciami w szatach otaczającymi ognistą scenę pod płonącym niebem.

Obrazy z photography

Blondynka z piegami i uśmiechem siedząca na dworze w bordowej koszulce z dekoltem w serek i kwiecistej mikroskopowej spódniczce w naturalnym świetle
Dziadek z siwymi włosami i kobieta z wysokim ponytailem szarych włosów stojący w turkusowym basenie z białym psem i kangurem przy różowych ścianach
Ciemna i nastrojowa nowoczesna architektura z betonowymi strukturami w formie tarasów oświetlonymi ciepłym pomarańczowym blaskiem w nocy.
Mistyczny nocny pejzaż z starożytnymi kamiennymi ruinami ze schodami, świecącym pełnym księżycem zachodzącym za dalekimi górami, krętą doliną rzeki, migoczącymi gwiazdami i ciepłym, magicznym niebem oświetlonym filmowym światłem.
Fotorealistyczny czarny Lincoln Continental z ciemno przyciemnionymi szybami na mokrej ulicy Nowego Jorku podczas zachodu słońca o złotej godzinie, z błyszczącym chodnikiem i deszczową atmosferą w stylu ziarnistości filmu.
Portret fotograficzny mody kobiety z krótkimi platynowymi włosami, wyglądającej zza ciemnej ramy drzwi, oświetlonej chłodnym niebieskim, kinowym światłem w minimalistycznym stylu.
Zbliżenie podwójnej ekspozycji portretu kobiety z mgłą i falami oceanu łączącymi się z jej profilem w stonowanych, kinowych kolorach
Zbliżenie młodej kobiety z zielonymi oczami i piegami, częściowo ukrytej za krzewem żywych fioletowych kwiatów i zielonych liści, jeden kwiat zasłania jedno oko.
Fotorealistyczna ilustracja w stylu akwareli Afrykańskiej kobiety w białej tunice i spodniach, noszącej okulary przeciwsłoneczne, schodzącej po schodach wewnątrz ogromnego czarnego futurystycznego statku kosmicznego z elementami designu cyberpunk i postapokaliptycznym pod dramatycznym oświetleniem.
Fotorealistyczna renderacja 3D postaci stojącej wewnątrz dużego, ciemnego, cylindrycznego tunelu z elementami futurystycznej technologii i świecącymi pomarańczowymi światłami, oświetlona efektami kinowymi i wolumetrycznymi.

Obrazy z sztuka tradycyjna

Pewna siebie rzymska strażniczka w misternie zdobionej brązowej zbroi bojowej, stojąca na historycznej ulicy miasta podczas dnia.
Orientalny tuszowy obraz przedstawiający dramatyczne wodospady spływające przez skaliste górskie klify z mglistą atmosferą i słabą kaligrafią
Kotka trójkolorowa siedząca spokojnie wśród żywych kwiatów w japońskim stylu akwarelowym pod dużym czerwonym słońcem z eleganckim efektem tuszu.
Zbliżenie na dziewczynę z lśniącymi włosami i czystą skórą, z zamkniętymi oczami.
Dziewczyna anime z długimi blond włosami w tradycyjnym japońskim mundurku szkolnym z niebieską kokardą
Biały tygrys i dziewczyna w tradycyjnym stroju na tle mglistych gór. Obraz wygenerowany przez AI za pomocą stable diffusion.
Dramatyczna scena z samotnym samurajem stojącym na wodzie, zwróconym w stronę tradycyjnej japońskiej pagody w oddali pod burzowym niebem z wirującymi chmurami i mgłą, wygenerowana za pomocą Stable Diffusion.
Obraz wygenerowany przez AI za pomocą Stable Diffusion przedstawiający piękną kobietę w tradycyjnym chińskim stroju z płynącymi włosami, szczegółowym starożytnym ubraniem oraz spokojnym orientalnym tłem z pagodą i roślinnością.