Zbliżenie czarnoskórej wojowniczki z krótkimi włosami w srebrnej zbroi i czerwonym płaszczu, stojącej w lesie o wschodzie słońca.

Zalecane podpowiedzi

film grain texture,analog photography aesthetic,studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still

film grain texture, analog photography aesthetic

Zalecane negatywne podpowiedzi

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

(worst quality, low resolution, bad hands), distorted, twisted, watermark, open mouth

Zalecane parametry

samplers

DPM++ 2M Karras, Euler a

steps

6 - 25

cfg

1 - 10

resolution

1024x1024, 832x1248, 896x1152, 1248x832, 1360x768, 768x1360, 900x1200

Zalecane parametry wysokiej rozdzielczości

upscaler

ESRGAN 4x, 8x_NMKD-Faces_160000_G

upscale

1.5

steps

8

denoising strength

0.3

Wskazówki

Używaj słowa wyzwalającego "leogirl" w HelloWorld 1.0 dla stabilnych wyników.

Do zdjęć całej sylwetki używaj pluginu ADetailer i naprawy 1.5x wysokiej rozdzielczości dla poprawy detali.

Prompt z naturalnym językiem poprawia generowanie realistycznych zdjęć AI.

Uważaj na ciepłe tony w HelloWorld 5.0 z powodu wzmocnionej faktury filmowej; dodaj "studio light" lub "sharp focus" do promptu dla lepszych tonów skóry.

Unikaj promptów ze stylami animowanymi, jeśli niepożądane, ponieważ w wersji 5.0 dodano niektóre zestawy ilustracji.

Używaj zalecanych negatywnych promptów dla poprawy dokładności kończyn i rąk oraz ogólnej jakości obrazu.

Najważniejsze informacje o wersji

Ten model jest przyspieszoną wersją bazowego modelu HelloWorld SDXL, łączącą technologie SDXL-Lightning. Wyposażony w sampler Eular a i CFG 1, potrafi generować obrazy w 6-8 krokach, co jest trzy razy szybsze niż w oryginalnej wersji SDXL. Co więcej, w porównaniu uzyskuje lepsze wyniki niż wersje LCM lub Turbo, i jest gorąco polecany do testów i użycia przez wszystkich.

Zalecane parametry do generowania obrazów tym modelem to:

Sampler: Eular a (Ważne! Model jest specjalnie dostosowany do Eular a, inne samplery mogą nie przynosić równie dobrych wyników)

Skala CFG: 1

Liczba kroków próbkowania: 8 kroków (dopowolone 6~8)

Algorytm wysokiej rozdzielczości: ESRGAN 4x / 8x_NMKD-Faces_160000_G

Czynnik powiększenia: 1.5x

Kroki wysokiej rozdzielczości: 8 kroków

Siła odszumiania: 0.3

Sponsorzy twórcy

🖥️Zapraszamy do wypróbowania otwartoźródłowego GPT4V-Image-Captioner, stworzonego przeze mnie i mojego przyjaciela. Oferuje instalację jednym kliknięciem i integruje funkcje wstępnej kompresji obrazu, tagowania oraz statystyk tagów.

Niedawno uruchomiliśmy także wersję pluginu webui tego narzędzia, wszyscy mogą korzystać!

🖥️Zapraszam do wypróbowania otwartoźródłowego GPT4V-Image-Captioner, stworzonego przeze mnie i mojego przyjaciela. Oferuje instalację jednym kliknięciem oraz integruje funkcje takie jak wstępna kompresja obrazu, tagowanie obrazów i statystyki tagów. Niedawno uruchomiliśmy także wersję pluginu webui tego narzędzia, każdy jest mile widziany do korzystania!

🌍Zapraszamy do dołączenia do grup QQ "兔狲·AIGC梦工北厂" o numerze: 780132897 oraz "兔狲·AIGC梦工南厂" o numerze: 835297318 (odpowiedź przy dołączeniu: 兔狲). Czat Telegram „兔狲的SDXL百老汇”, link: https://t.me/+KkflmfLTAdwzMzI1

📖Aktualizacja HelloWorld 7.0 - 13 czerwca 2024

Podsumowanie w jednym zdaniu: HelloWorld 7.0 to wersja zoptymalizowana iteracyjnie, z najlepszymi osiągami ciała w całej serii oraz dalszym poszerzeniem zakresu koncepcji i bogactwa detali.

Szczegóły aktualizacji:

  1. Dzięki dodaniu negatywnych obrazów treningowych, wzmocnieniu treningu poz, oraz optymalizacji modelu clip, poprawiono dokładność kończyn i rąk względem poprzednich wersji. Zalecane negatywne słowa promptu to: "bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality".

  2. Wyodrębniono dostrojone LoRA z oficjalnego modelu SPO i włączono je do HelloWorld 7.0. SPO to dalsze ulepszenie metody DPO. Bazowy model SPO zapewnia lepszą wydajność niż DPO XL i oryginalny model bazowy SDXL. LoRA SPO wzmacnia detale i kontrast obrazów oraz je upiększa. Podziękowania dla zespołu technicznego SPO.

  3. Kontynuowano rozszerzanie zakresu koncepcji zestawu treningowego, przy optymalizacji i uproszczeniu zbioru (duże zestawy treningowe są kosztowne, a wynajem H800 jest obecnie trudny, lokalny czas treningu niedostępny). Aktualnie łączna liczba obrazów w zestawie: 20 821. Rozkład rozdzielczości zestawu treningowego jest następujący, rekomendowane jest użycie kilku rozdzielczości o większej liczbie obrazów do generowania:

    (832, 1248) - Liczba: 7128
    (896, 1152) - Liczba: 6250
    (1248, 832) - Liczba: 2402
    (1024, 1024) - Liczba: 1639
    (1360, 768) - Liczba: 928
    (1152, 896) - Liczba: 870
    (768, 1360) - Liczba: 432
    (960, 1088) - Liczba: 506
    (992, 1056) - Liczba: 162
    (1088, 960) - Liczba: 140
    (704, 1472) - Liczba: 120
    (1056, 992) - Liczba: 122
    (1472, 704) - Liczba: 115
    (1632, 640) - Liczba: 75
    (640, 1632) - Liczba: 12
  4. Użyto GPT4O do ponownego oznaczenia wszystkich zestawów danych. Tym razem zastosowano zorganizowaną metodę etykietowania, ze strukturą: "opis streszczenia w jednym zdaniu + wiele tagów elementów obrazu + inspirowane przez XXX + słowa opisujące estetykę", podzielone na pięć poziomów jakości estetycznej: worst quality, low quality, average quality, best quality oraz masterpiece. Typowy przykład etykiety to:

    conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic, inspired by salvador dalí's surrealist works, masterpiece

Lista często używanych tagów i stylów artystycznych związanych z sekcją Inspired by XXX dla wersji HelloWorld 7.0 jest udostępniana wyłącznie licencjobiorcom komercyjnym. Partnerzy, którzy kupili licencję na model HelloWorld XL w przeszłości, proszeni są o kontakt w celu darmowego otrzymania tych materiałów, jeśli zostały przeoczone.

Gracze mogą się odwołać do Listy Najczęściej Używanych Tagów HelloWorld 6.0. Dodatkowo udostępniłem ponad 150 wysokiej jakości przykładów obrazów HelloWorld 7.0 w galerii, które mogą służyć jako odniesienie dla wszelkich generacji. Tworzenie modeli nie jest łatwe, dziękuję graczom za zrozumienie i cierpliwość!

📖Aktualizacja HelloWorld 6.0 - 20 kwietnia 2024

LEOSAM HelloWorld 6.0 Top 250 Najczęściej Używanych Tagów

Dziękuję za cierpliwość. Ostatnio szukałem pracy, co spowodowało pewne opóźnienia w aktualizacjach HelloWorld. Oto główne zmiany w wersji 6.0:

  • HelloWorld 6.0 to iteracyjne usprawnienie oparte na wersji 5.0. Według moich testów realizm tego modelu nie różni się znacząco od wersji 5.0. Główną zaletą wersji 6.0 jest szersze pokrycie koncepcji w zestawie treningowym. Według opinii, ulepszono motywy takie jak surrealizm, boudoir, zdjęcia grupowe, maski, origami, rendery 3D, samochody, smoki i fotografia ciążowa. Niektóre przykłady znajdują się w ilustracjach.

  • Version 6.0 celowo zawiera niskiej jakości obrazy w treningu, aby wzmocnić reakcję modelu na negatywne prompt. Zaleca się używanie następujących słów w negatywnych promptach: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".

  • Główna część zestawu treningowego HelloWorld 6.0 jest tagowana przez GPT4v. Dla obrazów, których GPT4v nie potrafi otagować, używany jest cogVQA prowadzony przez blip2-opt-6.7b. Styl językowy tagowania tych modeli multimodalnych różni się znacznie od tradycyjnego tagowania WD1.4. Aby ułatwić dokładniejsze wyzwalanie różnych koncepcji w treningu, przygotowałem listę 250 najczęstszych tagów HelloWorld 6.0. Możesz je zobaczyć w tym dokumencie.

Na koniec, mimo że SD3 wkrótce się pojawi, nadal będę aktualizował HelloWorld XL 7.0, licząc na większe ulepszenia w wersji 7.0!

📖Wprowadzenie 2024.2.22 "HW5.0_Euler_a_Lightning"

Ten model jest przyspieszoną wersją bazowego modelu HelloWorld SDXL, łączącą technologie SDXL-Lightning. Wyposażony w sampler Eular a i CFG 1, potrafi generować obrazy w 6-8 krokach, co jest trzy razy szybsze niż w oryginalnej wersji SDXL. Co więcej, w porównaniu uzyskuje lepsze wyniki niż wersje LCM lub Turbo.

Zalecane parametry do generowania obrazów tym modelem to:

Sampler: Eular a (Ważne! Model jest specjalnie dostosowany do Eular a, inne samplery mogą nie przynosić równie dobrych wyników)

Skala CFG: 1

Liczba kroków próbkowania: 8 kroków (dopowolone 6~8)

Algorytm wysokiej rozdzielczości: ESRGAN 4x / 8x_NMKD-Faces_160000_G

Czynnik powiększenia: 1.5x

Kroki wysokiej rozdzielczości: 8 kroków

Siła odszumiania: 0.3

📖Wprowadzenie 2024.2.11 "HelloWorld 5.0 GPT4V"

HelloWorld 5.0 to największa dotychczasowa aktualizacja historii serii HelloWorld, otagowana GPT-4v i poddana znacznemu dostrajaniu w dziedzinach takich jak science fiction, zwierzęta, architektura i ilustracje.

Testy porównawcze pokazują usprawnienia w tej wersji, w tym:

1. Bardziej zróżnicowane i dynamiczne pozy postaci i kompozycje obrazów, tworzące wizualnie angażujące obrazy;

2. Dane filmowe zostały gruntownie wytrenowane. Podczas gdy faktura filmowa była słaba w wersjach 2.0 do 4.0, wielu fanów tęskniło za stylem leogirl z wersji 1.0. Dlatego ta aktualizacja szczególnie wzmocniła fakturę filmową bez utraty innych cech fotograficznych. Fakturę filmową można wywołać frazami takimi jak film grain texture i analog photography aesthetic;

3. Zwiększona ekspresyjność w tematach takich jak science fiction, thriller i zwierzęta, z mechanizmami i innymi obiektami o bardziej zaprojektowanym wyglądzie. Zwierzęta takie jak lampart śnieżny, panda ruda, panda wielka, tygrys, ryś stepowy oraz koty i psy domowe są bardziej realistyczne;

4. Dzięki tagowaniu GPT, zgodność z promptem i dokładność koncepcji zostały dodatkowo ulepszone.

Kwestie i wady tej wersji to:

1. Jako że jest to znacząca aktualizacja dostrajająca, wskaźnik błędów kończyn może nieznacznie wzrosnąć, co jest normalnym zjawiskiem przy dążeniu do nowych pól optymalizacji. Poprzednie wersje miały więcej testów kończyn dla ulepszeń, tutaj czasu było mniej. Jednak dokładność kończyn w tej wersji jest przynajmniej wyższa niż w wersji 1.0, a w przyszłości planuję dalsze poprawki.

2. Z powodu wzmocnionej faktury filmowej, mimo jak najdokładniejszego tagowania GPT, może pojawić się domyślny ciepły ton obrazu. Można jednak użyć promptów takich jak studio light lub sharp focus, aby uzyskać zdjęcia w wysokiej jakości studyjnej, a przy odpowiednich promptach obraz będzie miał lepsze tony skóry i walory wizualne niż w poprzednich wersjach.

3. Wersja ta zawiera więcej pełnych postaci, aby poprawić efekt całej sylwetki, dlatego model może generować szersze sceny niż wcześniej, jeśli nie zostanie podany konkretny prompt kompozycji. Obecnie szczegóły twarzy w pełnych sylwetkach 1024 są mniej ostre w porównaniu do ujęć półpostaci lub zbliżeń, ale można to poprawić za pomocą adetailera i 1.5x Hires z intensywnością 0.3 albo odpowiednich promptów ograniczających generowanie pełnych sylwetek.

4. Ponieważ dodano nieliczne wysokiej jakości zestawy danych ilustracyjnych, istnieje szansa, że prompt dotyczący stylu animowanego wygeneruje obrazy animowane. Jeśli to przeszkadza, proszę odpowiednio dostosować prompt.

To główne zmiany tej wersji. Trening modelu bazowego SDXL jest trudny, gdy zestaw treningowy osiąga około dziesięciu tysięcy obrazów, koszt tagowania i treningu dla każdego modelu przekracza 300 USD. Zapraszam do korzystania z modelu i wszelkich opinii! Jeśli model Ci się podoba, będę bardzo wdzięczny za jego rozpowszechnianie.

📖Wprowadzenie 2024.1.31 "HelloWorld 4.0"

HelloWorld4.0 to wersja przejściowa, zmieniająca tagowanie z blip+clip na GPT4V. Początkowo trenowałem model tylko z GPT4V tagowaniem, a potem połączyłem go z dużą częścią wersji HelloWorld3.2 i z 0.05 udziałem Juggernaut XL (dla dostosowania tonu skóry). Nowa wersja wykazuje lepszą zgodność z promptem i pokrycie koncepcji niż 3.2.

Nowy zestaw treningowy GPT4V podwoił liczbę obrazów z serii helloworld3 z 4000 do 8000, obejmując nie tylko portrety, ale także zwierzęta, architekturę, naturę, jedzenie, ilustracje i inne. Jednak wersja czysto GPT4V napotkała problem przeuczenia, co wstępnie przypisuje się podwojeniu ilości obrazów treningowych. Następnym krokiem iteracyjnej optymalizacji jest znalezienie sposobu na objęcie większej liczby koncepcji niemal portretowych przy jednoczesnym zachowaniu odpowiedniego treningu portretów. Obecnie zastosowano fuzję nowej i starej wersji do dostrajania, by zapewnić łagodne przejście między wersjami, więc rozszerzony zestaw koncepcji i zalety GPT4V są aktualnie mniej zauważalne. Staną się one bardziej widoczne w kolejnych generacjach 5 i 6 modelu.

📖Wprowadzenie 2024.1.5 "HelloWorld 3.2"

Wersja 3.2 jest iteracją zoptymalizowaną za pomocą technologii DPO i w porównaniu z wersją 3.0 zawiera optymalizacje tonów skóry i dokładności kończyn, lecz poprawy nie są znaczące. Z tego powodu wersja jest oznaczona jako 3.2 a nie jako 4.0.

📖Wprowadzenie 2023.12.15 "HelloWorld 3.0"

  1. Nowa wersja rozszerzyła zestaw treningowy, poprawiając zdolność modelu do wyrażania się w różnych stylach artystycznych, w tym science fiction i sztuki.

  2. Zintegrowano własnoręcznie zrobione ulepszenie jakości LoCon (stworzony przy pomocy technologii slider), poprawiające teksturę obrazów i redukujące zniekształcenia palców oraz kończyn.

📖Wprowadzenie 2023.11.17 "HelloWorld 2.0"

Dziękuję wszystkim za cierpliwość. Po pokonaniu różnych wyzwań, wersja HelloWorld 2.0 jest gotowa do prezentacji w stanie, z którego jestem zadowolony. Główne różnice między HelloWorld 2.0 a 1.0 to:

  1. HelloWorld 2.0 nie wymaga już słów wyzwalających, a jakość jest porównywalna do wersji 1.0 ze słowami wyzwalającymi. Wyzwalacz "leogirl" z wersji 1.0 był mocno powiązany z Azjatami Wschodnimi. Po zniesieniu słów wyzwalających, słowa takie jak "1girl" nadal mogą generować portrety Azjatów Wschodnich, jeśli rasa nie jest określona, ale teraz można określić rasę przez słowa kluczowe takie jak narodowość, kolor skóry itd. Przykładowe efekty wyzwalaczy dla "Chinese", "Russian", "Iranian", "Jamaican", "Kenyan", "dark-skinned", "pale-skinned" itp. podano poniżej.

    Możesz też uzyskać różne style postaci, wpisując imiona osób z różnych krajów i płci, np. Han Meimei (Chiny), Sophie Martin (Francja), Priya Patel (Indie), Fatima Al-Hassan (Arabia), Wanjiru Mwangi (Kenia). Podane prompt to przykłady - jest ich wiele innych do odkrycia i dzielenia się.

  2. HelloWorld 2.0 wyważył jakość/kolor i oferuje więcej opcji stylów. Wersja 1.0 używana z "leogirl" generowała obrazy z silną fakturą filmową. HelloWorld 2.0 nie jest już związany z fakturą filmową i może być dostosowany przez prompty dotyczące jakości. Testowane i skuteczne prompt to:

    high-end fashion photoshoot, product introduction photo, popular Korean makeup, aegyo sal, Sharp High-Quality Photo, studio light, medium format photo, Mamiya photography, analog film, Medium Portrait with Soft Light, real-life image, refined editorial photograph, raw photo, real photo, Scanned Photo, film still

    Efekty kolorystyczne tych promptów są następujące:

  3. Zestaw treningowy HelloWorld 2.0 znacząco zwiększył udział zdjęć całych sylwetek, aby poprawić efekty SDXL w generowaniu portretów całopostaciowych i z dalszej perspektywy. Choć jest lepiej niż w wersji 1.0, nadal zdecydowanie zaleca się stosowanie pluginu "adetailer" podczas generowania całych sylwetek. Ponadto, dla użytkowników z wystarczającą pamięcią wideo (24 GB), rekomenduję naprawę o wysokiej rozdzielczości 1.5x, co znacząco polepsza szczegóły twarzy.

📖Wprowadzenie 2023.8.29 "HelloWorld" Model Bazowy SDXL

Specjalne przypomnienie: Podczas używania modelu HelloWorld 1.0, proszę pamiętać o dodaniu wyzwalacza "leogirl".

Odróżnia się od modelu bazowego SD1.5 "MoonFilm", "HelloWorld" jest nową realistyczną serią modeli bazowych SDXL. Aby umożliwić większej liczbie użytkowników odkrycie HelloWorld, zachowałem link do oryginalnego modelu Moonfilm. Można go uważać za duchowe kontynuowanie Moonfilm na nowej platformie SDXL, lecz HelloWorld ma na celu coś więcej niż realizm i jakość filmu w portretach. Dzięki znacznie lepszej ilości informacji i zdolności rozumienia tekstu SDXL w porównaniu do SD1.5, HelloWorld to model bazowy dążący do realistycznego przedstawiania wszystkiego, innymi słowy, chcę budować wirtualny świat fotografii z wykorzystaniem HelloWorld.

Realistyczny model bazowy SD1.5 osiągnął dojrzałość i raczej nie będzie znacząco ulepszany, chyba że pojawi się przełomowa technologia dla platformy SD1.5, seria Moonfilm & MoonMix zasadniczo przestanie się aktualizować. Skupię główne siły na rozwoju dużego modelu HelloWorld SDXL. Wersja 1.0 jest dostępna do pobrania, a wersja 2.0 jest pilnie rozwijana i spodziewana na początku września.

Jako całkowicie nowy model SDXL, HelloWorld różni się od tradycyjnych modeli SD1.5 na trzy sposoby:

  1. W przeciwieństwie do modeli bazowych SD1.5, które zwykle nie mają słów wyzwalających, proszę pamiętać o użyciu słowa wyzwalającego "leogirl" w HelloWorld 1.0, co zapewnia stabilniejsze wyzwalanie efektów treningu modelu SDXL.

  2. Model HelloWorld obsługuje bezpośrednie wyjście w rozdzielczości 1024*1024 pikseli, eliminując potrzebę powiększania wysokiej rozdzielczości. Jakość bliskiego portretu bezpośrednio wyjściowego nie ustępuje wersji SD1.5, ale nadal występują niedociągnięcia przy bezpośrednim wyjściu portretów z dalszej perspektywy. Dlatego zaleca się użycie pluginu ADetailer, który skutecznie koryguje problemy z dalszymi twarzami.

  3. SDXL umożliwia teraz łatwiejsze wyjścia za pomocą proste promptów w naturalnym języku. Zaleca się próbowanie coraz bardziej naturalnych promptów, co da lepsze efekty podczas generowania realistycznych zdjęć AI.

Po wielokrotnych testach, zalecane ustawienia parametrów rysunku to:

  • Steps ≥ 25

  • Sampler: DPM++ 2M Karras

  • Skala CFG: 10

  • Rozmiar ≥ 1024x1024

  • ADetailer: włączony

Zapraszam wszystkich do wypróbowania HelloWorld i przekazywania cennych opinii, które są ważne dla kolejnych ulepszeń modelu!

Seria modeli HelloWorld (dalej "Model") została stworzona przeze mnie (dalej "Właściciel") z pomocą platformy LiblibAI. Republikaowanie Modelu na platformach innych niż LiblibAI i Civitai jest nieautoryzowane przez Właściciela.

Właściciel zezwala na niekomercyjne, edukacyjne lub informacyjne wykorzystanie obrazów wygenerowanych przez Model bez opłat pod warunkiem:

- Użytkownicy przestrzegają obowiązujących przepisów i nie naruszają praw Modelu ani osób trzecich.

- Należy wyraźnie podać atrybucję obrazów jako "stworzono przez bazowy model HelloWorld LEOSAM".

Do wszelkiego rodzaju wykorzystania komercyjnego wymagana jest wcześniejsza umowa licencyjna z Właścicielem. W sprawach licencjonowania komercyjnego i personalizacji modelu proszę kontaktować się z Właścicielem poprzez informacje kontaktowe dostępne na stronie głównej Właściciela.

Rozwój i darmowa dystrybucja modelu SDXL to ważne przedsięwzięcia. Właściciel zobowiązuje się do nieprzerwanych, bezpłatnych aktualizacji modelu HelloWorld dla indywidualnych entuzjastów jako wyraz wdzięczności za wkład społeczności w rozwój open-source. Współpraca komercyjna jest niezbędna dla rozwoju i udoskonalenia Modelu. Właściciel dziękuje każdemu użytkownikowi za zrozumienie i wsparcie.

Nieautoryzowane użycie może naruszać prawo i prowadzić do konsekwencji prawnych. Właściciel zastrzega sobie wyłączne prawo interpretacji tego oświadczenia, które podlega obowiązującym przepisom prawa.

Poprzedni
Big Centaur Lora XL - 0.5
Następny
Akira Mizutani Growth Academy (GA) [FLUX, Pony XL, SD 1.5] - v0.96

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

SDXL Lightning

Wersja modelu

HW5.0_Euler_a_Lightning

Hash modelu

d5e0492911

Twórca

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa HelloWorld XL LEOSAM - HW5.0_Euler_a_Lightning

Obrazy z model bazowy

Obrazy z zdjęcie

Obrazy z fotorealistyczny

Obrazy z realistyczny

Obrazy z kobieta