Pony: People's Works + - v7_Illuv1.0
Powiązane słowa kluczowe i tagi
Zalecane podpowiedzi
masterpiece, best quality, very aesthetic
masterpiece, best quality, very aesthetic, hatsune miku, 1girl, pink scrunchie, solo, hair scrunchie, dark hair, (licking:0.8), long hair, black nightgown, blue eyes, frills, short sleeves, holding rose, holding candy apple, half-closed eyes, glowing candy apple, white collared shirt, looking at viewer, black background, brown vest, colorful, pleated skirt, glowing hair, long skirt, sitting, portrait, knees up, from side, upper body, day, Eleanor \(people's works\), boat, river, cloud, blue sky, from below
Zalecane negatywne podpowiedzi
low quality, displeasing
low quality, displeasing, hair intakes, shiny hair
Zalecane parametry
samplers
steps
cfg
Wskazówki
Tag „photorealistic” zaleca się używać przy niskim udziale, aby jedynie dostosowywać teksturę, ponieważ modele SDXL trenowane na Danbooru nie renderują realistycznych obrazów dobrze.
Tag „realistic” można stosować przy wyższych wagach, aby uzyskać właściwy efekt.
Seria modeli ppw oszczędza miejsce na tokeny poprzez stabilizację jakości obrazu bez potrzeby stosowania tagów artysty lub długich promptów jakości.
Wersje LoCon o wysokim wymiarze zapewniają lepszą uogólnialność i detale, ale wymagają więcej miejsca do przechowywania i zasobów obliczeniowych.
Model zabrania użycia w zamkniętych aplikacjach komercyjnych oraz odsprzedaży, ale pozwala na użycie w otwartoźródłowych modelach łączonych z odpowiednim zaznaczeniem źródła.
v8
Aktualizacja tekstury: wzmacniano naukę poniższych tagów:
Texture Update: The following tags have been reinforced in training:
realistyczny, fotorealistyczny, płaski kolor,błyszcząca skóra, matowa skóra, błyszczące włosy,Proszę zauważyć, że w zbiorze danych danbooru jest wiele tagów opisujących „zdjęcia” i „style przypominające zdjęcia”. W zestawie treningowym wszystkie te obrazy zostały oznaczone jako „photorealistic”. Jednak modele SDXL trenowane na Danbooru zazwyczaj nie radzą sobie dobrze z renderingiem realistycznych obrazów, dlatego „photorealistic” jest zalecany jedynie przy niskiej wadze do korygowania tekstur. Tag „realistic” działa poprawnie przy wyższej wadze.
Proszę zauważyć, że zestaw danych Danbooru zawiera wiele tagów opisujących „foto” lub „styl foto-podobny”. Wszystkie takie obrazy oznaczyłem tagiem „photorealistic” w dataset.
Jednak większość modeli SDXL trenowanych na danych Danbooru nie renderuje dobrze obrazów realistycznych. „photorealistic” zalecany jest tylko przy niskim udziale (low weight), gdzie może pomóc w dostosowaniu tekstury, zamiast tworzyć realistyczne obrazy. Tag „realistic” działa prawidłowo przy wyższej wadze.
Szybki start | Quick Start
Czym to jest? | What is this?
Pony: People's Works (ppw) to eksperymentalna seria mikrodopasowanych modeli, gdzie około 85% datasetu pochodzi z obrazów AI udostępnianych przez użytkowników na CivitAI. Zestaw wcześniejszych wersji ppw opiera się na obrazach generowanych przez Pony v6, przez co obrazy z tej serii zawierają cechy Pony Diffusion.
Seria wykorzystuje standardowe tagi Danbooru i jest zoptymalizowana głównie do generowania stylizowanych portretów w średnim i zbliżonym planie. Główną funkcją modelu jest umożliwienie bazowemu modelowi uzyskania stabilnej jakości obrazu bez używania tagów artysty lub długich promptów jakościowych, co oszczędza tokeny.
Model nie jest stylowym LoRA i może wykazywać subtelne różnice stylistyczne w zależności od promptów i warunków generowania.
Pony: People's Works (ppw) is a experimental fine-tuned model series, approximately 85% of the dataset comes from AI-generated images published by users on CivitAI. Since the earlier ppw dataset was built on images generated by Pony V6, the outputs of this series also carry some characteristics of Pony Diffusion.
This series uses standard Danbooru tags and is mainly optimized for generating stylized portraits at medium and close range. The primary effect of this model series is to allow the basemodel to achieve relatively stable image quality, without artist keywords or long quality tags, freeing up token space for prompts.
These models are not style LoRAs. There may be subtle stylistic variations depending on different prompts and generating conditions.
Informacje o wersji | Version Info.
Na tej stronie opublikowano wersję LoCon o wysokiej wymiarowości, która jest też główną stroną tego projektu.
Wersje LoCon ppw można elastycznie łączyć z różnymi funkcjonalnymi LoRA i modelami bazowymi, oferując większą kontrolę nad siłą efektu. Wersje o wysokim wymiarze zapewniają lepszą uogólnialność i szczegóły, ale wymagają więcej miejsca na dysku i zasobów obliczeniowych.
Model jest przeznaczony głównie do usług generowania online oraz lokalnego użytku przez użytkowników z wydajnym sprzętem.
This page features the high dim LoCon version models of ppw, which also serves as the main page of this project.
The LoCon versions of ppw can be flexibly combined with various functional LoRAs and checkpoints, offering greater controllability over effect weight. High dimension versions provide stronger generalization and more detailed rendering, but it requires more storage space and computational resources.
They are mainly intended for online generation services and local use by users with high-performance PCs.
Lekka wersja LoCon | Lightweight LoCon ver.
Wersje modeli bazowych | Checkpoint versions (Illustrious)
Wersje modeli bazowych | Checkpoint versions (NoobAI)
Sposób użycia | Usage
pozytywne:
arcydzieło, najlepsza jakość, bardzo estetycznenegatywne:
niska jakość, nieprzyjemneHistoria zmian | Change log
v7
Wersja v7 wprowadziła duże zmiany w strukturze datasetu i zastosowała inne parametry i strategie treningowe, więc może być mniej stabilna niż wcześniejsze wersje.
Wersja v7 dokonała znaczących zmian strukturalnych w zbiorze danych i wykorzystuje odmiennie parametry oraz strategie treningu. W rezultacie v7 może być mniej stabilna niż poprzednie wersje.
Model v-pred na generatorze online CivitAI działa inaczej niż w przypadku online na TensorArt – z tymi samymi parametrami wyniki nie są do odtworzenia. Nie wiem dlaczego...
Wydajność modelu v-pred na generatorze online CivitAI różni się całkowicie od generowania na TensorArt. Rezultatów nie da się powtórzyć z tymi samymi ustawieniami. Nie mam pojęcia dlaczego...
Wersja TensorArt Wersja CivitAI z tymi samymi parametrami na CivitAI z wyższą wagą
Opis wersji v7:
To LoCon poprawiające jakość obrazu, rozwinięte na bazie datasetu z poprzedniej wersji. Około 90%-95% obrazów pochodzi z serwisu CivitAI.
Model umożliwia uzyskanie względnie stabilnej jakości obrazu bez używania tagów artysty i z krótszymi promptami jakości, oszczędzając tokeny. Dodatkowo naprawia niektóre wrodzone defekty generacji (z wyjątkiem rąk).
Z powodu wyboru danych obrazy mają styl Pony, ale ponieważ model nie odwołuje się do konkretnego artysty, stylu czy techniki malarskiej, mogą występować subtelne różnice stylu w zależności od promptów i warunków modelu.
To LoCon jakości generowania opracowane na bazie datasetu z poprzedniej pracy. Około 90%-95% obrazów pochodzi z CivitAI.
Pozwala uzyskać względnie stabilną jakość obrazu bez tagów artysty i długich promptów jakościowych, oszczędzając tokeny. Również potrafi naprawić niektóre wrodzone błędy generowania (poza rękami).
Z powodu wyboru danych obrazy pokazują cechy Pony, ale że nie odnosi się do konkretnych artystów czy stylu, mogą pojawić się subtelne różnice stylistyczne w zależności od promptów i warunków modelu.
Źródło danych i licencja | Dataset Source & License
Każdy obraz w dataset został ręcznie wybrany, kategoryzowany i oznaczony przez autora, a setki obrazów było ręcznie edytowanych i poprawianych.
Model jest darmowy i open-source, użytkownicy mogą go wdrażać na własnym sprzęcie. Autor nie czerpie korzyści ze sprzedaży modelu. Autor nie ogranicza wykorzystywania modelu do komercyjnych usług generowania obrazów lub generowania komercyjnych obrazów, lecz należy przestrzegać licencji Checkpointów i LoRA używanych z tym modelem.
Około 90%-95% danych pochodzi z AI, ale jest też ponad 250 obrazów z mediów publicznych, wiadomości i publikacji do uzupełnienia koncepcji. W przyszłych wersjach te materiały będą sukcesywnie zastępowane. Użytkownicy komercyjni powinni zachować ostrożność.
W dataset nie ma danych szkoleniowych pojedynczych artystów ani ich oznaczeń (choć nie można wykluczyć błędnego oznaczenia przez AI).
Dodatkowo, ten model nie jest dozwolony do użycia w zamkniętych aplikacjach komercyjnych, sprzedaży modelu ani łączenia z zamkniętymi modelami komercyjnymi. Nie dotyczy to otwartoźródłowych modeli łączonych używanych w usługach generowania, ale zaleca się podawać źródła tych modeli.
Każdy obraz w dataset został ręcznie wybrany, skategoryzowany i oznaczony przez autora, a setki obrazów było ręcznie edytowanych i poprawianych.
Model jest darmowy i open-source, umożliwiając użytkownikom wdrożenie go na ich prywatnych urządzeniach. Autor nie otrzymuje wynagrodzenia za sprzedaż modelu. Autor nie nakłada ograniczeń na używanie modelu do komercyjnych usług generowania obrazów lub generowanie obrazów do celów komercyjnych, jednak prosimy o przestrzeganie ograniczeń licencji Checkpointa oraz innych używanych LoRA.
Około 90%-95% dataset stanowią obrazy generowane przez AI. Mimo to ponad 250 obrazów zostało zebranych z mediów publicznych, wiadomości i publikacji do uzupełniania koncepcji. Przyszłe wersje będą stopniowo wymieniać te materiały. Użytkownicy komercyjni powinni być świadomi potencjalnych ryzyk.
W tym zbiorze danych nie ma danych treningowych pojedynczych artystów ani ich jawnych oznaczeń (chociaż nie jest wykluczone błędne oznaczanie przez AI).
Dodatkowo, ten model nie jest dozwolony do użycia w zamkniętych, komercyjnych aplikacjach, sprzedaży modelu ani łączenia z zamkniętymi modelami komercyjnymi. Brak ograniczeń dla otwartoźródłowych modeli połączonych używanych w usługach generowania, ale zaleca się podanie źródła takich modeli.
Szczegóły modelu
Typ modelu
Model bazowy
Wersja modelu
Hash modelu
Twórca
Dyskusja
Proszę się log in, aby dodać komentarz.






