modele/Pony: People's Works v1-v6 - v4_noobEv1.0

Pony: People's Works v1-v6 - v4_noobEv1.0

|
7/15/2025
|
1:23:07 AM
| Discussion|
0
Dziewczyna z anime z krótką pomarańczową fryzurą bob, uśmiechająca się podczas siedzenia na trawie, ubrana w czarną sukienkę, różowe trampki i urocza torebka w kształcie kota, z klarownym niebieskim niebem i tłem miasta.
Profil boczny osoby w detalicznym, metalicznym niebieskim hełmie rycerskim z dramatycznym kinowym oświetleniem i rozmytym ciemnym tłem.
Fotorealistyczny obraz android kobiety z beztwarzową głową robota i metalowymi kończynami, siedzącej na krześle, noszącej czarne szpilki w cyberpunkowym i steampunkowym otoczeniu z kinowym oświetleniem.
Fotorealistyczne portret werecat girl z fioletowymi włosami, fioletowymi oczami i kocimi uszami, leżącej na łóżku z białą pościelą w ciepło oświetlonej sypialni Walentynkowej z poduszką w kształcie serca.
Fotorealistyczne półzbliżenie androidki z czarnymi, błyszczącymi metalowymi kończynami i złożonymi steampunkowymi detalami mechanicznymi, oświetlone kinowo.
Zbliżenie portretu azjatyckiej dziewczyny w białym dzianym kapeluszu i szaliku, trzymającej kubek kawy na zewnątrz na zaśnieżonej ulicy z kinowym oświetleniem i rozmytym tłem.
Cyberpunkowy młody mężczyzna z czerwonym irokezem jeździ na świecącym hoverboardzie nad futurystycznym miejskim krajobrazem o zachodzie słońca, z widokiem na drapacze chmur i ulice oświetlone neonami z perspektywy z powietrza.
Portret nieśmiałej kujonki z kasztanowobrązowymi kręconymi włosami, okulary zsuwające się z nosa, ubrana w przytulny biały sweter w miękkim oświetleniu wewnętrznym.
Duży steampunkowy pancernik dramatycznie wpływa do miejskiej fantasy zatoki pod jasnym niebieskim niebem, obserwowany przez dzieci i mieszkańców miasta, oświetlony dramatycznym światłem i atmosferyczną mgłą.
Zbliżenie na czarne metalowe, robotyczne nogi androidki w szpilkach z detalicznymi stawami i błyszczącym wykończeniem pod kinematograficznym oświetleniem.

Zalecane podpowiedzi

masterpiece,best quality,very aesthetic

1girl, solo, full lower lip, narrow mouth, long hair, blue eyes, looking at viewer, upper body, masterpiece, best quality, very aesthetic

Zalecane negatywne podpowiedzi

worst quality,low quality,displeasing

worst quality, low quality, displeasing

Zalecane parametry

samplers

Euler a

steps

25 - 30

cfg

6 - 7

clip skip

2

resolution

832x1216

Wskazówki

Dla wersji V3 i nowszych używaj pozytywnych tagów takich jak 'masterpiece', 'best quality' i 'very aesthetic'.

Negatywne prompta obejmują 'worst quality', 'low quality' i 'displeasing'.

Dodanie 'hair intakes' w promptach może częściowo złagodzić problemy z artefaktami fryzur.

Wersje sprzed V2 nie mają określonych słów wyzwalających; proszę używać tagów jakości z odpowiednimi modelami.

Należy pamiętać, że tagi jakości i estetyczne z Animagine v3.1 mogą zmieniać styl sztuki generowany przez LoRA.

Wprowadzenie 简介:

Jest to style LoCon wytrenowany na obrazach modeli opartych na pony zebranych z serwisu Civitai z 'największą liczbą kolekcji' i 'największą liczbą reakcji'.

这是一个训练自Civitai上点赞最多和收藏最多的pony系模型图片画风LoCon

Ten lora nie ma na celu symulowania stylu lub techniki konkretnego artysty. MOŻE odzwierciedlać gust społeczności oraz atrakcyjność wizualną obrazu w pewnym stopniu. Style mogą się nieznacznie zmieniać w zależności od różnych promptów.

这个lora并不意于还原某个特定的画师画风或者绘画技巧。它在某种程度上可能反应了社区审美图片的视觉吸引力。 不同的提示词下可能会有微妙的画风变化。

Użycie 使用方法:

Wersje sprzed V2 nie mają określonych słów wyzwalających. Proszę używać tagów jakości dostarczonych z odpowiednim modelem.

Dla V3 i nowszych wersji wytrenowano następujące tagi:

V2以前的版本没有特定触发词。请使用对应模型自带的质量提示词。

对于v3及后续版本,训练了以下标签:

pozytywne:

masterpiece, best quality, very aesthetic

negatywne:

worst quality, low quality, displeasing

Możesz edytować prompt na tej podstawie.

Generowanie danych 数据版本:

v6:

Dodano ponad 500 nowych obrazów, z których niektóre zostały wybrane z Flux. Usunąłem starsze obrazy, które uznałem za niższej jakości.

Łączna liczba obrazów w zbiorze danych przekracza teraz 3 000, z ponad 20 konceptami ręcznie ulepszonymi/edytowanymi w 6 wersjach zbioru.

Ranga modelu również została podniesiona.

新添加了500+张图片其中有一部分选自flux生成的图像。删除了一部分我认为品质不佳的旧图片。

现在总的图片数超过了3000,6个版本的数据总共手动增强/修正了20多条概念。

增加了模型的rank。

v5.9:

Wyniki modelu nie są zgodne z oczekiwaniami, ale uważam, że obrazy w zbiorze treningowym są w porządku. Planuję ręcznie dostosować tagi i zobaczyć, jak zmieni się wynik.

模型效果不如预期,但是我觉得训练集的图片本身应该没什么问题。打算先手动修正tag看看效果。

Aktualizacja 2025/1/3:

Ręcznie zaktualizowano niektóre tagi, ale wydają się one niezwiązane z jasnością i kolorami. Tymczasowo podejrzewam, że może mieć to związek z przesunięciem szumu.

手动更新了一部分标签,但是它们和明暗色彩无甚干系。暂时猜测可能和noise offset有关。

v5:

Zbiór danych został rozszerzony do 2154 obrazów, z około 1000 obrazów Pony jako głównym celem treningowym.

Chociaż modele V-pred mogą używać LoRA trenowanego na modelach opartych na technologii Eps-pred, jakość wyjściowa znacząco spada. Ta wersja będzie trenowana osobno na dwóch różnych typach modeli.

Najnowsze wersje NoobAI wykazują zauważalne artefakty, ale tag 'jpeg artifact' z Danbooru nie działa skutecznie. Aby rozwiązać ten problem, wybrano około 30 typowych i wizualnie zauważalnych obrazów jako przykłady negatywne.

Zaobserwowano zjawisko: Pony v6 i NoobAI mają tendencję do generowania trójkątnego uniesienia u nasady fryzur z bocznymi grzywkami. Na Danbooru to uniesienie jest czasami oznaczane jako "hair intakes" lub "curtained hair", ale Pony stosuje tę strukturę do każdego charakteru. To jest kluczowy powód, dla którego fryzury generowane przez Pony często nie odpowiadają zamierzonym projektom podczas treningu postaci. Podobny problem zaobserwowano w NoobAI. Przypuszczam, że ta cecha jest powszechna w zbiorze danych spoza Danbooru i nie została odpowiednio oznaczona.

Obrazy w zbiorze danych zostały odfiltrowane, a około dwie trzecie zostało prawidłowo oznaczonych. Obecnie dodanie 'hair intakes' do prompt może częściowo złagodzić ten problem, ale nie znaleziono jeszcze kompletnego rozwiązania.

数据集扩充到2154张图。其中作为主要训练目标的pony图片约1000张。

虽然V-pred模型也能使用基于Eps-pred技术的模型训练的lora,但是生成质量会大打折扣。这个版本将会分别在两个不同类型的模型上训练。

noobAI近期版本有比较明显的伪影,但是danbooru上的“jpeg artifact”并没有起作用。因此专门针对这个问题选择了约30张较为典型的、肉眼可见的图片作为负面案例。

观察到一个现象:pony v6和noobAI在生成有侧发的发型时,倾向于在发根处生成一个三角形的翘起。在danbooru里,这种翘起有时会被标注为“hair intakes”和“curtained hair”,但是pony会给每一个角色都套上这样的结构。这也是pony训练角色时,发型训练不像的一个重要原因。noob也观察到了类似的现象,我的猜测是danbooru以外的某个训练集大量存在这个特征,但没有对这个特征进行正确标注。

对数据集里的图片进行了筛选,其中约2/3的图片进行了正确的标注。现在,在prompt里写上“hair intakes”可能可以一定程度上减轻这个现象,但是我还没有找到根治这个毛病的办法。

v4:

Częściowa optymalizacja tagów zbioru danych. Trenowano na podstawie NoobAI Epsilon-pred v1.

Modele oparte na Pony mają silną tendencję do generowania kolczyków, piercingu uszu i innych akcesoriów, czasem zaburzając strukturę uszu postaci. Przeorganizowano związane tagi, wykadrowano i ręcznie edytowano niektóre obrazy w zbiorze z drobnymi problemami strukturalnymi oraz usunięto obrazy zbyt trudne do poprawienia.

对数据集的标注方式进行了部分优化。基于NoobAI Epsilon-pred v1训练。

Pony系模型有很强烈的生成耳环、耳钉以其他类型的耳部饰品的倾向,有时还会破坏人物耳部的结构。对相关的标注进行了整理。剪裁、手工修改了数据集中一部分结构错误不严重的图,剔除了一些太难修改的图片。

v3:

Zbiór danych rozszerzony do 1429 obrazów, w tym przykłady z pozytywnymi i negatywnymi tagami.

774 z obrazów to najbardziej "pożądany" styl.

Wytrenowano na podstawie Illustrious v0.1.

数据集扩展到了1429张图片,包括了正反两种例子。

其中774张是训练的目标风格。

基于Illustrious v0.1训练。

v2:

Zbiór danych powiększono do 374 obrazów. Używaj tagów jakości i estetycznych dostarczonych z modelami do kontrolowania jakości generacji.

训练数据集扩展到了374张。尝试使用模型自带的质量提示词来稳定生成质量。

v1:

Wytrenowano na 224 obrazach z Civitai, 393 obrazy do regularizacji.

Wytrenowano 2 wersje oparte na Animagine v3.1 oraz Pony v6.

训练了C站上224张图片,393张正则数据集。

有Animagine v3.1和Pony v6两个版本。

wersja testowa 4:

Jest trochę niedopasowany, ale nadal działa. Zauważyłem, że tagi jakości i autentyczności (best quality, masterpiece, very aesthetic, ...) wytrenowane w Animagine v3.1 mogą zmieniać styl sztuki generowany przez ten checkpoint. Poprawiam to w następnej wersji testowej.

有些欠拟合但是目前是有效的。我发现Animagine v3.1自带的质量控制词和美学提示词会改变生成图片的画风,所以这个实验版本需要不填写质量词。下一版会修复。

Poprzedni
R754496 | Style Shiiro | Niji - v1.0
Następny
A-mix [Illustrious] - A - mix

Szczegóły modelu

Typ modelu

LORA

Model bazowy

NoobAI

Wersja modelu

v4_noobEv1.0

Hash modelu

bf047b0dc0

Dyskusja

Proszę się log in, aby dodać komentarz.