Pony: People's Works v1-v6 - v3_illu0.1
Powiązane słowa kluczowe i tagi
Zalecane podpowiedzi
masterpiece,best quality,very aesthetic
1girl, solo, masterpiece, best quality, very aesthetic
Zalecane negatywne podpowiedzi
worst quality,low quality,displeasing
lowres, bad, text, worst quality, low quality, displeasing
Zalecane parametry
samplers
steps
cfg
Wskazówki
Dla wersji V3 i nowszych używaj pozytywnych tagów, takich jak 'masterpiece', 'best quality' i 'very aesthetic'.
Negatywne prompty to 'worst quality', 'low quality' oraz 'displeasing'.
Dodanie 'hair intakes' w promptach może częściowo złagodzić problemy z artefaktami fryzur.
Wersje przed V2 nie mają specyficznych słów wywołujących; proszę używać tagów jakości z odpowiednimi modelami.
Należy pamiętać, że tagi jakości i estetyki z Animagine v3.1 mogą zmieniać styl sztuki generowany przez LoRA.
Wprowadzenie 简介:
Model style LoCon wytrenowany na obrazy modeli opartych na pony zebrane ze strony Civitai z "największą liczbą kolekcji" i "największą liczbą reakcji".
这是一个训练自Civitai上点赞最多和收藏最多的pony系模型图片的画风LoCon。
Ta lora nie ma na celu symulacji stylu czy techniki konkretnego artysty. MOGŁA odzwierciedlać gust społeczności i wizualną atrakcyjność obrazu w pewnym stopniu. Style mogą subtelnie zmieniać się w zależności od różnorodnych promptów.
这个lora并不意于还原某个特定的画师画风或者绘画技巧。它在某种程度上可能反应了社区审美和图片的视觉吸引力。 不同的提示词下可能会有微妙的画风变化。
Sposób użycia 使用方法:
Wersje przed V2 nie mają specyficznych słów wywołujących. Proszę używać tagów jakości dostarczonych z odpowiednim modelem.
Dla wersji V3 i nowszych wytrenowano następujące tagi:
V2以前的版本没有特定触发词。请使用对应模型自带的质量提示词。
对于v3及后续版本,训练了以下标签:
positive:
masterpiece, best quality, very aestheticnegative:
worst quality, low quality, displeasingMożna edytować prompt na tej bazie.
Generowanie danych 数据版本:
v6:
Dodano ponad 500 nowych obrazów, niektóre wybrane z Flux. Usunięto kilka starszych obrazów uznanych za gorszej jakości.
Całkowita liczba obrazów w zbiorze przekroczyła teraz 3000, z ponad 20 koncepcjami ręcznie ulepszanymi/edycjonowanymi w 6 wersjach zbioru danych.
Zwiększono też rangę modelu.
新添加了500+张图片其中有一部分选自flux生成的图像。删除了一部分我认为品质不佳的旧图片。
现在总的图片数超过了3000,6个版本的数据总共手动增强/修正了20多条概念。
增加了模型的rank。
v5.9:
Wydajność modelu nie jest zgodna z oczekiwaniami, ale uważam, że obrazy w zbiorze treningowym są w porządku. Planuję ręcznie dostosować tagi i zobaczyć, jak się zmienią wyniki.
模型效果不如预期,但是我觉得训练集的图片本身应该没什么问题。打算先手动修正tag看看效果。
Aktualizacja 3/1/2025:
Ręcznie zaktualizowano niektóre tagi, ale wydają się one nie być powiązane z jasnością i kolorami. Tymczasowo przypuszczam, że może to mieć związek z przesunięciem szumu.
手动更新了一部分标签,但是它们和明暗色彩无甚干系。暂时猜测可能和noise offset有关。
v5:
Zbiór danych został rozszerzony do 2154 obrazów, z około 1000 obrazami Pony jako głównym celem treningowym.
Chociaż modele V-pred mogą używać LoRA trenowanych na modelach bazujących na Eps-pred, jakość wyjściowa znacznie spada. Ta wersja będzie trenowana osobno na dwóch różnych typach modeli.
Najnowsze wersje NoobAI wykazują wyraźne artefakty, ale tag 'jpeg artifact' z Danbooru nie działa skutecznie. Aby rozwiązać ten problem, wybrano około 30 typowych i wizualnie zauważalnych obrazów jako negatywne przykłady.
Zaobserwowano zjawisko: Pony v6 i NoobAI mają tendencję do generowania trójkątnego uniesienia u nasady fryzur z bocznymi pasmami. Na Danbooru to uniesienie bywa czasem oznaczane jako "hair intakes" lub "curtained hair", ale Pony nakłada tę strukturę na każdą postać. To kluczowy powód, dla którego fryzury generowane przez Pony często nie odpowiadają zamierzonemu projektowi przy treningu postaci. Podobny problem obserwowano w NoobAI. Przypuszczam, że cecha ta występuje powszechnie w zbiorze poza Danbooru i nie została poprawnie oznaczona.
Obrazy w zbiorze zostały przefiltrowane i około dwie trzecie jest poprawnie oznaczonych. Obecnie dodanie 'hair intakes' do prompta może częściowo złagodzić ten problem, ale pełnego rozwiązania jeszcze nie znaleziono.
数据集扩充到2154张图。其中作为主要训练目标的pony图片约1000张。
虽然V-pred模型也能使用基于Eps-pred技术的模型训练的lora,但是生成质量会大打折扣。这个版本将会分别在两个不同类型的模型上训练。
noobAI近期版本有比较明显的伪影,但是danbooru上的“jpeg artifact”并没有起作用。因此专门针对这个问题选择了约30张较为典型的、肉眼可见的图片作为负面案例。
观察到一个现象:pony v6和noobAI在生成有侧发的发型时,倾向于在发根处生成一个三角形的翘起。在danbooru里,这种翘起有时会被标注为“hair intakes”和“curtained hair”,但是pony会给每一个角色都套上这样的结构。这也是pony训练角色时,发型训练不像的一个重要原因。noob也观察到了类似的现象,我的猜测是danbooru以外的某个训练集大量存在这个特征,但没有对这个特征进行正确标注。
对数据集里的图片进行了筛选,其中约2/3的图片进行了正确的标注。现在,在prompt里写上“hair intakes”可能可以一定程度上减轻这个现象,但是我还没有找到根治这个毛病的办法。
v4:
Częściowa optymalizacja tagów w zbiorze danych. Trening na podstawie NoobAI Epsilon-pred v1.
Modele oparte na pony mają silną tendencję do generowania kolczyków, przekłuć uszu i innych rodzajów akcesoriów, czasem naruszając strukturę ucha postaci. Przeorganizowano powiązane tagi, wykadrowano i ręcznie edytowano niektóre obrazy w zbiorze danych z drobnymi błędami strukturalnymi oraz usunięto obrazy zbyt trudne do naprawienia.
对数据集的标注方式进行了部分优化。基于NoobAI Epsilon-pred v1训练。
Pony系模型有很强烈的生成耳环、耳钉以其他类型的耳部饰品的倾向,有时还会破坏人物耳部的结构。对相关的标注进行了整理。剪裁、手工修改了数据集中一部分结构错误不严重的图,剔除了一些太难修改的图片。
v3:
Zbiór danych rozszerzono do 1429 obrazów, w tym przykładów z tagami pozytywnymi i negatywnymi.
774 obrazy to najbardziej "pożądany" styl.
Trening na bazie Illustrious v0.1.
数据集扩展到了1429张图片,包括了正反两种例子。
其中774张是训练的目标风格。
基于Illustrious v0.1训练。
v2:
Zbiór danych rozszerzono do 374 obrazów. Użyj tagów jakości i estetycznych dołączonych do modeli, aby kontrolować jakość generacji.
训练数据集扩展到了374张。尝试使用模型自带的质量提示词来稳定生成质量。
v1:
Wytrenowano na 224 obrazach z Civitai, 393 obrazy do regularizacji.
Trenowano 2 wersje na bazie Animagine v3.1 oraz Pony v6.
训练了C站上224张图片,393张正则数据集。
有Animagine v3.1和Pony v6两个版本。
test ver.4:
Jest trochę niedotrenowany, ale nadal działa. Zauważyłem, że tagi jakości i autentyczności (best quality, masterpiece, very aesthetic, ...) z Animagine v3.1 wpływają na styl sztuki generowany przez ten checkpoint. Poprawię to w następnej wersji testowej.
有些欠拟合但是目前是有效的。我发现Animagine v3.1自带的质量控制词和美学提示词会改变生成图片的画风,所以这个实验版本需要不填写质量词。下一版会修复。
Szczegóły modelu
Dyskusja
Proszę się log in, aby dodać komentarz.







