modèles/Pony : Œuvres du peuple v1-v6 - v3_illu0.1

Pony : Œuvres du peuple v1-v6 - v3_illu0.1

|
7/18/2025
|
2:11:21 PM
| Discussion|
0
Une fille robot d'inspiration steampunk avec un corps en porcelaine brillante orné de détails complexes en or et métal, des yeux lumineux et une tête robotique large inhabituelle, dans un intérieur industriel vintage et orné.
Profil latéral d'une fille android inspirée des Amérindiens avec des cheveux bruns tressés, membres mécaniques, tenant un arc de chasse, portant un manteau à motif tribal, avec un faucon mécanique perché sur son épaule sur fond de désert au coucher du soleil.
Une fille puma blonde avec des bras et une queue d'animal se détend, allongée sur une branche d'arbre épaisse dans une jungle luxuriante, portant une tenue tribale avec des détails de fourrure dorée.
Image photoréaliste en gros plan d'une fille aux cheveux colorés arc-en-ciel léchant un cornet de glace rose avec un éclairage dramatique et un arrière-plan en bokeh
Gros plan de pieds enveloppés dans des collants en nylon transparent mouillés avec gouttes d'eau, posés sur un sol en bois réfléchissant avec un tissu sombre à proximité.
Deux jeunes femmes agenouillées s'embrassant dans un champ de fleurs jaunes lumineux à l'aube sous un ciel de coucher de soleil doux avec une légère fumée en forme de cœur au-dessus d'elles.
Une fille en leggings sportifs et sweat à capuche jouant joyeusement avec un golden retriever et un corgi dans un parc d'automne doré aux feuilles orange vibrantes et à la chaude lueur du coucher de soleil.

Prompts recommandés

masterpiece,best quality,very aesthetic

1girl, solo, masterpiece, best quality, very aesthetic

Prompts négatifs recommandés

worst quality,low quality,displeasing

lowres, bad, text, worst quality, low quality, displeasing

Paramètres recommandés

samplers

Euler a, DPM++ 2M Karras

steps

25 - 35

cfg

5 - 6

Conseils

Pour la V3 et les versions ultérieures, utilisez des tags positifs comme « masterpiece », « best quality » et « very aesthetic ».

Les prompts négatifs incluent « worst quality », « low quality » et « displeasing ».

Ajouter « hair intakes » dans les prompts pourrait atténuer quelque peu les problèmes d’artefacts de coiffure.

Les versions antérieures à V2 n’ont pas de mots déclencheurs spécifiques ; veuillez utiliser les tags de qualité avec les modèles correspondants.

Soyez conscient que les tags de qualité et d’esthétique d’Animagine v3.1 peuvent modifier le style artistique généré par le LoRA.

Intro. 简介:

Un style LoCon entraîné sur des images de modèles basés sur les poneys collectées sur le site Civitai avec "plus de collections" et "plus de réactions".

这是一个训练自Civitai上点赞最多和收藏最多的pony系模型图片画风LoCon

Ce lora n’a pas pour but d’imiter un style ou une technique spécifique d’artiste. Il PEUT refléter le goût communautaire et l’attrait visuel d’une image dans une certaine mesure. Les styles peuvent changer subtilement selon les différents prompts.

这个lora并不意于还原某个特定的画师画风或者绘画技巧。它在某种程度上可能反应了社区审美图片的视觉吸引力。 不同的提示词下可能会有微妙的画风变化。

Usage 使用方法:

Les versions antérieures à V2 n’ont pas de mots déclencheurs spécifiques. Veuillez utiliser les tags de qualité fournis avec le modèle correspondant.

Pour la V3 et les versions ultérieures, les tags suivants ont été entraînés :

V2以前的版本没有特定触发词。请使用对应模型自带的质量提示词。

对于v3及后续版本,训练了以下标签:

positif :

masterpiece, best quality, very aesthetic

négatif :

worst quality, low quality, displeasing

Vous pouvez éditer les prompts sur cette base.

Data Generation 数据版本:

v6 :

Ajout de plus de 500 nouvelles images, dont certaines sélectionnées à partir de Flux. J’ai retiré certaines images plus anciennes que je jugeais de moindre qualité.

Le nombre total d’images dans l’ensemble de données dépasse désormais 3 000, avec plus de 20 concepts améliorés/édités manuellement à travers 6 versions du dataset.

Le rang du modèle a également été augmenté.

新添加了500+张图片其中有一部分选自flux生成的图像。删除了一部分我认为品质不佳的旧图片。

现在总的图片数超过了3000,6个版本的数据总共手动增强/修正了20多条概念。

增加了模型的rank。

v5.9 :

La performance du modèle n’est pas celle attendue, mais je pense que les images du dataset d’entraînement sont correctes. Je prévois d’ajuster manuellement les tags et de voir comment les résultats évolueront.

模型效果不如预期,但是我觉得训练集的图片本身应该没什么问题。打算先手动修正tag看看效果。

2025/1/3更新:

Mise à jour manuelle de certains tags, mais ils semblent non liés à la luminosité et aux couleurs. J’émets l’hypothèse que cela pourrait être lié au décalage du bruit.

手动更新了一部分标签,但是它们和明暗色彩无甚干系。暂时猜测可能和noise offset有关。

v5 :

Le dataset a été étendu à 2 154 images, avec environ 1 000 images de poneys comme objectif principal d’entraînement.

Bien que les modèles V-pred puissent utiliser LoRA entraîné sur des modèles basés sur Eps-pred, la qualité de sortie baisse considérablement. Cette version sera entraînée séparément sur deux types de modèles différents.

Les versions récentes de NoobAI présentent des artefacts visibles, mais le tag « jpeg artifact » de Danbooru ne semble pas efficace. Pour résoudre ce problème, environ 30 images typiques et visuellement remarquables ont été spécifiquement sélectionnées comme exemples négatifs.

Un phénomène a été observé : Pony v6 et NoobAI ont tendance à générer un soulèvement triangulaire à la racine des coiffures avec mèches latérales. Sur Danbooru, ce soulèvement est parfois étiqueté comme « hair intakes » ou « curtained hair », mais Pony applique cette structure à chaque personnage. C’est une raison clé pour laquelle les coiffures générées par Pony ne correspondent souvent pas au design prévu lors de l’entraînement des personnages. Un problème similaire a été observé avec NoobAI. Je suppose que cette caractéristique est présente dans un dataset en dehors de Danbooru et n’a pas été correctement étiquetée.

Les images du dataset ont été filtrées, et environ deux tiers ont été correctement annotées. Actuellement, l’ajout de « hair intakes » dans le prompt pourrait quelque peu atténuer ce problème, mais je n’ai pas encore trouvé de solution complète.

数据集扩充到2154张图。其中作为主要训练目标的pony图片约1000张。

虽然V-pred模型也能使用基于Eps-pred技术的模型训练的lora,但是生成质量会大打折扣。这个版本将会分别在两个不同类型的模型上训练。

noobAI近期版本有比较明显的伪影,但是danbooru上的“jpeg artifact”并没有起作用。因此专门针对这个问题选择了约30张较为典型的、肉眼可见的图片作为负面案例。

观察到一个现象:pony v6和noobAI在生成有侧发的发型时,倾向于在发根处生成一个三角形的翘起。在danbooru里,这种翘起有时会被标注为“hair intakes”和“curtained hair”,但是pony会给每一个角色都套上这样的结构。这也是pony训练角色时,发型训练不像的一个重要原因。noob也观察到了类似的现象,我的猜测是danbooru以外的某个训练集大量存在这个特征,但没有对这个特征进行正确标注。

对数据集里的图片进行了筛选,其中约2/3的图片进行了正确的标注。现在,在prompt里写上“hair intakes”可能可以一定程度上减轻这个现象,但是我还没有找到根治这个毛病的办法。

v4 :

Optimisation partielle des tags du dataset. Entraîné basé sur NoobAI Epsilon-pred v1.

Les modèles basés sur les poneys ont une forte tendance à générer des boucles d’oreilles, des piercings d’oreille, et d’autres types d’accessoires, perturbant parfois la structure de l’oreille des personnages. J’ai réorganisé les tags liés, recadré et modifié manuellement certaines images du dataset ayant des problèmes structurels mineurs, et supprimé les images trop difficiles à réparer.

对数据集的标注方式进行了部分优化。基于NoobAI Epsilon-pred v1训练。

Pony系模型有很强烈的生成耳环、耳钉以其他类型的耳部饰品的倾向,有时还会破坏人物耳部的结构。对相关的标注进行了整理。剪裁、手工修改了数据集中一部分结构错误不严重的图,剔除了一些太难修改的图片。

v3 :

Dataset étendu à 1 429 images, incluant des exemples avec tags positifs et négatifs.

774 images correspondent au style le plus « demandé ».

Entraîné sur Illustrious v0.1.

数据集扩展到了1429张图片,包括了正反两种例子。

其中774张是训练的目标风格。

基于Illustrious v0.1训练。

v2 :

Dataset étendu à 374 images. Utilisation des tags de qualité et esthétiques fournis avec les modèles pour contrôler la qualité de génération.

训练数据集扩展到了374张。尝试使用模型自带的质量提示词来稳定生成质量。

v1 :

Entraîné avec 224 images de Civitai, 393 images pour régularisation.

Deux versions entraînées basées sur Animagine v3.1 et Pony v6.

训练了C站上224张图片,393张正则数据集。

有Animagine v3.1和Pony v6两个版本。

test ver.4 :

Il est un peu sous-ajusté mais fonctionne toujours. J’ai constaté que les tags de qualité et d’authenticité (best quality, masterpiece, very aesthetic, ...) sur lesquels Animagine v3.1 a été entraîné peuvent changer le style artistique généré par ce checkpoint. Je corrigerai cela dans la prochaine version de test.

有些欠拟合但是目前是有效的。我发现Animagine v3.1自带的质量控制词和美学提示词会改变生成图片的画风,所以这个实验版本需要不填写质量词。下一版会修复。

Précédent
Void Spectrum - LoRa Style Concept Art - v1.0
Suivant
Nevolution XL/IL - v2-anim

Détails du modèle

Type de modèle

LORA

Modèle de base

Illustrious

Version du modèle

v3_illu0.1

Hash du modèle

06f1d406c0

Créateur

Discussion

Veuillez vous log in pour laisser un commentaire.