modèles/Tponynai3 - v55

Tponynai3 - v55

Camille Dubois

5/23/2025

1:24:57 AM

| Discussion|

Mots-clés et tags associés

61cc7615e2,89e7c7518c,ac17f32d24,anime,modèle de base,point de contrôle,nai,nai3,pony,tonade,tponynai3

Une image générée par IA utilisant stable diffusion mettant en scène une jolie fille d'anime aux cheveux blonds, portant des lunettes bleues et une tenue bleu clair, avec un ruban noir dans ses cheveux.

Image de style anime d'une fille mignonne aux cheveux bleus, portant une robe de mariée blanche, un voile et une tiare, créée avec Stable Diffusion.

Fille anime aux longs cheveux bleu foncé, portant un uniforme scolaire avec un nœud rouge, se tenant devant un fond bleu clair avec des fleurs blanches. Image générée par IA utilisant stable diffusion.

Fille anime aux longs cheveux noirs, étoiles dans les cheveux, et uniforme blanc, souriante. Image générée par IA utilisant Stable Diffusion.

Image générée par IA d'une fille magique d'anime avec de longs cheveux bleus, des yeux bleus, et une tenue détaillée, créée avec Stable Diffusion.

Une fille anime mignonne aux longs cheveux foncés et un grand sourire tenant un signe de paix. Image générée par IA utilisant Stable Diffusion.

Jeune fille de style anime aux longs cheveux foncés portant une robe blanche sans manches, souriante et faisant un signe de paix avec la main. L'arrière-plan présente des fleurs bleues lumineuses et un ciel nocturne, soulignant qu'il s'agit d'une image générée par IA utilisant Stable Diffusion.

Une fille d'anime heureuse aux cheveux bleu foncé et un ruban rouge, riant joyeusement devant un fond coloré avec des fleurs, créée avec Stable Diffusion.

Fille d'anime aux cheveux noirs flottants et robe blanche, entourée de fleurs bleues lumineuses, créée avec Stable Diffusion.

Une jolie fille d'anime aux longs cheveux noirs et rubans faisant un clin d'œil et tenant son index sur ses lèvres, générée par IA utilisant Stable Diffusion.

Image générée par IA d'une fille d'anime aux cheveux lavande dans un fauteuil roulant, portant une veste rouge et un béret noir utilisant Stable Diffusion.

Image de style anime générée par IA d'une fille démon frappant un sac de frappe avec Stable Diffusion.

Prompts recommandés

score_9,score_8_up,score_7_up

score_9,score_8_up

Prompts négatifs recommandés

score_4,score_3,score_2,worst quality, bad hands, bad feet

score_3,score_2,ugly,bad feet

Paramètres recommandés

samplers

Euler a

steps

22 - 30

cfg

clip skip

resolution

848x1072, 840x1112, 952x1192, 936x1192, 872x1184, 848x1216, 824x1160

other models

T-ponynai3(5.5-4)(v3-0.5) (89e7c7518c)

Paramètres haute résolution recommandés

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.6 - 1.7

steps

denoising strength

0.3

Conseils

Utilisez la haute correction à une résolution modérée pour de meilleurs résultats.

Essayez style_3 ou 4 pour améliorer les détails des yeux.

Points forts de la version

Cette version est une optimisation de la 5.1, améliorant les détails des yeux, la cohérence des pieds, la sensibilité aux prompts et la cohérence du chevauchement des membres. Cependant, le traitement des contrastes lumineux ne répond pas encore à mes attentes, dans mes tests, style_4 assombrit l'image, peut-être une solution temporaire. J'ai effectué un entraînement supplémentaire car l'entraînement direct ne donnait pas de bons résultats, ce qui m'a fait perdre du temps. Si vous avez d'autres questions, n'hésitez pas à me le dire dans les commentaires !

This version is an optimization to 5.1, optimizing the details of the eyes, the rationality of the feet, the sensitivity to cues, and the rationality of limb overlap. In my tests, the use of style_4 made the picture darker, perhaps a short-term solution, and I used some additional training, because the direct training did not work so well, so I wasted some time. If you have more questions, please be sure to let me know in the comments section!

Sponsors du créateur

[Non certifié] Tonade est l'auteur en création du modèle T-ponynai3, ID c : Tonade | 爱发电 (afdian.net )

Voici la voie de soutien sur 爱发电, si vous trouvez le modèle utile et avez la possibilité, vous pouvez soutenir ! Ne vous forcez pas, merci pour chaque soutien, nous continuerons à explorer comment améliorer le modèle !

929721518本人的qq小群群号，有啥不会的关于tpony的问题可以进来问。记得备注c站哦

模型已经内置vae了，不需要额外添加vae

Le modèle inclut déjà un vae, il n'est pas nécessaire d'ajouter un vae supplémentaire

La meilleure stratégie de génération est une résolution modérée avec correction haute, plutôt que l'utilisation directe d'une haute résolution

La meilleure stratégie de génération est d'utiliser une haute correction à une résolution modérée, plutôt que l'exportation directe en haute résolution

[Non certifié] Tonade est l'auteur en création du modèle T-ponynai3, ID c : Tonade | 爱发电 (afdian.net )

Voici la voie de soutien sur 爱发电, si vous trouvez le modèle utile et avez la possibilité, vous pouvez soutenir ! Ne vous forcez pas, merci pour chaque soutien, nous continuerons à explorer comment améliorer le modèle !

(33) T-ponynai3-v5 - (version modifiée du poids) | Stable Diffusion Checkpoint | 吐司 tusi.cn (tusiart.com) lien de génération en ligne tusiart (version tensor Chine)

(Parce que le modèle ne peut exister que simultanément sur Tusi et Tensor, il est préférable de l'utiliser sur Tusi. Si vous rencontrez des problèmes d'utilisation, merci de me le signaler davantage）

La version v5 a ajouté 4 nouveaux styles, ajustables via style_1 à style_4 pour affiner les détails de l'image (théoriquement, mais l'effet réel est assez ésotérique)

La version V5 a ajouté 4 nouveaux styles, qui permettent d'affiner les détails de l'image via style_1 à style_4 (en théorie, mais l'effet réel est plus mystique ou moindre)

Ce modèle supporte parfaitement les loras entraînés sur ponyv6 comme base, et les Lora de ani3 et sdxl1.0 peuvent aussi être adaptés dans une certaine mesure.

Ce modèle supporte parfaitement lora entraîné avec ponyv6 en tant que base, et les Lora de ani3 et sdxl1.0 peuvent aussi être adaptés à certains égards.

Bases sur des tests de Image inpaint avec v4.1 (partie négligée dans les versions précédentes)

Tests de retouche d'image basés sur v4.1 (cette partie était auparavant ignorée)

Pony est génial, parfait en termes de compatibilité. Ce modèle supporte les lora de ani et pony

Effets préalables indispensables similaires à ponydiffusion

positif :(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)

OU (score_9,score_8_up,score_7_up)

Négatif recommandé :

négatif : (score_4,score_3,score_2,score_1),

Il est aussi possible d'utiliser des mots négatifs standard du type nai, par exemple :

négatif : worst quality, bad hands, bad feet

J'espère que vous aimerez ᕕ(◠ڼ◠)ᕗ basé sur nai3 et ponyv6

Instructions d'entraînement : v1 a utilisé 94 images, v2 119 images, v3 348 images, v3.5 474 images générées par nai3 pour entraîner la lora adapté au basemodel, supportant tous les tags d'artiste de ponyv6, sans tags supplémentaires de nai3. L'utilisation de plus de deux tags d'artistes peut causer des erreurs de fond. Actuellement, il est possible de générer des personnages de Genshin Impact, les autres inconnus. Peu testé, fascinant par la reproduction du style nai3. Basemodel est une fusion de T-anime-xl, ponyv6 et ani3 non publié.

La carte graphique utilisée pour l'entraînement était ma propre 3090, avec temps d'entraînement respectifs de 7, 12, 35 et 47 heures de v1 à v3.5

Instructions d'entraînement : fusion Lora utilisant 94 images pour v1, 119 pour v2, 348 pour v3, 474 pour v3.5, générées par NAI3 pour affiner le basemodel. Pony supporte tous les tags d'artistes présents dans ponyv6, sans tags supplémentaires de nai3. L'utilisation de plus de deux tags peut entraîner des plantages de fond. Actuellement, les personnages générables incluent ceux de Genshin Impact. Peu testé, émerveillement pour la reproduction du style nai3. Basemodel fusion de T-anime-xl, ponyv6 et ani3 non publié.

La carte graphique utilisée pour l'entraînement était ma propre 3090, utilisée 7, 12, 35 et 47 heures respectivement pour v1 à v3.5.

v1

Une tentative intéressante

v2

Augmentation légère du set de données et environ 30 heures d'essais et erreurs, mais le style montre encore des surapprentissages, comme le double nombril et les cheveux désordonnés

Sur la base de v1, légère augmentation du set d'entraînement et environ 30 heures de réglages, mais le style généré présente un certain surapprentissage, comme les nombrils doubles et les cheveux en désordre

v3

Les membres de v3 sont meilleurs que v2. Pour footfocus, v3 peut générer des pieds avec un impact visuel plus fort et des angles de perspective plus complexes. L'aspect AI des cheveux de v3 est moins prononcé que v2, car v2 a un petit set entraînement, causant un léger surapprentissage sur les cheveux, et les nombrils doubles disparaissent. En général, la taille de training triple par rapport à v2 et un dim plus grand rendent le style plus naturel et la performance supérieure sous des prompts longs.

Les membres de v3 sont meilleurs que ceux de v2. En termes de footfocus, v3 peut générer des pieds avec un impact visuel plus intense et des perspectives plus difficiles. L'impression AI des cheveux de v3 est plus faible que celle de v2, car le set d'entraînement de v2 est trop petit, causant un surapprentissage partiel, et le double nombril occasionnel de v2 a disparu. Globalement, la taille du set d'entraînement triplée par rapport à v2 et un paramètre dim plus grand rendent le style plus naturel, avec une meilleure expressivité sous des prompts longs.

v3.5

Dans cette version, les exigences sur les mots de qualité sont moins strictes : vous pouvez ne pas utiliser les mots de qualité liés à l'esthétique pony. Parfois, des blocs de couleur sans sens apparaissent en test, il suffit de remplacer les mots de qualité par ceux courants en 1.5, par exemple score_1, score_2 par worst quality. J'ai ajouté environ 150 images au set d'entraînement pour équilibrer et enrichir le style, réduit la pente initiale de la courbe d'apprentissage, rendant ce modèle moins surappris, compatible avec plus de lora et prompts créatifs. Ce modèle est plus libre que v3, et décrit mieux les hommes, avec une palette moins saturée et grasse sous certains prompts.

In this version, the requirements for quality words are not so strict; you can completely not use pony's aesthetic score quality words. Occasionally there might be meaningless color blocks generated, just replace the aesthetic quality words with common 1.5 quality words like worst quality for score_1, score_2. I added about 150 training images to balance and enrich the style, reduced the initial slope of the learning curve, leading to less overfitting. This version is freer than v3, and much stronger in male portrayal, with colors and style less vivid and oily under some prompts.

v4

Cette version utilise 798 images comme matériau d'entraînement, entraînée 90h sur 3090. Par rapport à v3.5, la composition et la représentation de certaines parties sont plus précises, par ex. les images fantômes sur les doigts et chevauchements corporels. Je privilégie des prompts moyennement longs ou courts, car personne n'aime écrire une longue chaîne pour de bonnes images. En supprimant les prompts de qualité de l'évaluation esthétique pony, la qualité s'améliore, style plus plat que 3D, plus proche de l'anime classique. Test proche de la fin pour l'effet du nombre d'images d'entraînement de ponyv6. La prochaine étape sera d'ajouter plus de prompts contrôlables (par ex. score esthétique, car maintenant la logique remplace ceux-ci par des mots courants), et de continuer à ajouter de nouveaux matériaux d'entraînement, comme décors et plus de focus pieds (v4 a peu de matériaux pieds).

This version used 798 images for training and was trained for 90 hours on a 3090 GPU. Compared to v3.5, composition and depiction of certain parts improved, e.g. finger ghosting and overlapping body parts. I mainly train with medium or short prompts because no one likes very long prompts to get good images. Removing pony's aesthetic score quality prompts improved quality, favoring flat rather than 3D style, closer to classic anime. Testing fine-tuning effect of ponyv6 image count is nearly done. Next steps: add more controllable prompts (e.g. aesthetic scores, currently replaced by mainstream quality words), continue to add appropriate new training material, like scene material and more foot training material (v4's foot data seems somewhat scarce).

v4.1

Je présente mes excuses aux utilisateurs pour la sortie rapide d'une nouvelle version, ce qui met à rude épreuve la mémoire et la vitesse réseau des ordinateurs. O_O

Firstly, I would like to apologize to all users for the release of a new version in such a short period of time, which greatly tests the computer's memory and network speed. O_O

Cette version est une correction des membres basée sur v4. Comme il était difficile de contrôler les membres sur v4, avec un taux de perfection des mains insatisfaisant, mon ami 木猫猫猫 et moi avons fait des ajustements, atteignant mon objectif pour v4.1. Je fournirai plusieurs graphiques xy montrant clairement les améliorations de v4.1 par rapport à v4 avec les mêmes paramètres.

This new version is based on the limb debugging of v4. Due to difficulty controlling limb effects in v4, hand perfection rate fell short of expectations. So my friend 木猫猫猫 and I made improvements, and v4.1 met my expectations. I will provide several xy graphs to clearly show v4.1's improvement over v4 under same settings.

v5

Le dataset a été réduit. Après l'échec de v4, j'ai lancé un autre projet pour tester une idée à faible occupation mémoire : entraîner 4 styles d'art différents adaptés à T-ponynai3. Le modèle original a été uploadé sur civitai. Après tests, j'ai ajouté les 4 styles comme additifs à T-ponynai3-v5. Étonnamment, la texture des traits s'est grandement améliorée, probablement par entraînement sur matériau délicat. J'ai marqué les styles avec style_1 à style_4, malheureusement ils ne se séparent pas ou faiblement, s'intègrent bien au style d'origine. Pas de support multiple styles, mais amélioration notable du style nai3 de base, peut-être à approfondir dans la prochaine version. (J'aime jouer aux jeux, c'est dur de ne pas jouer pendant l'entraînement.)

The training materials were reduced for this version. Due to v4's failure, I initiated another project to test an idea with low VRAM usage: I trained four different art style loras adapted to T-ponynai3. The original model was also uploaded on civitai. After testing adaptability, I started training these four styles as additives into T-ponynai3-v5. Surprisingly, line quality improved significantly, probably due to delicate training material. For tagging, I used style_1 to style_4 prompts, but unfortunately, these four styles did not separate distinctly or effects were subtle, rather integrating into the original style. Though multiple styles support was not achieved, the original nai3 style texture was elevated noticeably. Perhaps next version can go further. (I really like gaming; not playing games while training is tough for me.)

Résumé de certains problèmes de la version v5.

1, Compatibilité lora, problèmes de membres et flou des yeux. La compatibilité lora est due à un poids final trop élevé, provoquant parfois sur-apprentissage. Cette version optimisée baisse ce poids, améliorant stabilité et compatibilité. Problème d'yeux flous dû à style_1 lié à flou dans les matériaux originaux, améliorable via style_3 ou 4.

2, Problèmes d'exposition de lumière volumétrique. Je n'ai pas rencontré ce problème, mais il vient de l'usage du paramètre noise offset augmentant la sensibilité du modèle aux mots-clés de lumière, conduisant à des résultats trop lumineux avec poids identiques. Je recommande de ne pas utiliser de parenthèses ou chiffres pour le poids, et de répéter plusieurs fois les mêmes mots pour éviter les extrêmes, vu la sensibilité de sdxl. Ce paramètre aide à corriger des résultats jaunâtres sous faible nombre de mots-clés. J'ai fourni des comparaisons.

3, Réduction de la complexité du modèle. V5 est théoriquement et expérimentalement plus propre et diversifié. Avec certains prompts, il offre meilleure précision. J'ai comparé plusieurs images à cet égard. Le set d'entraînement n'inclut pas d'images trop complexes pour éviter surapprentissage et perte de détails.

Objectif : Obtenir un modèle suffisant différent des versions précédentes, pas une quasi-copie. Vos retours sont précieux pour essais, car seul ce serait coûteux. Prochaine version essaiera d'augmenter les quantités de matériaux pour différents styles, pour une meilleure fusion, dissociation, et commutation de styles avec prompts dédiés, peut-être avec de nouvelles techniques d'entraînement. Merci pour votre soutien !

Résumé des problématiques de la version v5 :

1, compatibilité lora, état des membres et yeux flous. La compatibilité lora souffre d'un poids final trop élevé causant du surapprentissage. Cette version optimise en baissant ce poids, améliorant les défauts. Flou des yeux lié à style_1 car matériaux originaux flous, améliorable par style_3 ou 4.

2, problème d'exposition lumineuse volumétrique. Non rencontré en test, causé probablement par paramètre noise offset augmentant la sensibilité à la lumière, rendant les résultats plus lumineux avec poids constants. Je conseille de ne pas utiliser parenthèses et chiffres pour le poids et de répéter mots-clés pour éviter extrêmes, vu sensibilité de sdxl. Ce paramètre corrige problème de jaunissement avec peu de mots-clés. J'ai fourni comparaisons.

3, complexité du modèle réduite. Théoriquement et en pratique, v5 est plus propre et diversifié, performe avec plus de précision à certains prompts, avec comparaisons réalisées. Pas de matériaux trop complexes utilisés pour éviter surapprentissage, perte de détails.

But : Obtenir un modèle significativement différent, pas quasi-identique aux précédents. Vos retours sont précieux pour essais et erreurs. Prochaine version augmentera matériel pour divers styles, pour meilleure fusion et séparation, avec commutation de styles par prompts dédiés, nécessitant peut-être nouvelles techniques. Merci pour vos retours !

Contributeur

Camille Dubois

Bonjour ! Je m’appelle Camille Dubois. Passionnée d’art visuel, j’orchestre des galeries numériques pour révéler toute la poésie des images générées par l’IA.

Pony Realism - v21 Lightning 4S VAE

Tponynai3 - v51weight optimisé

Utiliser ce modèle