Tponynai3 - v5
Mots-clés et tags associés
Prompts recommandés
score_9,score_8_up,score_7_up
score_8_up,score_7_up,1girl,solo
Prompts négatifs recommandés
score_4,score_3,score_2,worst quality, bad hands, bad feet
score_4,score_3,score_2,score_1,ugly,bad feet
Paramètres recommandés
samplers
steps
cfg
clip skip
resolution
other models
Paramètres haute résolution recommandés
upscaler
upscale
steps
denoising strength
Conseils
Utilisez la haute fixation à une résolution modérée pour de meilleurs résultats.
Essayez style_3 ou 4 pour améliorer les détails des yeux.
Points forts de la version
Cette version a un matériel d'entraînement réduit. Suite à l'échec de v4, j'ai lancé un nouveau projet pour tester une idée à faible consommation de mémoire, entraînant quatre styles Lora différents adaptés à T-ponynai3. Le modèle original a aussi été uploadé sur civitai. Après tests d'adaptation, ces quatre styles ont été ajoutés comme additifs dans T-ponynai3-v5. Étonnamment, la texture des traits s'est beaucoup améliorée, sûrement grâce à un matériel très fin. Pour marquer ces styles, j'ai utilisé les prompts style_1 à style_4. Malheureusement, ces styles ne sont pas séparés ou leur effet est faible, mais ils s’intègrent très bien au style original. Bien que le but de supporter plusieurs styles n’ait pas été atteint, cela a très bien amélioré la texture du style original nai3 d’un niveau. Peut-être la prochaine version pourra aller encore plus loin. (J'aime beaucoup jouer, c’est dur de ne pas jouer pendant l'entraînement.)
Le matériel d'entraînement de cette version a été réduit en raison de l’échec de v4. J’ai lancé un autre projet pour tester une idée à faible consommation mémoire en entraînant quatre styles Lora différents adaptés à T-ponynai3. Le modèle original a été aussi uploadé sur civitai. Après test de l’adaptation, j’ai commencé à entraîner ces quatre styles comme additifs dans T-ponynai3-v5. Étonnamment, la qualité des traits de v5 a monté d’un niveau, certainement grâce à un matériel très fin. Pour marquer ces styles, j’ai utilisé les prompts de style_1 à style_4. Malheureusement, ces styles n’ont pas été séparés ou ont eu un effet faible, mais se sont bien intégrés dans le style original. Bien que le but de supporter plusieurs styles n’ait pas été atteint, cela a nettement amélioré la texture du style original nai3. Peut-être que la prochaine version ira plus loin. (J’adore jouer, et c’est trop dur de ne pas jouer pendant l’entraînement.)
Sponsors du créateur
[Non certifié] Tonade est en train de créer le modèle T-ponynai3, id c sur le site : Tonade, | Aide financière (afdian.net)
Voici le canal de parrainage sur Aide financière, si vous trouvez le modèle utile et que vous en avez les moyens, vous pouvez soutenir ! Ne vous forcez pas, merci pour chaque soutien, nous continuerons d'explorer comment améliorer le modèle !
929721518 est le numéro du petit groupe qq personnel, en cas de questions concernant tpony, vous pouvez y entrer pour demander. Pensez à mentionner le site c.
Le modèle intègre déjà un vae, il n'est pas nécessaire d'ajouter un vae supplémentaire
Le modèle inclut déjà un vae, il n'est pas nécessaire d'en ajouter un autre
La meilleure stratégie de sortie d'image est une résolution modérée avec une haute fixation, plutôt que d'utiliser directement une résolution élevée
La meilleure stratégie est d'utiliser une haute fixation à une résolution modérée, plutôt que de sortir directement en haute résolution
[Non certifié] Tonade est en train de créer le modèle T-ponynai3, id c sur le site : Tonade, | Aide financière (afdian.net)
Voici le canal de parrainage sur Aide financière, si vous trouvez le modèle utile et que vous en avez les moyens, vous pouvez soutenir ! Ne vous forcez pas, merci pour chaque soutien, nous continuerons d'explorer comment améliorer le modèle !
(33) T-ponynai3-v5 - (version de poids modifiée) | Checkpoint Stable Diffusion | Tousti tusi.cn (tusiart.com) tusiart(version chinoise tensor) lien de génération en ligne
(Parce que le modèle ne peut exister que simultanément sur Tusi et Tensor, il est préférable de l’utiliser sur Tusi. Si vous rencontrez des problèmes, merci de me le faire savoir plus en détail)
La version v5 a ajouté 4 nouveaux styles, qui peuvent être utilisés pour affiner les détails de l’image via style_1 à style_4 (théoriquement, mais l’effet réel est plus mystique ou incertain)
La version V5 a ajouté 4 styles, pour affiner les détails via style_1 à style_4 (théoriquement, c’est le cas, mais l’effet réel est plus mystérieux ou moindre)
Ce modèle supporte parfaitement les loras entraînés avec ponyv6 comme base, les loras de ani3 et sdxl1.0 peuvent aussi être adaptés dans une certaine mesure.
Ce modèle supporte parfaitement les loras entraînés avec ponyv6 comme base, et les loras de ani3 et sdxl1.0 peuvent également être adaptés en partie.
Test inpaint basé sur v4.1 (cette partie avait été négligée dans les versions précédentes)
Test de retouche d'image basé sur v4.1 (cette partie avait été auparavant négligée)
Pony est un dieu, avec une compatibilité parfaite. Ce modèle supporte les loras ani et pony
Mots-clés positifs indispensables, similaires à ponydiffusion
positif :(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)
OU (score_9,score_8_up,score_7_up)
Peut aussi ajouter des mots négatifs :
négatif : (score_4,score_3,score_2,score_1),
Vous pouvez aussi ajouter les habituels mots négatifs du type nai, par exemple :
négatif: worst quality, bad hands, bad feet
J’espère que cela vous plaira ᕕ(◠ڼ◠)ᕗ basé sur nai3 et ponyv6
Instructions de formation : v1 a utilisé 94 images, v2 en a utilisé 119, v3 a utilisé 348, v3.5 a utilisé 474 images générées par nai3, les loras entraînées ont été fusionnées dans le modèle de base pour un ajustement fin, tous les tags d'artistes supportés par ponyv6 sont supportés, mais l'utilisation de plus de deux tags d'artistes peut entraîner des crashs du fond. À présent, on a découvert qu'il peut générer des personnages de Genshin Impact, les autres sont inconnus. Je n’ai pas beaucoup testé ce modèle, je suis impressionné par sa reproduction du style nai3. Le modèle de base est une fusion de T-anime-xl, ponyv6 et ani3 non publié.
La carte graphique utilisée pour l'entraînement est ma propre 3090, avec des durées de 7 heures, 12 heures, 35 heures et 47 heures pour les versions v1 à v3.5 respectivement.
Instructions de formation : Fusion des loras utilisant 94 images pour v1, 119 pour v2, 348 pour v3, 474 pour v3.5, générées par NAI3 pour entraîner le modèle de base en affinage. Pony supporte tous les tags d'artistes de ponyv6, mais aucun tag additionnel de nai3. L'utilisation de plus de deux tags peut provoquer des crashs du fond. On a trouvé que le modèle peut générer des personnages de Genshin Impact. Je ne connais pas les autres. Peu de tests pour ce modèle. Admirable reproduction du style nai3. Le modèle de base est une fusion de T-anime-xl, ponyv6 et ani3 non publié.
La carte graphique utilisée pour l'entraînement était une 3090 personnelle, avec 7, 12, 35 et 47 heures pour v1 à v3.5, respectivement.
v1
Une tentative intéressante
Une tentative intéressante
v2
Basé sur v1, le set d'entraînement a légèrement augmenté et environ 30 heures de tests de paramètres ont été effectuées, mais le style reste un peu surentrainé, par exemple double nombril et cheveux désordonnés
Sur la base de v1, l'ensemble d'entraînement a légèrement augmenté et environ 30 heures d'essais-erreurs ont été effectuées, mais le style a encore un certain surapprentissage, comme le double nombril et les cheveux désordonnés
v3
Les membres de v3 sont meilleurs que v2. Concernant footfocus, v3 peut générer des pieds avec un impact visuel plus fort et une perspective plus complexe. Le rendu AI des cheveux v3 est moins prononcé que v2, car le jeu d'entraînement v2 est trop petit, ce qui cause un léger surapprentissage. Le problème occasionnel des doubles nombrils disparaît. En général, la taille du set d'entraînement de v3 est triple par rapport à v2, avec un paramètre dim plus grand, rendant le style plus naturel et la performance sous longs prompts bien meilleure.
Les membres de v3 sont meilleurs que ceux de v2. Pour footfocus, v3 génère des pieds à impact visuel plus fort et des angles de perspective plus difficiles. L'effet IA des cheveux de v3 est plus faible que v2, car v2 a un set d'entraînement trop petit, ce qui entraîne un léger surapprentissage sur les cheveux, et le double nombril occasionnel de v2 a disparu. Globalement, le triplement de la taille du dataset et un plus grand paramètre dim améliorent la naturalité du style, et la performance pour longs prompts dépasse v2.
v3.5
Dans cette version, les exigences concernant les mots de qualité sont moins strictes, vous pouvez ne pas utiliser les mots de qualité du score esthétique de pony. Lors des tests, il arrive que des blocs de couleur inutiles apparaissent ; il suffit alors de remplacer les mots de qualité du score esthétique par des mots plus courants comme score_1, score_2 en worst quality. Dans cette version, j’ai ajouté environ 150 images supplémentaires pour équilibrer et enrichir le style, et réduit la pente initiale de la courbe d’apprentissage, ce qui diminue le surapprentissage. Cela permet au modèle d’être compatible avec plus de loras et de prompts créatifs. En somme, cette version est plus libre que la v3, et est bien meilleure pour la représentation masculine. Sous certains prompts, les couleurs et le style sont moins vifs et moins gras.
In this version, the requirements for quality words are not so strict, you can completely not to use the quality words of pony's aesthetic score to plot the picture, and occasionally there will be a situation where the picture generates meaningless color blocks in the test, you only need to replace the quality words of the aesthetic score with 1.5 commonly used quality words, such as score_1, score_2 replace it with worst quality. J’ai ajouté environ 150 images pour ajuster le style et réduit la pente initiale de la courbe d’apprentissage pour éviter le surentraînement. Ce modèle s’adapte à plus de loras et prompts créatifs. En résumé, il est plus libre que v3 et meilleur pour les hommes. Les couleurs et le style sont moins saturés et gras sous certains prompts.
v4
Cette version utilise 798 images de formation et a été entraînée 90 heures sur une 3090. Par rapport à v3.5, elle corrige mieux la composition et certains détails comme les effets de doigts fantômes ou chevauchements de parties du corps. Les prompts ciblés sont des prompts de longueur moyenne à courte afin d'éviter d'écrire de longs prompts pour une bonne qualité d'image. Après avoir retiré les prompts liés au score esthétique de pony, la qualité d'image s'améliore, avec un rendu plus plat proche du style animé classique. Les tests sur l'effet du nombre d'images pour le fine tuning de ponyv6 sont presque terminés. La prochaine étape est d'augmenter la variété des prompts contrôlables dans les limitées images d'entraînement de pony en ajoutant par exemple le score esthétique. De nouveaux matériels d'entraînement adaptés comme des scènes et des pieds seront ajoutés (le matériel pied v4 semble un peu limité).
Cette version a utilisé 798 images pour l'entraînement en 90 heures sur une carte 3090. Comparée à v3.5, elle améliore la composition et la représentation de certains détails sous certains prompts, comme les images fantômes sur les doigts ou les chevauchements corporels. J'ai ciblé les prompts de longueur moyenne à courte, car personne n'aime écrire une longue liste pour générer une bonne image. En supprimant les prompts liés au score esthétique de pony, la qualité d'image s'améliore et le rendu est plus plat, plus proche du style anime classique. Le test de l'effet du nombre d'images pour le fine-tuning de ponyv6 est quasi terminé. La prochaine étape sera de travailler sur les labels de prompts pour ajouter plus de prompts contrôlables dans la limite des images d'entraînement (comme intégrer le score esthétique). Je continuerai à ajouter du matériel adapté, comme des scènes et plus de pieds (le matériel pied v4 semble un peu faible).
v4.1
Je m'excuse auprès de tous les utilisateurs pour cette nouvelle version sortie si rapidement, cela teste beaucoup la mémoire de l'ordinateur et la vitesse du réseau. O_O
Tout d'abord, je tiens à m'excuser auprès des utilisateurs pour la sortie rapide de cette version, ce qui met à l'épreuve la mémoire et la connexion internet. O_O
Cette nouvelle version est une version de débogage des membres basée sur v4. Les membres de v4 étaient difficiles à contrôler, et le taux de perfection des mains lors des tests n’a pas atteint mes attentes ces derniers jours. Avec mon ami 木猫猫猫, nous avons ajusté et amélioré v4, permettant à v4.1 de répondre à mes attentes. Je publierai plusieurs graphiques xy pour montrer clairement l'amélioration de v4.1 par rapport à v4 sous les mêmes paramètres.
Cette nouvelle version débogue les membres de v4, car ils étaient difficiles à contrôler et le taux de réussite des mains n’atteignait pas mes attentes. Avec mon ami 木猫猫猫, nous avons fait des ajustements et améliorations, et le résultat a atteint mes attentes. Je proposerai des graphiques xy illustrant clairement les améliorations de v4.1 par rapport à v4 avec les mêmes paramètres.
v5
Cette version a un matériau d'entraînement réduit. Suite à l'échec de v4, j'ai lancé un nouveau projet pour tester une idée à faible usage de mémoire, en entraînant quatre styles Lora différents adaptés à T-ponynai3. Le modèle original a été également uploadé sur civitai. Après tests, j'ai intégré ces quatre styles en tant qu'additifs dans T-ponynai3-v5. Étonnamment, la texture des traits de v5 s'est grandement améliorée, probablement grâce à un matériel très fin. Pour marquer ces styles, j'ai utilisé les prompts de style_1 à style_4. Malheureusement, ces styles ne sont pas distincts ou leur effet est faible, ils s'intègrent bien dans le style original. Bien que l'objectif de supporter plusieurs styles ne soit pas atteint, cela a très bien amélioré la texture du style original nai3 d’un degré. Peut-être que la prochaine version ira plus loin. (J'aime beaucoup jouer, c'est dur de ne pas pouvoir jouer en entraînant.)
Le matériel d'entraînement de cette version a été réduit. Après l'échec de v4, un nouveau projet a testé l'idée d'utilisation mémoire faible, en entraînant quatre styles Lora différents adaptés à T-ponynai3. Le modèle original a été aussi uploadé sur civitai. Après tests d'adaptation, ces quatre styles ont été ajoutés en additifs à T-ponynai3-v5. Étonnamment, la qualité des traits de v5 a nettement progressé, sûrement grâce à l'entraînement sur un matériel très fin. Pour marquer ces styles, j'ai utilisé style_1 à style_4. Malheureusement, ces styles ne sont pas séparés ou ont un effet faible, ils s'intègrent très bien dans le style original. Bien que l'objectif multi-style ne soit pas atteint, le rendu nai3 s'est nettement amélioré. La prochaine version pourrait aller plus loin. (J'adore jouer, et c'est trop dur de ne pas jouer en entraînant.)
Quelques résumés sur les problèmes de la version v5.
1. Compatibilité Lora, membres et yeux flous. La compatibilité Lora pose problème car le poids final utilisé a été un peu trop élevé, causant parfois du surapprentissage. Cette version optimisée réduit ce poids, améliorant la stabilité des membres et la compatibilité Lora. J’ai comparé avec quelques loras entraînées sur v4.1. Le flou des yeux est dû à l'entraînement de style_1, avec des yeux flous en matériel original ; l'utilisation de style_3 ou 4 améliore cela.
2. Exposition de la lumière volumétrique. Je n'ai pas rencontré ce problème en test, il est dû au paramètre noise offset qui accroît la sensibilité aux mots prompts liés à la lumière, rendant les résultats plus lumineux avec des poids identiques. Je conseille de ne pas utiliser les parenthèses ou chiffres pour augmenter le poids. Avec sdxl sensible aux prompts, essayez de répéter plusieurs fois le même prompt pour éviter les extrêmes. Ce paramètre vise aussi à corriger le jaunissement sous peu de prompts. J’ai produit des comparaisons pour référence.
3. Complexité réduite du modèle. Théoriquement et en pratique, v5 est un modèle plus propre et diversifié que les versions précédentes, avec une meilleure précision dans certaines situations grâce à certains prompts. J’ai comparé plusieurs graphiques. Le dataset n’inclut pas de matériaux trop complexes pour éviter le surapprentissage qui élimine certains détails.
Objectif : obtenir un modèle suffisamment différencié des versions précédentes, et non quasi-identique. Vos retours sont précieux pour l’ajustement, je n’ai pas de coûts d’essais seul. Dans la prochaine version, j’augmenterai la quantité de matériaux de styles différents pour mieux intégrer et séparer les styles avec des prompts spécifiques, ce qui peut demander de nouvelles techniques d’entraînement. Merci pour vos retours !
Résumé des problèmes de la version v5.
1. Compatibilité Lora, membres et yeux flous. J’ai utilisé un poids final trop élevé, causant parfois un surapprentissage. Cette optimisation réduit ce poids, améliorant la stabilité des membres et la compatibilité avec certaines loras. Comparaisons avec des loras de v4.1 sont fournies. Le flou des yeux vient du style_1, le matériel original ayant des yeux flous ; styles_3 ou 4 corrigent cela.
2. Problèmes d’exposition de lumière volumétrique. Je n’ai pas vu ce problème en test, c’est probablement dû au paramètre noise offset augmentant la sensibilité aux prompts lumineux, rendant les images plus lumineuses pour des poids semblables. Je suggère de ne pas utiliser de parenthèses ou chiffres pour augmenter le poids mais de répéter plusieurs fois les mêmes prompts à cause de la sensibilité de sdxl. Ce paramètre vise aussi à corriger le jaunissement sous peu de prompts. Des graphiques comparatifs sont disponibles.
3. Réduction de la complexité du modèle. V5 est plus propre et diversifié que les anciens, avec des performances plus précises sous certains prompts. Comparaisons à l’appui. Le set d’entraînement évite les matériaux trop complexes pour prévenir le surapprentissage qui fait perdre des détails.
Objectif: créer un modèle notablement différent des précédents, pas un quasi clone. Vos retours sont essentiels pour ajuster, le coût d’essai est faible pour moi seul. Prochainement, j’augmenterai les matériaux de différents styles pour intégrer et séparer les styles via des prompts spécifiques, ce qui nécessite peut-être de nouvelles techniques. Merci pour vos retours !
Détails du modèle
Discussion
Veuillez vous log in pour laisser un commentaire.