modelle/Tponynai3 - v55

Tponynai3 - v55

Anna Müller

5/23/2025

1:21:32 AM

| Discussion

Empfohlene Prompts

score_9,score_8_up,score_7_up

score_9,score_8_up

Empfohlene Negative Prompts

score_4,score_3,score_2,worst quality, bad hands, bad feet

score_3,score_2,ugly,bad feet

Empfohlene Parameter

samplers

Euler a

steps

22 - 30

cfg

clip skip

resolution

848x1072, 840x1112, 952x1192, 936x1192, 872x1184, 848x1216, 824x1160

other models

T-ponynai3(5.5-4)(v3-0.5) (89e7c7518c)

Empfohlene Hires (Hochauflösungs-) Parameter

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.6 - 1.7

steps

denoising strength

0.3

Tipps

Verwende High-Fix bei moderater Auflösung für beste Ergebnisse.

Probiere style_3 oder 4, um die Augen-Details zu verbessern.

Versions-Highlights

Diese Version ist eine Optimierung von 5.1, verbesserte Details bei den Augen, die Plausibilität der Füße, die Sensitivität gegenüber Prompts und die Rationalität der Überlappung der Gliedmaßen. Dennoch erreichte die Behandlung von Helligkeit und Dunkelheit in den Bildern noch nicht voll meine Erwartungen. In meinen Tests macht style_4 das Bild dunkler, vielleicht eine kurzfristige Lösung. Ich habe zusätzliches Training eingesetzt, da das direkte Training nicht so gute Ergebnisse lieferte, was Zeit kostete. Wenn ihr mehr Probleme habt, sagt mir bitte unbedingt in den Kommentaren Bescheid!

This version is an optimization to 5.1, optimizing the details of the eyes, the rationality of the feet, the sensitivity to cues, and the rationality of limb overlap. In my tests, the use of style_4 made the picture darker, perhaps a short-term solution, and I used some additional training, because the direct training did not work so well, so I wasted some time. If you have more questions, please be sure to let me know in the comments section!

Ersteller-Sponsoren

[Unbestätigt] Tonade ist der Autor des T-ponynai3 Modells, Civitai-ID: Tonade, | 爱发电 (afdian.net )

Dies ist der Unterstützungs-Kanal von Aifadian. Wenn du das Modell nützlich findest und die Möglichkeit hast, kannst du es gerne fördern! Bitte zwing dich nicht, danke für jede Unterstützung, ich werde weiterhin erforschen, wie ich das Modell verbessern kann!

929721518本人的qq小群群号，有啥不会的关于tpony的问题可以进来问。记得备注c站哦

Das Modell hat bereits ein eingebautes VAE, es ist kein zusätzliches VAE nötig

The model already has included vae, there is no need to add additional vae

Die beste Ausgabestrategie ist, bei moderater Auflösung den High-Fix-Modus zu verwenden, statt direkt eine hohe Auflösung auszugeben

The best generate strategy is to use high-fix at a moderate resolution, rather than directly using high-resolution direct output

[Unbestätigt] Tonade ist der Autor des T-ponynai3 Modells, Civitai-ID: Tonade, | 爱发电 (afdian.net )

Dies ist der Unterstützungs-Kanal von Aifadian. Wenn du das Modell nützlich findest und die Möglichkeit hast, kannst du es gerne fördern! Bitte zwing dich nicht, danke für jede Unterstützung, ich werde weiterhin erforschen, wie ich das Modell verbessern kann!

(33) T-ponynai3-v5 - (gewichtete modifizierte Version) | Stable Diffusion Checkpoint | 吐司 tusi.cn (tusiart.com) tusiart (chinesische Tensor-Version) Online-Generierungslink

(Da das Modell nur gleichzeitig auf Tusi und Tensor existieren kann, ist es besser, es auf Tusi zu verwenden. Falls es Probleme bei der Nutzung gibt, bitte mehr Rückmeldungen an mich)

V5-Version hat 4 neue Styles hinzugefügt, mit denen über style_1 bis style_4 die Bilddetails feinjustiert werden können (theoretisch, die tatsächliche Wirkung ist etwas mystisch)

V5 version has added 4 new styles, which can be used to fine tune the details of the image through style_1 to style_4 (theoretically, this is the case, but the actual effect is more mystical or lower)

Dieses Modell unterstützt perfekt Lora, trainiert mit ponyv6 als Basismodell; die Lora von ani3 und sdxl1.0 können ebenfalls teilweise angepasst werden

This model perfectly supports lora trained with ponyv6 as the base model, and the Lora of ani3 and sdxl1.0 can also be adapted to some extent.

Bild-basierte Bildinpaint-Tests basierend auf v4.1 (dieser Teil wurde in früheren Versionen übersehen)

Image inpaint testing based on v4.1 (this is a previously overlooked part)

Pony ist Gott, volle Kompatibilität. Dieses Modell unterstützt Lora von ani und pony

Unverzichtbare positive Effekte und Schlüsselwörter wie bei ponydiffusion

positive:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)

ODER (score_9,score_8_up,score_7_up)

Negativ kann hinzugefügt werden:

negative: (score_4,score_3,score_2,score_1),

Es können auch normale NAI-typische negative Schlüsselwörter verwendet werden, zum Beispiel:

negative: worst quality, bad hands, bad feet

Ich hoffe, es gefällt euch ᕕ(◠ڼ◠)ᕗ Basierend auf nai3 und ponyv6

Trainingshinweise: v1 nutzte 94 Bilder, v2 verwendete 119, v3 348, v3.5 474 Bilder, die von nai3 generiert wurden. Das trainierte Lora wurde ins Basismodell für Feinjustierung integriert, alle von ponyv6 unterstützten Künstler-Tags werden unterstützt, die Nutzung von mehr als zwei Künstler-Tags kann Hintergrundfehler verursachen. Aktuell lassen sich Charaktere aus Genshin Impact generieren, andere sind unbekannt. Das Modell habe ich nicht ausgiebig getestet, ich bin beeindruckt von der Reproduktion des nai3-Zeichenstils. Das Basismodell ist eine Fusion aus T-anime-xl, ponyv6 und ani3, es wurde noch nicht veröffentlicht.

Zum Training verwendete Grafikkarte war meine eigene 3090; die Trainingszeiten waren 7, 12, 35 und 47 Stunden für v1 bis v3.5.

Training Instructions: Merge Lora verwendete 94 Bilder für v1, 119 für v2, 348 für v3, 474 für v3.5, generiert von NAI3, zum Feintuning in das Basismodell trainiert. Pony unterstützt alle Künstler-Tags, die ponyv6 hat, aber keine zusätzlichen von nai3. Die Nutzung von mehr als zwei Künstler-Tags kann Hintergrundfehler verursachen. Es wurde festgestellt, dass Charaktere aus Genshin Impact generiert werden können. Ich kenne die anderen nicht und habe dieses Modell nicht viel getestet. Bewundere die Nachbildung des nai3-Malstils. Das Basismodell ist eine Fusion von T-anime-xl, ponyv6 und animage3, das noch nicht veröffentlicht ist.

Die verwendete Trainings-Grafikkarte war meine eigene 3090, mit 7, 12, 35 und 47 Stunden Training für v1 bis v3.5.

v1

Ein interessanter Versuch

An interesting attempt

v2

Auf Basis von v1 wurde der Trainingsdatensatz leicht erweitert und etwa 30 Stunden Trial-and-Error beim Parametertuning durchgeführt. Der gezeichnete Stil zeigt aber noch etwas Überanpassung, z.B. doppelte Bauchnabel und unordentliche Haare.

On the basis of v1, the training set was slightly increased and went through about 30 hours of trial and error, but the trained art style still had some overfitting, such as double navel eyes and messy hair

v3

Die Gliedmaßen von v3 sind besser als die von v2. Im Hinblick auf Fußfokus kann v3 visuell eindrucksvollere und perspektivisch anspruchsvollere Füße generieren. Das KI-Gefühl im Haar von v3 ist schwächer als bei v2, da v2 einen zu kleinen Trainingssatz hatte und deshalb die Haare überangepasst wirken. Die gelegentlich bei v2 auftretenden doppelten Bauchnabel sind ebenfalls verschwunden. Insgesamt sorgt die dreifache Größe des Trainingsdatensatzes und ein größerer dim-Parameter für einen natürlicheren Stil und deutlich bessere Leistung bei längeren Prompts als v2.

The limbs of v3 are better than those of v2. In terms of understanding footfocus, v3 can generate feet with greater visual impact and higher difficulty perspective. The AI feeling of v3's hair is also weaker than that of v2, because v2 has too little training set, so the hair part may be slightly overfitting, and the occasional double navel eyes that appear in v2 are also gone. Overall, three times the size of the v2 training set and a larger dim parameter make the art style fit more natural, and the performance is much stronger than v2 under long prompts.

v3.5

In dieser Version sind die Anforderungen an Qualitätswörter nicht so strikt, man kann komplett auf die Qualitätswörter der Pony-Ästhetikbewertung verzichten. In Tests gab es gelegentlich Bildbereiche mit sinnlosen Farbblöcken, hier reicht es, die Qualitätswörter des ästhetischen Scores durch gängige 1.5er Qualitätswörter zu ersetzen, wie score_1 und score_2 durch worst quality. Ich habe circa 150 Trainingsbilder zugefügt, um den Stil auszugleichen und zu bereichern, und die anfängliche Steigung der Lernkurve gesenkt, was das Modell weniger überangepasst macht und mehr Lora sowie kreative Prompts unterstützt. Insgesamt ist dies eine freiere Version als v3. Außerdem ist die Darstellung männlicher Figuren deutlich besser als bei v3. Unter bestimmten Prompts sind Farben und Stil weniger grell und ölig.

In this version, the requirements for quality words are not so strict, you can completely not to use the quality words of pony's aesthetic score to plot the picture, and occasionally there will be a situation where the picture generates meaningless color blocks in the test, you only need to replace the quality words of the aesthetic score with 1.5 commonly used quality words, such as score_1, score_2 replace it with worst quality. In this version, I added about 150 more training sets to balance and enrich the art style, and reduced the initial slope of the learning curve, which makes this model less overfitted and can be adapted to more lora and whimsical prompts. Overall, this version is a freer version than the v3 version, and this version is much stronger than the v3 version, and the colors and style of painting under some hints are not so bright and greasy.

v4

Diese Version nutzte 798 Bilder als Trainingsmaterial und wurde mit einer 3090 Grafikkarte 90 Stunden trainiert. Gegenüber v3.5 ist die Komposition bei manchen Prompts und die Darstellung bestimmter Körperteile genauer, z.B. Geisterbilder an Fingern und Überlappungen von Körperteilen. Bei den Prompts fokussierte ich mich auf mittellange bis kürzere Länge, denn niemand möchte eine lange Liste schreiben, um gute Bilder zu erzeugen, oder? Nach Entfernung des Qualitäts-Prompts der Pony-Ästhetik stieg die Bildqualität gegenüber v3.5 stark, mit eher flacheren als dreidimensionalen Bildern, näher am klassischen Anime-Stil. Das Testen der Feinabstimmung von Ponyv6 bezüglich der Bildanzahl neigt sich dem Ende zu. Der nächste Schritt ist, bei den Trainingslabels der Prompts anzusetzen, um mehr steuerbare Prompts in den begrenzten Trainingsdaten von Pony einzubauen (z.B. Ästhetikwerte, da die aktuelle Logik mainstream-Qualitätswörter zum Überschreiben der Pony-Ästhetikwerte nutzt). Zudem wird weiteres passendes Trainingsmaterial ergänzt, z.B. Szenen- und mehr Fuß-Trainingsmaterial (v4 hat anscheinend zu wenig Fußmaterial).

This version used 798 images as training materials and trained for 90 hours using a 3090 graphics card. This version has a more accurate composition and depiction of certain parts in certain prompts compared to v3.5, such as ghosting of fingers and overlapping of some body parts. In terms of prompts, my main training goal is to use medium and slightly shorter prompts, as nobody likes to write a long string of prompts to generate high-quality images, right? After removing the quality prompt of Pony's aesthetic score, the image quality has been significantly improved compared to v3.5, and the resulting quality tends to be more flat rather than three-dimensional, closer to the classic anime style. The testing of the fine-tuning effect of Ponyv6 on the number of images is nearing completion. The next step is to start with the training labels of prompts and try to add more adjustable prompts to Pony's limited number of single training materials (such as adding aesthetic scores, the current training logic still uses mainstream quality words to cover Pony's aesthetic score quality words), and continue to add suitable new training materials, such as scene training materials and more foot training materials (v4's foot training materials seem to be a bit scarce).

v4.1

Entschuldigung an alle Nutzer für die Veröffentlichung einer neuen Version in so kurzer Zeit, das stellt eine große Belastung für Computer-RAM und Netzwerkgeschwindigkeit dar. O_O

Firstly, I would like to apologize to all users for the release of a new version in such a short period of time, which greatly tests the computer's memory and network speed. O_O

Diese neue Version ist eine Limb-Debugging-Version von v4. Da die Gliedmaßeffekte von v4 schwer zu kontrollieren sind und die Perfektion der Hände in den letzten Tests nicht meinen Erwartungen entsprach, haben mein Freund 木猫猫猫 und ich v4 angepasst und verbessert, sodass die Gliedmaßen von v4.1 meine Erwartungen erfüllen. Ich werde mehrere XY-Diagramme veröffentlichen, die zeigen, wie v4.1 sich unter identischen Parametern gegenüber v4 verbessert hat.

This new version is based on the limb debugging version of v4. Due to the difficulty in controlling the limb effects of v4, the perfection rate of the hands did not meet my testing expectations in the past few days. So my friend 木猫猫猫 and I made some adjustments and improvements to v4, which ultimately made the limbs of v4.1 meet my expectations. I will release several xy graphs to clearly show the improvement of v4.1 compared to v4 under the same parameters.

v5

Für diese Version wurde das Trainingsmaterial reduziert. Aufgrund des Misserfolgs von v4 startete ich ein weiteres Projekt, um eine Idee bezüglich geringem VRAM-Verbrauch zu testen: Ich trainierte vier unterschiedliche Kunststil-Loras, die an T-ponynai3 angepasst sind. Das Originalmodell wurde ebenfalls auf Civitai hochgeladen. Nach dem Test der Kompatibilität begann ich, diese vier Kunststile als Additive in T-ponynai3-v5 einzufügen. Überraschenderweise verbesserte sich die Linienstruktur von v5 erheblich, vermutlich wegen des Trainings eines sehr feinen Materials. Für die Kennzeichnung der vier Stile verwendete ich style_1 bis style_4. Leider wurden diese vier Stile nicht separat dargestellt oder zeigten nur schwachen Effekt, stattdessen verschmolzen sie gut mit dem Originalstil. Obwohl das Ziel, mehrere Stile zu unterstützen, nicht erreicht wurde, wurde die Textur des originalen nai3-Stils deutlich verbessert. Vielleicht kann dies in der nächsten Version weitergeführt werden. (Ich spiele sehr gern Computerspiele, und es ist sehr schwer für mich, beim Training auf sie zu verzichten.)

The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it's too difficult for me to play computer games every time I train.)

Hier eine Zusammenfassung einiger Probleme mit der v5 Version.

1. Lora-Kompatibilität sowie Probleme mit Gliedmaßen und verschwommenen Augen. Die Lora-Kompatibilität leidet, da ich für dieses Training zu hohe finale Gewichte nutzte, was in manchen Fällen zu Überanpassung führt. Diese optimierte Version senkt die entsprechenden Gewichte, was die Stabilität der Gliedmaßen und Kompatibilität mit manchen Loras verbessern sollte. Ich habe Vergleichsbilder genutzt, die mit auf v4.1 basierenden Lora-Styles trainiert wurden, als Referenz. Die unscharfen Augen resultieren vermutlich aus style_1, da das verwendete Originalmaterial unscharfe Augen zeigt. Dies lässt sich mit style_3 oder style_4 verbessern.

2. Überbelichtung durch volumetrisches Licht. Im Test trat dieses Problem nicht auf. Ursache ist vermutlich der verwendete Trainingsparameter noise offset, der die Empfindlichkeit des Modells gegenüber Licht-bezogenen Prompts erhöht, wodurch gleiche Lichtgewichte zu helleren Ergebnissen führen. Ich empfehle, keine Klammern und Zahlen zur Erhöhung des Gewichts zu verwenden. Aufgrund der hohen Sensitivität von sdxl gegenüber Prompts kann auch mehrmalige Wiederholung desselben Prompts helfen, extreme Ergebnisse zu vermeiden. Dieser Parameter wurde eingesetzt, um das Problem vergilbter Ergebnisse bei wenigen Prompts zu beheben; mehrere Vergleichsbilder liegen vor.

3. Verringerte Komplexität des Modells. Theoretisch und praktisch ist v5 ein reineres und vielfältigeres Modell als vorherige Versionen und sollte durch bestimmte Prompts präziser arbeiten können. Ich habe mehrere Vergleichsbilder zur Veranschaulichung erstellt. Das Trainingsset umfasste keine zu komplexen Materialien, da ich Überanpassung und Detailverlust durch zu komplexes Bildmaterial vermeiden wollte.

Ziel: Ich möchte ein Modell mit erheblich unterschiedlichem Charakter gegenüber früheren Versionen erhalten, nicht eins, das fast identisch ist. Euer Feedback ist eine hervorragende Gelegenheit für Trial & Error, da ich alleine kaum Ressourcen für viele Tests habe. Im nächsten Release werde ich versuchen, für unterschiedliche Kunststile mehr Material zu sammeln, um deren Verschmelzung und klare Trennung zu ermöglichen, sodass der Stil über spezifische Prompts gewechselt werden kann. Dafür sind eventuell neue Trainingsmethoden nötig. Vielen Dank für euer Feedback!

Summarize some issues regarding the v5 version.

1, Lora compatibility and issues with limbs and blurred eyes. Lora compatibility is that I used too much final weight for this training, and in some cases, overfitting may occur. This optimized version is the one that reduces the corresponding weight, and the limb collapse rate and compatibility with some Loras should be better. I have run several comparison charts of Loras trained with v4.1 for reference. The problem of blurred eyes should be the reason why I trained style_1. The eyes in the original material used are blurry, and can be improved by using style_3 or 4.

2. Exposure issues with volume light. I did not encounter this issue during testing, and the reason for it should be that I used the noise offset training parameter to increase the sensitivity of the model to light related prompt words, resulting in brighter results when the same weight of light prompt words were used. I suggest trying not to use parentheses and numbers to increase the weight. Due to the sensitivity of sdxl to prompt words, you can try repeating the same prompt words multiple times to avoid extreme results. At the same time, using this parameter is to fix the problem of generating yellow results under a small number of prompt words. I have run several comparison graphs for reference.

3. The problem of reduced model complexity. In theory and in practice. V5 should be a cleaner and more diverse model than the previous version, and with the help of some prompts, it should be able to achieve more accurate performance. Similarly, I ran several comparison charts for comparison. This training set did not use overly complex materials because I believe that overly complex images tend to overfit the results, which inevitably leads to a certain degree of detail loss.

Purpose: I hope to obtain a model that is significantly different from the previous version, rather than releasing a model that is almost identical to the previous version. This feedback from everyone is a great opportunity for trial and error, and I really don't have any trial and error costs on my own. In the next version, I will try to increase the amount of materials for different art styles, so that the art styles of different materials can be well integrated and separated. Using specific prompts to switch art styles may require some new training techniques. Thank you for your feedback!

Mitwirkende

Anna Müller

Hallo! Ich bin Anna Müller und kuratiere seit über zehn Jahren digitale Fotogalerien. Mein geschultes Auge für Farbe und Komposition bringt jede KI-Kreation zum Strahlen.

Zurück

Detail - Overall Detail XL

Weiter

Tponynai3 - v51gewicht optimiert

Dieses Modell verwenden