modelle/Tponynai3 - v51gewicht optimiert

Tponynai3 - v51gewicht optimiert

Anna Müller

5/23/2025

1:21:27 AM

| Discussion

Empfohlene Prompts

score_9,score_8_up,score_7_up

score_8_up,score_7_up,1girl

Empfohlene Negative Prompts

score_4,score_3,score_2,worst quality, bad hands, bad feet

score_3,score_2,ugly

Empfohlene Parameter

samplers

Euler a

steps

cfg

clip skip

resolution

776x1072, 848x1072, 864x1192, 616x936, 696x1272, 712x1064

other models

T-ponynai3-v5.1 (ac17f32d24), T-ponynai3-v4.1 (0b3046dd73), T-ponynai3-v5 (61cc7615e2), tpony-style-v2 (e9eed2af18)

Empfohlene Hires (Hochauflösungs-) Parameter

upscaler

R-ESRGAN 4x+ Anime6B

upscale

1.5 - 2

steps

denoising strength

0.3

Tipps

Verwende High-Fix bei einer moderaten Auflösung für beste Ergebnisse.

Versuche style_3 oder 4, um die Augendetails zu verbessern.

Versions-Highlights

Einige Zusammenfassungen zu Problemen mit Version v5.

1. Lora-Kompatibilität sowie Probleme mit Gliedmaßen und unscharfen Augen. Für das Training habe ich ein zu hohes Endgewicht gewählt, was zu Überanpassung führen kann. Diese optimierte Version reduziert das Gewicht, verringert Gliedmaßenfehler und verbessert Lora-Kompatibilität, unterstützt durch Vergleichsbilder mit auf v4.1 trainierten Lora-Stilen. Die verschwommenen Augen sind vermutlich auf das Training mit style_1 zurückzuführen, dessen Ausgangsmaterial unscharfe Augen enthielt. Verbesserung durch style_3 oder 4 möglich.

2. Belichtungsprobleme bei Volumenlicht. Während Tests trat dies nicht auf, vermutlich durch Nutzung des Noise-Offset-Parameters, der die Sensitivität des Modells auf Lichtbezogene Prompts erhöht. Das Resultat: lichtbezogene Prompts führen zu helleren Bildern. Empfehlung: keine Klammern oder Zahlen zur Gewichtung verwenden, bei SDXL besser mehrfach gleiche Prompts wiederholen, um extreme Ergebnisse zu vermeiden. Dieser Parameter dient auch dazu, Gelbstich bei wenigen Prompts zu vermeiden. Vergleichsbilder sind verfügbar.

3. Abnahme der Modellkomplexität. Theoretisch und praktisch ist v5 ein saubereres und vielfältigeres Modell als vorher. Mit passenden Prompts kann es präzise Leistungen erbringen. Die Trainingsdaten sind nicht zu komplex, um Überanpassungen und Detailverlust zu vermeiden. Vergleichsbilder sind verfügbar.

Ziel: Ein Modell mit ausreichend Unterschieden zu früheren Versionen, nicht bloß eine Kopie. Euer Feedback ist wertvoll zur Fehlerbehebung, alleine wäre eine solche Fehlerkosten zu hoch. In der nächsten Version will ich die Materialmenge verschiedener Stile vergrößern, um bessere Integration und Trennung zu ermöglichen, inkl. Umschaltung per Prompt. Eventuell sind neue Trainingsmethoden nötig. Danke für das Feedback!

Summarize some issues regarding the v5 version.

1, Lora compatibility and issues with limbs and blurred eyes. Lora compatibility is that I used too much final weight for this training, and in some cases, overfitting may occur. This optimized version is the one that reduces the corresponding weight, and the limb collapse rate and compatibility with some Loras should be better. I have run several comparison charts of Loras trained with v4.1 for reference. The problem of blurred eyes should be the reason why I trained style_1. The eyes in the original material used are blurry, and can be improved by using style_3 or 4.

2. Exposure issues with volume light. I did not encounter this issue during testing, and the reason for it should be that I used the noise offset training parameter to increase the sensitivity of the model to light related prompt words, resulting in brighter results when the same weight of light prompt words were used. I suggest trying not to use parentheses and numbers to increase the weight. Due to the sensitivity of sdxl to prompt words, you can try repeating the same prompt words multiple times to avoid extreme results. At the same time, using this parameter is to fix the problem of generating yellow results under a small number of prompt words. I have run several comparison graphs for reference.

3. The problem of reduced model complexity. In theory and in practice. V5 should be a cleaner and more diverse model than the previous version, and with the help of some prompts, it should be able to achieve more accurate performance. Similarly, I ran several comparison charts for comparison. This training set did not use overly complex materials because I believe that overly complex images tend to overfit the results, which inevitably leads to a certain degree of detail loss.

Purpose: I hope to obtain a model that is significantly different from the previous version, rather than releasing a model that is almost identical to the previous version. This feedback from everyone is a great opportunity for trial and error, and I really don't have any trial and error costs on my own. In the next version, I will try to increase the amount of materials for different art styles, so that the art styles of different materials can be well integrated and separated. Using specific prompts to switch art styles may require some new training techniques. Thank you for your feedback!

Ersteller-Sponsoren

[Nicht verifiziert] Tonade ist der Schöpfer des T-ponynai3 Modells, Civitai ID: Tonade, | Afdian (afdian.net )

Dies ist der Support-Kanal auf Afdian, wenn du das Modell gut findest und es dir leisten kannst, unterstütze es bitte! Bitte zwinge dich nicht, vielen Dank für jede Unterstützung, ich werde weiterhin erkunden, wie man das Modell verbessert!

929721518本人的qq小群群号，有啥不会的关于tpony的问题可以进来问。记得备注c站哦

Das Modell hat bereits VAE eingebaut, es ist kein zusätzliches VAE erforderlich

The model already has included vae, there is no need to add additional vae

Die beste Ausgabestrategie ist eine moderate Auflösung mit High-Fix, nicht direkt die Ausgabe in hoher Auflösung

The best generate strategy is to use high-fix at a moderate resolution, rather than directly using high-resolution direct output

[Nicht verifiziert] Tonade ist der Schöpfer des T-ponynai3 Modells, Civitai ID: Tonade, | Afdian (afdian.net )

Dies ist der Support-Kanal auf Afdian, wenn du das Modell gut findest und es dir leisten kannst, unterstütze es bitte! Bitte zwinge dich nicht, vielen Dank für jede Unterstützung, ich werde weiterhin erkunden, wie man das Modell verbessert!

(33) T-ponynai3-v5 - (gewichtete Version) | Stable Diffusion Checkpoint | Tusi tusi.cn (tusiart.com) Tusiart (China-Version Tensor) Online-Generierungslink

(Da das Modell nur gleichzeitig auf Tusi und Tensor existieren kann, ist die Nutzung auf Tusi besser. Wenn es Probleme bei der Nutzung gibt, bitte meldet sie mir)

V5 Version hat 4 neue Styles hinzugefügt, mit denen man über style_1 bis style_4 die Bilddetails feinjustieren kann (theoretisch so, in der Praxis ist der Effekt eher mystisch)

Die V5 Version hat 4 neue Stile hinzugefügt, mit denen man die Details des Bildes durch style_1 bis style_4 fein abstimmen kann (theoretisch so, aber der tatsächliche Effekt ist eher mystisch oder geringer)

Dieses Modell unterstützt perfekt Lora-Modelle, die auf ponyv6 als Basismodell trainiert wurden; ani3 und sdxl1.0 Lora sind auch bis zu einem gewissen Grad kompatibel.

Dieses Modell unterstützt perfekt Lora, die mit ponyv6 als Basismodell trainiert wurden, und die Lora von ani3 und sdxl1.0 sind ebenfalls bis zu einem gewissen Grad adaptierbar.

Bild-inpainting-Test basierend auf v4.1 (dieser Teil wurde in vorherigen Versionen übersehen)

Image inpaint testing based on v4.1 (this is a previously overlooked part)

Pony ist Gott, 100% Kompatibilität. Dieses Modell unterstützt ani- und pony-Lora.

Wesentliche negative und positive Schlüsselwörter sind wie bei ponydiffusion

positive:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)

ODER (score_9,score_8_up,score_7_up)

Negative können hinzugefügt werden:

negative: (score_4,score_3,score_2,score_1),

Man kann auch normale negative Wörter vom nai-System verwenden, z. B.:

negative: worst quality, bad hands, bad feet

Ich hoffe, es gefällt euch ᕕ(◠ڼ◠)ᕗ basierend auf nai3 und ponyv6

Trainingshinweise: V1 – verwendet 94 Bilder, v2 119 Bilder, v3 348 Bilder, v3.5 474 Bilder, die Bilder wurden von nai3 generiert. Lora wurde in das Basismodell zur Feineinstellung integriert. Alle Künstler-Tags, die ponyv6 unterstützt, werden unterstützt, bei mehr als zwei Künstler-Tags kann es zu Hintergrundproblemen kommen. Bisher wurden Figuren aus Genshin Impact generiert, bei anderen kenne ich mich nicht aus und habe nicht viel getestet. Ich bin beeindruckt von der Nachbildung des Malstils von nai3. Das Basismodell ist eine Fusion aus T-anime-xl, ponyv6 und ani3 und bisher nicht veröffentlicht.

Die Trainings-Grafikkarte war meine eigene 3090, die Trainingszeit betrug für v1 bis v3.5 7, 12, 35 und 47 Stunden.

Trainingshinweise: Merge Lora verwendete 94 Bilder für v1, 119 für v2, 348 für v3, 474 für v3.5, generiert von NAI3 zum Training des Basismodells zur Feineinstellung. Pony unterstützt alle Künstler-Tags, die ponyv6 bereits hat, aber es gibt keine zusätzlichen Künstler-Tags von nai3. Die Verwendung von mehr als zwei Künstler-Tags kann Hintergrundprobleme verursachen. Bisher wurden Charaktere gefunden, die Genshin Impact generieren können. Andere kenne ich nicht. Ich habe dieses Modell nicht viel getestet. Beeindruckend ist die Nachbildung des Malstils von NAI3. Das Basismodell ist ein Fusionsmodell aus T-anime-xl, ponyv6 und animage3, das noch nicht veröffentlicht ist.

Die Trainings-Grafikkarte war meine eigene 3090, genutzt für jeweils 7, 12, 35 und 47 Stunden von v1 bis v3.5.

v1

Ein interessantes Experiment

An interesting attempt

v2

Basierend auf v1 wurde der Trainingssatz leicht vergrößert und ca. 30 Stunden Parameter-Fehlerkorrektur durchlaufen, der Stil zeigte jedoch noch einige Überanpassungen, z. B. doppelte Bauchnabel und chaotische Haare

On the basis of v1, the training set was slightly increased and went through about 30 hours of trial and error, but the trained art style still had some overfitting, such as double navel eyes and messy hair

v3

Die Gliedmaßen von v3 sind besser als bei v2. In der Interpretation von Fußfokus kann v3 visuell beeindruckendere Füße und komplexere Perspektiven erzeugen. Der KI-Eindruck der Haare ist im Vergleich zu v2 schwächer, da v2 zu wenig Trainingsdaten hatte, was zu Überanpassung in den Haaren führte; die gelegentlich auftretenden doppelten Bauchnabel bei v2 sind verschwunden. Insgesamt ermöglichen das dreifache Trainingsdatenset von v2 und größere Dim-Parameter eine natürlichere Stil-Anpassung sowie bessere Leistung bei langen Prompts.

The limbs of v3 are better than those of v2. In terms of understanding footfocus, v3 can generate feet with greater visual impact and higher difficulty perspective. The AI feeling of v3's hair is also weaker than that of v2, because v2 has too little training set, so the hair part may be slightly overfitting, and the occasional double navel eyes that appear in v2 are also gone. Overall, three times the size of the v2 training set and a larger dim parameter make the art style fit more natural, and the performance is much stronger than v2 under long prompts.

v3.5

In dieser Version sind die Anforderungen an Qualitätswörter nicht so strikt; man kann die Qualitätswörter der Pony-Ästhetikbewertung vollständig weglassen. Beim Testen traten gelegentlich unbedeutende Farbblöcke auf Bildern auf, was man durch Ersetzen der Pony-Qualitätswörter mit geläufigeren Qualitätswörtern wie score_1 oder score_2 durch 'worst quality' lösen kann. Ich habe diesem Version ca. 150 Trainingsbilder hinzugefügt, um den Stil auszugleichen und zu erweitern, sowie die Anfangssteigung der Lernkurve verringert. Dies mindert Überanpassung und erlaubt mehr Lora-Modelle und kreative Prompts. Insgesamt ist diese Version freier als v3 und zeichnet männliche Figuren besser, mit weniger grellen und fettigen Farben und Stilen unter bestimmten Prompts.

In this version, the requirements for quality words are not so strict, you can completely not to use the quality words of pony's aesthetic score to plot the picture, and occasionally there will be a situation where the picture generates meaningless color blocks in the test, you only need to replace the quality words of the aesthetic score with 1.5 commonly used quality words, such as score_1, score_2 replace it with worst quality. In this version, I added about 150 more training sets to balance and enrich the art style, and reduced the initial slope of the learning curve, which makes this model less overfitted and can be adapted to more lora and whimsical prompts. Overall, this version is a freer version than the v3 version, and this version is much stronger than the v3 version, and the colors and style of painting under some hints are not so bright and greasy.

v4

Diese Version wurde mit 798 Bildern trainiert und 90 Stunden auf einer 3090-Grafikkarte trainiert. Im Vergleich zu v3.5 ist bei einigen Prompts die Komposition und Darstellung bestimmter Bereiche präziser, z.B. Geisterbilder an Fingern und Überlappungen an Körperteilen. Als Trainingsziel nutzte ich überwiegend mittellange und kürzere Prompts, da niemand gerne lange Prompts zur Qualitätsgenerierung schreibt. Nach dem Entfernen der Qualitäts-Prompts von Pony’s Ästhetikverbesserung ist die Bildqualität merklich besser, eher flacher als 3D, näher am klassischen Anime-Stil. Die Tests zur Feinabstimmung mit Ponyv6 zur Bildanzahl sind fast abgeschlossen. Nächster Schritt ist, mehr steuerbare Prompts (z.B. Einbeziehung der Ästhetikbewertung) bei limitierten Trainingsdaten zu ermöglichen, weiterhin mit passendem neuem Trainingsmaterial, z.B. Szenenbilder und mehr Fußmaterial (bei v4 schien Fußmaterial etwas knapp).

This version used 798 images as training materials and trained for 90 hours using a 3090 graphics card. This version has a more accurate composition and depiction of certain parts in certain prompts compared to v3.5, such as ghosting of fingers and overlapping of some body parts. In terms of prompts, my main training goal is to use medium and slightly shorter prompts, as nobody likes to write a long string of prompts to generate high-quality images, right? After removing the quality prompt of Pony's aesthetic score, the image quality has been significantly improved compared to v3.5, and the resulting quality tends to be more flat rather than three-dimensional, closer to the classic anime style. The testing of the fine-tuning effect of Ponyv6 on the number of images is nearing completion. The next step is to start with the training labels of prompts and try to add more adjustable prompts to Pony's limited number of single training materials (such as adding aesthetic scores, the current training logic still uses mainstream quality words to cover Pony's aesthetic score quality words), and continue to add suitable new training materials, such as scene training materials and more foot training materials (v4's foot training materials seem to be a bit scarce).

v4.1

Ich entschuldige mich bei allen Nutzern, dass ich so kurz nach der letzten Version schon eine neue Version herausbringe, was die Speichernutzung und Netzwerkgeschwindigkeit stark beansprucht. O_O

Firstly, I would like to apologize to all users for the release of a new version in such a short period of time, which greatly tests the computer's memory and network speed. O_O

Diese neue Version basiert auf der Gliedmaßen-Debugging-Version von v4, da die Steuerung der Gliedmaßen in v4 schwierig war und die Perfektion der Hände nicht meinen Erwartungen entsprach. Mein Freund 木猫猫猫 und ich haben v4 angepasst und verbessert, sodass v4.1 meine Erwartungen erreich hat. Ich werde einige XY-Grafiken veröffentlichen, die unter gleichen Parametern die Verbesserungen gegenüber v4 verdeutlichen.

This new version is based on the limb debugging version of v4. Due to the difficulty in controlling the limb effects of v4, the perfection rate of the hands did not meet my testing expectations in the past few days. So my friend 木猫猫猫 and I made some adjustments and improvements to v4, which ultimately made the limbs of v4.1 meet my expectations. I will release several xy graphs to clearly show the improvement of v4.1 compared to v4 under the same parameters.

v5

In dieser Version wurden die Trainingsmaterialien reduziert. Aufgrund des Misserfolgs von v4 startete ich ein neues Projekt, das auf geringem VRAM-Verbrauch basiert, und trainierte vier verschiedene Stil-Lora, die auf T-ponynai3 adaptiert sind. Das Originalmodell habe ich auch bei Civitai hochgeladen. Nach Testung der Kompatibilität begann ich, diese vier Stilsets als Additive in T-ponynai3-v5 zu integrieren. Überraschenderweise verbesserte sich die Linienstruktur deutlich, vermutlich durch feine Materialien. Für das Markieren der vier Stile verwendete ich die Prompts style_1 bis style_4. Leider sind die vier Stile nicht klar getrennt oder der Effekt ist schwach; stattdessen sind sie gut ins Original integriert. Auch wenn das Ziel mehrerer Stile nicht erreicht wurde, verbesserte sich die Qualität des ursprünglichen Nai3-Stils wesentlich. Vielleicht versuche ich das in der nächsten Version weiterzuführen. (Ich spiele gerne Spiele, daher fällt es mir schwer, während des Trainings nicht zu spielen.)

The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it's too difficult for me to play computer games every time I train.)

Einige Zusammenfassungen zu Problemen mit Version v5.

Summarize some issues regarding the v5 version.

Mitwirkende

Anna Müller

Hallo! Ich bin Anna Müller und kuratiere seit über zehn Jahren digitale Fotogalerien. Mein geschultes Auge für Farbe und Komposition bringt jede KI-Kreation zum Strahlen.

Zurück

Tponynai3 - v55

Weiter

Tponynai3 - v5

Dieses Modell verwenden