Tponynai3 - v5
Palabras Clave y Etiquetas Relacionadas
Prompts Recomendados
score_9,score_8_up,score_7_up
score_8_up,score_7_up,1girl,solo
Prompts Negativos Recomendados
score_4,score_3,score_2,worst quality, bad hands, bad feet
score_4,score_3,score_2,score_1,ugly,bad feet
Parámetros Recomendados
samplers
steps
cfg
clip skip
resolution
other models
Parámetros Recomendados de Alta Resolución
upscaler
upscale
steps
denoising strength
Consejos
Usa alta fijación a resolución moderada para mejores resultados.
Prueba style_3 o 4 para mejorar detalles en los ojos.
Aspectos Destacados de la Versión
En esta versión reduje el material de entrenamiento. Debido al fracaso de v4, empecé otro proyecto para probar una idea con bajo uso de memoria, entrenando cuatro estilos de arte lora diferentes adaptados a T-ponynai3, claro que el modelo original también fue subido a Civitai. Tras probar compatibilidad, empecé a entrenar estas cuatro variantes como aditivos en T-ponynai3-v5. Sorprendentemente, la textura de líneas de v5 mejoró mucho, probablemente porque entrené un material muy detallado. Para marcar estos cuatro estilos, usé los términos style_1 a style_4. Lamentablemente, por alguna razón estos estilos no se separaron o el efecto fue débil, en cambio se integraron bien al estilo original. Aunque no se logró soportar múltiples estilos, se elevó la textura del estilo original Nai3 a otro nivel, quizás la próxima versión vaya más allá. (Me gusta jugar, me cuesta no jugar mientras entreno.)
The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it's too difficult for me to play computer games every time I train.)
Patrocinadores del Creador
[No verificado]Tonade está creando el modelo T-ponynai3, ID en c-site: Tonade, | Aifadian (afdian.net)
Este es el canal de patrocinio en Aifadian, si te gusta el modelo y tienes la capacidad, puedes apoyar. ¡No te sientas obligado! Gracias por todo su apoyo, seguiremos explorando cómo mejorar el modelo.
929721518 es el número de grupo de QQ personal, pueden entrar para preguntar cualquier duda sobre tpony. Recuerden comentar que vienen de c-site.
El modelo ya incluye vae, no es necesario añadir vae adicional
The model already has included vae, there is no need to add additional vae
La mejor estrategia de generación es usar una resolución moderada con alta fijación, en vez de salida directa en alta resolución
The best generate strategy is to use high-fix at a moderate resolution, rather than directly using high-resolution direct output
[No verificado]Tonade está creando el modelo T-ponynai3, ID en c-site: Tonade, | Aifadian (afdian.net)
Este es el canal de patrocinio en Aifadian, si te gusta el modelo y tienes la capacidad, puedes apoyar. ¡No te sientas obligado! Gracias por todo su apoyo, seguiremos explorando cómo mejorar el modelo.
(33) T-ponynai3-v5 - (versión modificada de pesos) | Stable Diffusion Checkpoint | Tusi tusi.cn (tusiart.com) enlace de generación online de tusiart (versión tensor china)
(Debido a que el modelo solo puede existir simultáneamente en Tusi y Tensor, es mejor usarlo en Tusi. Si hay problemas con su uso, por favor indíquenmelos.)
La versión v5 ha añadido 4 estilos nuevos, se pueden usar desde style_1 hasta style_4 para afinar detalles en la imagen (teóricamente es así, en la práctica el efecto es más místico)
La versión V5 ha agregado 4 nuevos estilos, que pueden usarse para afinar los detalles de la imagen mediante style_1 a style_4 (teóricamente es así, pero el efecto real es más místico o inferior)
Este modelo soporta perfectamente lora entrenado con ponyv6 como modelo base, y también puede adaptar en cierta medida los Lora de ani3 y sdxl1.0
This model perfectly supports lora trained with ponyv6 as the base model, and the Lora of ani3 and sdxl1.0 can also be adapted to some extent.
Prueba de inpainting basada en v4.1 (esto fue una parte que se pasó por alto en versiones anteriores)
Image inpaint testing based on v4.1 (this is a previously overlooked part)
pony es dios, compatibilidad total. Este modelo soporta lora de ani y pony
Palabras clave de efectos previos esenciales iguales a ponydiffusion
positivo:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)
O (score_9,score_8_up,score_7_up)
Negativo opcional:
negativo: (score_4,score_3,score_2,score_1),
También se pueden añadir palabras negativas normales del sistema nai, por ejemplo:
negativo: worst quality, bad hands, bad feet
Espero que les guste ᕕ(◠ڼ◠)ᕗ basado en nai3 y ponyv6
Instrucciones de entrenamiento: v1 se usaron 94 imágenes, v2 usó 119, v3 usó 348, v3.5 usó 474 imágenes generadas con nai3, el lora entrenado se integró en el modelo base para afinado, soporta tags de artistas que ponyv6 soporta, usar más de dos tags de artista puede causar fallos en el fondo. Actualmente se ha detectado que puede generar personajes de Genshin Impact, otros no los conozco. No he probado mucho este modelo, me impresiona la fidelidad al estilo nai3. El modelo base es una fusión de T-anime-xl, ponyv6 y ani3, no ha sido liberado.
La GPU usada para entrenamiento fue mi 3090 personal, con tiempos de 7, 12, 35 y 47 horas para v1 a v3.5 respectívamente.
Instrucciones de Entrenamiento: Merge Lora usó 94 imágenes para v1, 119 para v2, 348 para v3, 474 para v3.5, todas generadas por NAI3 para entrenamiento y afinamiento de modelo base. Pony soporta todas las etiquetas de artistas que ponyv6 ya tiene, pero no hay etiquetas adicionales de nai3. Usar más de dos etiquetas puede causar fallos en el fondo. Actualmente se ha detectado que puede generar personajes de Genshin Impact. No conozco los otros. No he probado mucho este modelo. Maravillado por la reproducción del estilo de pintura de NAI3. El modelo base es una fusión de T-anime-xl, ponyv6 y ani3, no ha sido liberado.
La tarjeta gráfica usada fue mi 3090 personal, usada 7, 12, 35 y 47 horas de v1 a v3.5 respectivamente.
v1
Un intento interesante
An interesting attempt
v2
Se incrementó ligeramente el set de entrenamiento respecto a v1 y se probaron parámetros durante unas 30 horas, pero el estilo resultante aún muestra cierto sobreajuste, con doble ombligo y cabello desordenado.
On the basis of v1, the training set was slightly increased and went through about 30 hours of trial and error, but the trained art style still had some overfitting, such as double navel eyes and messy hair
v3
Los miembros en v3 mejoran respecto a v2, en el enfoque de "footfocus" v3 puede generar pies con mayor impacto visual y perspectivas más difíciles. El aspecto de IA en el cabello es menor que en v2, porque v2 tenía pocas imágenes de entrenamiento, causando algo de sobreajuste en el cabello y desaparición de los dobles ombligos ocasionales. En general, el triple tamaño del set respecto a v2 y un parámetro dim mayor hacen que el estilo encaje más naturalmente, y bajo prompts largos su expresión es mucho más fuerte.
The limbs of v3 are better than those of v2. In terms of understanding footfocus, v3 can generate feet with greater visual impact and higher difficulty perspective. The AI feeling of v3's hair is also weaker than that of v2, because v2 has too little training set, so the hair part may be slightly overfitting, and the occasional double navel eyes that appear in v2 are also gone. Overall, three times the size of the v2 training set and a larger dim parameter make the art style fit more natural, and the performance is much stronger than v2 under long prompts.
v3.5
En esta versión los requisitos para las palabras de calidad no son tan estrictos, se pueden dejar de usar las palabras de calidad de puntuación estética de pony para generar imágenes, aunque a veces salen bloques de color sin sentido, basta con cambiar esas palabras por las comunes de calidad 1.5, por ejemplo score_1, score_2 por worst quality. En esta versión añadí unas 150 imágenes al set para equilibrar y enriquecer el estilo, reduciendo la pendiente inicial de la curva de aprendizaje, lo que hace que el modelo no esté tan sobreajustado, y pueda adaptarse a más loras y prompts creativos. En general, esta versión es más libre que la v3, además la representación masculina es mucho mejor, y los colores y estilos en algunos prompts son menos brillantes o grasos.
In this version, the requirements for quality words are not so strict, you can completely not to use the quality words of pony's aesthetic score to plot the picture, and occasionally there will be a situation where the picture generates meaningless color blocks in the test, you only need to replace the quality words of the aesthetic score with 1.5 commonly used quality words, such as score_1, score_2 replace it with worst quality. In this version, I added about 150 more training sets to balance and enrich the art style, and reduced the initial slope of the learning curve, which makes this model less overfitted and can be adapted to more lora and whimsical prompts. Overall, this version is a freer version than the v3 version, and this version is much stronger than the v3 version, and the colors and style of painting under some hints are not so bright and greasy.
v4
Esta versión usó 798 imágenes para entrenamiento y se entrenó 90 horas en una 3090. Comparada con la v3.5, en ciertos prompts mejora la composición y detalles como las sombras en dedos y la superposición de partes del cuerpo. El enfoque fue usar prompts de longitud media o corta, porque nadie quiere escribir prompts largos para obtener buena calidad. Al eliminar las palabras de calidad basadas en puntuación estética de pony, la calidad de la imagen mejoró mucho frente a v3.5, tendiendo a un estilo más plano que tridimensional, más cercano al anime clásico. La prueba del efecto del microajuste de ponyv6 con cantidad de imágenes se acerca al final. El siguiente paso es partir de las etiquetas de los prompts y añadir más prompts ajustables en las limitas muestras de pony (como añadir la puntuación estética, ya que el entrenamiento usa palabras comunes para cubrir las de pony), y seguir añadiendo nuevos materiales, como escenarios y más imágenes de pies (el material de pies en v4 parece insuficiente).
This version used 798 images as training materials and trained for 90 hours using a 3090 graphics card. This version has a more accurate composition and depiction of certain parts in certain prompts compared to v3.5, such as ghosting of fingers and overlapping of some body parts. In terms of prompts, my main training goal is to use medium and slightly shorter prompts, as nobody likes to write a long string of prompts to generate high-quality images, right? After removing the quality prompt of Pony's aesthetic score, the image quality has been significantly improved compared to v3.5, and the resulting quality tends to be more flat rather than three-dimensional, closer to the classic anime style. The testing of the fine-tuning effect of Ponyv6 on the number of images is nearing completion. The next step is to start with the training labels of prompts and try to add more adjustable prompts to Pony's limited number of single training materials (such as adding aesthetic scores, the current training logic still uses mainstream quality words to cover Pony's aesthetic score quality words), and continue to add suitable new training materials, such as scene training materials and more foot training materials (v4's foot training materials seem to be a bit scarce).
v4.1
Disculpas a los usuarios por sacar una versión nueva en tan poco tiempo, eso pone a prueba la memoria y velocidad de red de las computadoras. O_O
Firstly, I would like to apologize to all users for the release of a new version in such a short period of time, which greatly tests the computer's memory and network speed. O_O
Esta nueva versión es la de depuración de extremidades basada en v4. Debido a que controlar las extremidades en v4 fue difícil y la tasa de perfección de manos no alcanzó mis expectativas en estos días, mi amigo 木猫猫猫 y yo hicimos algunos ajustes que lograron que las extremidades en v4.1 cumplieran con lo esperado. Pondré varios gráficos xy para mostrar la mejora de v4.1 respecto a v4 bajo los mismos parámetros.
This new version is based on the limb debugging version of v4. Due to the difficulty in controlling the limb effects of v4, the perfection rate of the hands did not meet my testing expectations in the past few days. So my friend 木猫猫猫 and I made some adjustments and improvements to v4, which ultimately made the limbs of v4.1 meet my expectations. I will release several xy graphs to clearly show the improvement of v4.1 compared to v4 under the same parameters.
v5
En esta versión reduje el material de entrenamiento. Debido al fracaso de v4, empecé otro proyecto para probar una idea con bajo uso de memoria, entrenando cuatro estilos de arte lora diferentes adaptados a T-ponynai3, claro que el modelo original también fue subido a Civitai. Tras probar compatibilidad, empecé a entrenar estas cuatro variantes como aditivos en T-ponynai3-v5. Sorprendentemente, la textura de líneas de v5 mejoró mucho, probablemente porque entrené un material muy detallado. Para marcar estos cuatro estilos, usé los términos style_1 a style_4. Lamentablemente, por alguna razón estos estilos no se separaron o el efecto fue débil, en cambio se integraron bien al estilo original. Aunque no se logró soportar múltiples estilos, se elevó la textura del estilo original Nai3 a otro nivel, quizás la próxima versión vaya más allá. (Me gusta jugar, me cuesta no jugar mientras entreno.)
The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it's too difficult for me to play computer games every time I train.)
Resumen de algunos problemas de la versión v5.
1. Compatibilidad Lora y problemas con extremidades y ojos borrosos. La compatibilidad Lora es que usé un peso final demasiado alto en este entrenamiento, lo que puede causar sobreajuste. Esta versión optimizada reduce ese peso, mejorando la tasa de colapso de extremidades y compatibilidad con algunas Loras. He generado algunas imágenes comparativas con Loras basadas en v4.1 para referencia. El problema de ojos borrosos se debe probablemente a que entrené con style_1, donde los ojos originales ya son borrosos, se puede mejorar usando style_3 o 4.
2. Problemas de exposición con luz volumétrica. No encontré esto en pruebas, pero puede ser porque usé un parámetro de offset de ruido que aumentó la sensibilidad del modelo a palabras de luz en prompts, haciendo que con el mismo peso se obtenga mayor brillo. Recomiendo no usar paréntesis ni números para aumentar peso. Debido a la sensibilidad de sdxl a prompts, puedes probar repetir varias veces la misma palabra para evitar resultados extremos. El uso de este parámetro busca corregir el amarillento con pocos prompts. Adjunto imágenes comparativas para referencia.
3. Problema de menor complejidad del modelo. Teórica y prácticamente, v5 debería ser un modelo más limpio y diverso, con mejor expresividad bajo ciertos prompts. También adjunto imágenes comparativas. El set no usó materiales muy complejos, porque creo que eso causaría sobreajuste y pérdida de detalles.
Objetivo: Busco un modelo suficientemente diferente a versiones previas, no una copia casi idéntica. Sus comentarios son valiosos para pruebas, ya que solo no puedo permitirme el costo de prueba. En la próxima versión intentaré aumentar materiales de distintos estilos para que se integren mejor y se puedan separar, permitiendo cambiar estilos con prompts específicos, posiblemente con nuevas técnicas de entrenamiento. ¡Gracias por el feedback!
Summarize some issues regarding the v5 version.
1, Lora compatibility and issues with limbs and blurred eyes. Lora compatibility is that I used too much final weight for this training, and in some cases, overfitting may occur. This optimized version is the one that reduces the corresponding weight, and the limb collapse rate and compatibility with some Loras should be better. I have run several comparison charts of Loras trained with v4.1 for reference. The problem of blurred eyes should be the reason why I trained style_1. The eyes in the original material used are blurry, and can be improved by using style_3 or 4.
2. Exposure issues with volume light. I did not encounter this issue during testing, and the reason for it should be that I used the noise offset training parameter to increase the sensitivity of the model to light related prompt words, resulting in brighter results when the same weight of light prompt words were used. I suggest trying not to use parentheses and numbers to increase the weight. Due to the sensitivity of sdxl to prompt words, you can try repeating the same prompt words multiple times to avoid extreme results. At the same time, using this parameter is to fix the problem of generating yellow results under a small number of prompt words. I have run several comparison graphs for reference.
3. The problem of reduced model complexity. In theory and in practice. V5 should be a cleaner and more diverse model than the previous version, and with the help of some prompts, it should be able to achieve more accurate performance. Similarly, I ran several comparison charts for comparison. This training set did not use overly complex materials because I believe that overly complex images tend to overfit the results, which inevitably leads to a certain degree of detail loss.
Purpose: I hope to obtain a model that is significantly different from the previous version, rather than releasing a model that is almost identical to the previous version. This feedback from everyone is a great opportunity for trial and error, and I really don't have any trial and error costs on my own. In the next version, I will try to increase the amount of materials for different art styles, so that the art styles of different materials can be well integrated and separated. Using specific prompts to switch art styles may require some new training techniques. Thank you for your feedback!
Detalles del Modelo
Discusión
Por favor log in para dejar un comentario.