Vanillaware Style PonyXL - v0.1
Palabras Clave y Etiquetas Relacionadas
Prompts Recomendados
score_9, score_8_up, score_7_up, <lora:vanillawareStyle:1>, 1girl, solo, looking at viewer, full body, light particles
Prompts Negativos Recomendados
thumbnail,3d
3d, bad anatomy, watermark
Parámetros Recomendados
samplers
steps
cfg
clip skip
resolution
vae
other models
Parámetros Recomendados de Alta Resolución
upscaler
upscale
denoising strength
Consejos
Compón los prompts en el orden: [rasgos del personaje] + [estilo] + [expresión] + [ropa] + [cámara y acción] + [fondo], modificando según sea necesario.
Si la imagen está borrosa, añade "thumbnail" a los prompts negativos y aumenta su peso para mejorar la claridad.
Agregar '3d' a los prompts negativos puede mejorar los resultados.
Añadir etiquetas como 'realistic' o 'realism' puede realzar las características de la figura.
Ajusta el peso recomendado entre 1.0 y 0.6 para la apariencia deseada del personaje.
Mejora la calidad del conjunto de datos y utiliza un etiquetado cuidadoso para un mejor entrenamiento.
Coloca las etiquetas de imágenes de menor calidad en los prompts negativos para reducir su influencia durante la generación.
El entrenamiento de este modelo y las imágenes que genera son únicamente para fines de aprendizaje.
Yo no hice nada, solo soy un portador.
Este modelo es más como un paquete de personajes, y su efecto secundario es el estilo que aporta.
Tomó más de 30 horas de intentos repetidos, durante los cuales casi me rendí, pero al final logré un efecto más equilibrado. Lo más importante es que mi hipótesis de entrenamiento fue verificada. En el futuro, podría organizar estas experiencias en un artículo.
Pero aún existen problemas con las manos mal hechas.
Palabra de activación: vanillastyle
Puedes encontrar ejemplos de prompts en las imágenes de arriba.
El prompt del modelo de la versión anterior también funcionaba en su mayoría.
Mis prompts básicamente se componen en el orden de [rasgos del personaje] + [estilo] + [expresión] + [ropa] + [cámara y acción] + [fondo], y puedes eliminarlos o modificarlos según sea necesario.
Si hay una situación particularmente borrosa, considera agregar "thumbnail" a los prompts negativos y aumentar su peso hasta que la imagen se aclare.
Agregar '3d' a los prompts negativos puede obtener mejores resultados, mientras que añadir etiquetas como 'realistic' o 'realism' puede mejorar las características de la figura.
Peso recomendado: 1.0~0.6, ajusta según sea necesario hasta que la apariencia del personaje cumpla con tus requisitos.
El valor recomendado para upscale está alrededor de 1.2~2.0, y la fuerza de denoising es 0.2
El conjunto de datos se centró principalmente en las obras de George Kamitani.
20240907v0.2
En esta versión, etiqueté más imágenes, y para el resto, eliminé sus etiquetas, dejando solo las palabras de activación para evitar conflictos con las etiquetas cuidadosamente aplicadas. (Este método puede ser incorrecto.)
Durante el proceso de entrenamiento, hubo demasiados casos en los que las imágenes en el conjunto de datos no estaban representadas con precisión a través del prompt. Traté de cambiar varias etiquetas y reentrenar, con el mismo resultado. La repetitividad de estas imágenes en el conjunto no es alta, careciendo de continuidad.
Finalmente, leí un artículo que mencionaba aumentar el número de repeticiones de entrenamiento para ciertos personajes para evitar que el modelo no aprenda suficientemente estas imágenes.
Por eso, coloqué todas las imágenes que aparecen solo una vez en el conjunto en una subcarpeta, establecí las repeticiones de entrenamiento en 2, y dejé sin cambios las imágenes que ya se habían aprendido bien.
Sin embargo, dado que hay bastantes problemas de calidad con estas imágenes discontinuas, y no las he reparado por el momento, aumentar sus repeticiones de entrenamiento ha tenido cierto impacto en el estilo general.
Para la próxima versión, el enfoque más fundamental para mejorar es mejorar la calidad del conjunto de datos, y también hacer buen uso de las técnicas de etiquetado, añadiendo la misma etiqueta a aquellas imágenes de calidad algo inferior, y luego colocándolas todas en el prompt negativo al ejecutar el modelo.
20240715v0.1
Este modelo solo puede considerarse como v0.1, no es muy fácil de usar normalmente, y creo que lo mejor es etiquetar más imágenes en el conjunto de datos en detalle para mejores resultados. En el futuro, puede que complete lentamente el entrenamiento de este modelo.
El rendimiento de esta versión no es muy bueno, las imágenes que genera a menudo pueden parecer caóticas.
Recopilé más de 100 imágenes para el conjunto de datos, pero la cantidad sigue siendo demasiado grande para etiquetado manual. Inicialmente usé wd1.4 para etiquetar todas las imágenes, pero la calidad del etiquetado no fue buena, (quizás mi uso no fue suficientemente correcto, y doy la bienvenida a sugerencias de todos).
Como quería ver los resultados rápidamente, para este conjunto solo etiqueté manualmente algunas imágenes que cumplen con mis preferencias personales, por lo que el efecto de salida del modelo será mejor para esas imágenes.
Detalles del Modelo
Discusión
Por favor log in para dejar un comentario.






