modelos/Vanillaware Style PonyXL - v0.1

Vanillaware Style PonyXL - v0.1

10/17/2025

1:07:31 AM

Palabras Clave y Etiquetas Relacionadas

modelo de difusión estable de paquete de personajes,George Kamitani,estilo George Kamitani,lora,pony,estilo,sumai,v0.1,vanillastyle,vanillaware,ponyxl estilo vanillaware

Hechicera fantástica de cuerpo completo con cabello rojo largo, vistiendo corsé negro y gran sombrero de bruja, sosteniendo bastón de madera bajo un cielo nocturno

Un hada rubia con orejas puntiagudas y alas verdes translúcidas que lleva un vestido verde, rodeada de mariposas azules brillantes y partículas de luz en la noche.

Retrato de Miyuki Inaba con cabello corto castaño y ojos marrones, vistiendo una camiseta sin mangas gris, posando con la mano en la frente sobre un fondo blanco.

Retrato de una mujer tranquila de cabello blanco con ojos marrones que lleva un corsé negro y un cuello de encaje, adornada con plumas azules, sobre un fondo negro.

Retrato fotorrealista de una chica de cabello blanco con peinado trenzado que lleva un corsé negro con escote, rodeada por plumas azules brillantes y partículas de luz contra un fondo negro.

Prompts Recomendados

score_9, score_8_up, score_7_up, <lora:vanillawareStyle:1>, 1girl, solo, looking at viewer, full body, light particles

Prompts Negativos Recomendados

thumbnail,3d

3d, bad anatomy, watermark

Parámetros Recomendados

samplers

Euler a

steps

cfg

clip skip

resolution

768x1344

vae

sdxl_vae.safetensors

other models

vanillawareStyle (272b477439ee), ponyDiffusionFor_v10 (7ad8ce957e)

Parámetros Recomendados de Alta Resolución

upscaler

4xUltrasharp_4xUltrasharpV10

upscale

1.2 - 2

denoising strength

0.2

Consejos

Compón los prompts en el orden: [rasgos del personaje] + [estilo] + [expresión] + [ropa] + [cámara y acción] + [fondo], modificando según sea necesario.

Si la imagen está borrosa, añade "thumbnail" a los prompts negativos y aumenta su peso para mejorar la claridad.

Agregar '3d' a los prompts negativos puede mejorar los resultados.

Añadir etiquetas como 'realistic' o 'realism' puede realzar las características de la figura.

Ajusta el peso recomendado entre 1.0 y 0.6 para la apariencia deseada del personaje.

Mejora la calidad del conjunto de datos y utiliza un etiquetado cuidadoso para un mejor entrenamiento.

Coloca las etiquetas de imágenes de menor calidad en los prompts negativos para reducir su influencia durante la generación.

El entrenamiento de este modelo y las imágenes que genera son únicamente para fines de aprendizaje.

Yo no hice nada, solo soy un portador.

Este modelo es más como un paquete de personajes, y su efecto secundario es el estilo que aporta.

Tomó más de 30 horas de intentos repetidos, durante los cuales casi me rendí, pero al final logré un efecto más equilibrado. Lo más importante es que mi hipótesis de entrenamiento fue verificada. En el futuro, podría organizar estas experiencias en un artículo.

Pero aún existen problemas con las manos mal hechas.

Palabra de activación: vanillastyle

Puedes encontrar ejemplos de prompts en las imágenes de arriba.

El prompt del modelo de la versión anterior también funcionaba en su mayoría.

Mis prompts básicamente se componen en el orden de [rasgos del personaje] + [estilo] + [expresión] + [ropa] + [cámara y acción] + [fondo], y puedes eliminarlos o modificarlos según sea necesario.

Si hay una situación particularmente borrosa, considera agregar "thumbnail" a los prompts negativos y aumentar su peso hasta que la imagen se aclare.

Agregar '3d' a los prompts negativos puede obtener mejores resultados, mientras que añadir etiquetas como 'realistic' o 'realism' puede mejorar las características de la figura.

Peso recomendado: 1.0~0.6, ajusta según sea necesario hasta que la apariencia del personaje cumpla con tus requisitos.

El valor recomendado para upscale está alrededor de 1.2~2.0, y la fuerza de denoising es 0.2

El conjunto de datos se centró principalmente en las obras de George Kamitani.

20240907v0.2

En esta versión, etiqueté más imágenes, y para el resto, eliminé sus etiquetas, dejando solo las palabras de activación para evitar conflictos con las etiquetas cuidadosamente aplicadas. (Este método puede ser incorrecto.)

Durante el proceso de entrenamiento, hubo demasiados casos en los que las imágenes en el conjunto de datos no estaban representadas con precisión a través del prompt. Traté de cambiar varias etiquetas y reentrenar, con el mismo resultado. La repetitividad de estas imágenes en el conjunto no es alta, careciendo de continuidad.

Finalmente, leí un artículo que mencionaba aumentar el número de repeticiones de entrenamiento para ciertos personajes para evitar que el modelo no aprenda suficientemente estas imágenes.

Por eso, coloqué todas las imágenes que aparecen solo una vez en el conjunto en una subcarpeta, establecí las repeticiones de entrenamiento en 2, y dejé sin cambios las imágenes que ya se habían aprendido bien.

Sin embargo, dado que hay bastantes problemas de calidad con estas imágenes discontinuas, y no las he reparado por el momento, aumentar sus repeticiones de entrenamiento ha tenido cierto impacto en el estilo general.

Para la próxima versión, el enfoque más fundamental para mejorar es mejorar la calidad del conjunto de datos, y también hacer buen uso de las técnicas de etiquetado, añadiendo la misma etiqueta a aquellas imágenes de calidad algo inferior, y luego colocándolas todas en el prompt negativo al ejecutar el modelo.

20240715v0.1

Este modelo solo puede considerarse como v0.1, no es muy fácil de usar normalmente, y creo que lo mejor es etiquetar más imágenes en el conjunto de datos en detalle para mejores resultados. En el futuro, puede que complete lentamente el entrenamiento de este modelo.

El rendimiento de esta versión no es muy bueno, las imágenes que genera a menudo pueden parecer caóticas.

Recopilé más de 100 imágenes para el conjunto de datos, pero la cantidad sigue siendo demasiado grande para etiquetado manual. Inicialmente usé wd1.4 para etiquetar todas las imágenes, pero la calidad del etiquetado no fue buena, (quizás mi uso no fue suficientemente correcto, y doy la bienvenida a sugerencias de todos).

Como quería ver los resultados rápidamente, para este conjunto solo etiqueté manualmente algunas imágenes que cumplen con mis preferencias personales, por lo que el efecto de salida del modelo será mejor para esas imágenes.