Pony: People's Works + - v8_Illusv2.0Stable
Palabras Clave y Etiquetas Relacionadas
Prompts Recomendados
masterpiece,best quality,very aesthetic
collarbone, HDR, 8K, masterpiece, high contrast, best quality, very aesthetic, amazing quality, light smile, white hair, newest, long hair, volumetric lighting, 1girl, red eyes, (artist:incase:0.3), solo, sitting, (artist:tsuaii:0.3), holding phone, (realistic:1), sundress, (flat color:1.5), outdoors, bench, shopping bag, himuromizuki, garden, short hair, day, orange hair, pink hair, streaked hair, multicolored hair, hair between eyes, ahoge, pink eyes, hairclip, hand on hip, leaning forward, open mouth, smile, lens flare, gradient background, abstract background, yojifuku, witch, dress, pantyhose, hat
Prompts Negativos Recomendados
low quality,displeasing
Base:bad quality, muted color, worst detail, low quality, worst quality, sketch, displeasing, censor, text, watermark, bad anatomy, artist name, signature
Parámetros Recomendados
samplers
steps
cfg
Consejos
Para estilo fotorrealista, usa la etiqueta 'photorealistic' con pesos bajos para ajustar la textura.
El tag 'realistic' funciona bien con pesos más altos para mayor realismo.
El modelo ahorra espacio de tokens al producir imágenes de calidad estable sin usar palabras clave de artista ni largos prompts de calidad.
La versión LoCon de alta dimensión ofrece más control sobre el peso del efecto y una generalización más fuerte, pero requiere más almacenamiento y recursos computacionales.
El modelo no es específico de estilo; las salidas pueden variar sutilmente según los prompts y condiciones de generación.
v8
Actualización de textura: se han reforzado los siguientes tags en el entrenamiento:
Texture Update: Se han reforzado los siguientes tags en el entrenamiento:
realistic, photorealistic, flat color,shiny skin, matte skin, shiny hair,Tenga en cuenta que en el conjunto de datos Danbooru existen múltiples tags para describir "foto" o "estilos tipo foto". En el conjunto de entrenamiento he etiquetado todas estas imágenes como “photorealistic”. Sin embargo, la mayoría de los modelos SDXL entrenados con el conjunto Danbooru no representan bien imágenes realistas, por lo que se recomienda usar “photorealistic” solo con pesos bajos para ajustar la textura más que para generar realismo. El tag “realistic” funciona bien con pesos mayores.
Por favor note que el conjunto de datos Danbooru contiene múltiples etiquetas para describir estilos "foto" o "foto-like". He etiquetado todas esas imágenes como "photorealistic" en el dataset.
No obstante, la mayoría de los modelos SDXL entrenados con Danbooru no generan imágenes realistas correctamente. “photorealistic” solo se recomienda a peso bajo, donde ayuda a ajustar texturas en vez de crear imágenes realistas. La etiqueta “realistic” puede funcionar apropiadamente a mayor peso.
Inicio rápido | Quick Start
¿Qué es esto? | What is this?
Pony: People's Works (ppw) es una serie de modelos fine-tuned experimental, cuya base de datos contiene aproximadamente un 85% de imágenes generadas por IA publicadas por usuarios en CivitAI. El dataset temprano de ppw se construyó originalmente sobre imágenes generadas por pony v6, por lo que los modelos de esta serie mantienen características de Pony Diffusion.
Esta serie usa etiquetas estándar Danbooru y está optimizada principalmente para generar retratos estilizados a media y corta distancia. Su función principal es permitir que el modelo base consiga una calidad de imagen relativamente estable sin necesidad de usar nombres de artistas ni prompts largos de calidad, ahorrando espacio de tokens.
Este modelo no es un LoRA de estilo; puede presentar variaciones sutiles en el estilo según los prompts y condiciones de generación.
Pony: People's Works (ppw) es una serie experimental de modelos fine-tuned, aproximadamente el 85% del dataset proviene de imágenes generadas por IA publicadas por usuarios en CivitAI. Como el dataset temprano de ppw se construyó sobre imágenes generadas por Pony V6, las salidas de esta serie también poseen características de Pony Diffusion.
Esta serie utiliza etiquetas estándar Danbooru y está optimizada principalmente para la generación de retratos estilizados a media y corta distancia. El efecto principal es permitir que el modelo base logre una calidad de imagen relativamente estable, sin palabras clave de artista ni etiquetas largas de calidad, liberando espacio de tokens para los prompts.
Estos modelos no son LoRAs de estilo. Puede haber variaciones sutiles de estilo según diferentes prompts y condiciones de generación.
Información de versión | Version Info.
En esta página se publica la versión LoCon de alta dimensión de ppw, que también es la página principal del proyecto.
La versión LoCon de ppw puede combinarse flexiblemente con diversas LoRAs funcionales y checkpoints, ofreciendo mayor control sobre la intensidad del efecto. La versión de alta dimensión tiene mayor capacidad de generalización y mejor detalle, pero consume más espacio de almacenamiento y recursos computacionales.
Está pensada principalmente para servicios de generación en línea y para usuarios con equipos potentes para uso local.
Esta página presenta la versión LoCon de alta dimensión de ppw, que también sirve como página principal del proyecto.
Las versiones LoCon de ppw pueden combinarse flexiblemente con varios LoRAs funcionales y checkpoints, brindando mayor control sobre el peso del efecto. Las versiones de alta dimensión ofrecen una generalización más fuerte y detalles más finos, pero requieren más espacio de almacenamiento y recursos computacionales.
Están destinadas principalmente para servicios de generación en línea y uso local por usuarios con PC de alto rendimiento.
Versión ligera LoCon | Lightweight LoCon ver.
Versiones base del modelo | Checkpoint versions (Illustrious)
Versiones base del modelo | Checkpoint versions (NoobAI)
Uso | Usage
positivo:
masterpiece, best quality, very aestheticnegativo:
low quality, displeasingRegistro de cambios | Change log
v7
La versión v7 realizó ajustes significativos en la estructura del dataset, utilizando diferentes parámetros y estrategias de entrenamiento, por lo que podría ser menos estable que las versiones anteriores.
The v7 version has undergone significant structural adjustments to the dataset, and utilizes different training parameters and strategies. As a result, v7 may be less stable than the previous versions.
El modelo v-pred tiene un rendimiento diferente en el generador en línea de CivitAI comparado con el generador en línea de TensorArt, usando los mismos parámetros no se pueden replicar los resultados. No sé por qué...
The v-pred model's performance on the CivitAI online generator is completely different from online generation on TensorArt. The results are entirely unreproducible with a same parameters. I have no idea why...
Versión TensorArt Versión CivitAI con mismos parámetros en CivitAI con peso más alto
Resumen de la versión v7:
Este es un LoCon para calidad de imagen desarrollado sobre el dataset del trabajo previo, con aproximadamente un 90%-95% de las imágenes provenientes de CivitAI.
Permite que el modelo alcance una calidad de imagen relativamente estable sin usar nombres de artistas ni prompts largos de calidad, ahorrando espacio de tokens y corrigiendo algunos defectos inherentes al modelo generador (excepto manos).
Debido a la selección del dataset, las imágenes generadas tienen un estilo característico de Pony. Pero como no apunta a ningún artista, estilo o técnica específicas, el estilo puede variar sutilmente según los prompts y las condiciones de generación.
Este es un LoCon de calidad para generación desarrollado basándose en el dataset del trabajo anterior. Aproximadamente entre el 90%-95% de los datos de imágenes provienen de CivitAI.
Permite que los modelos alcancen una calidad de imagen relativamente estable sin etiquetas de artistas ni prompts largos de calidad, liberando más espacio de tokens. Además, puede corregir algunos defectos inherentes al modelo, excepto para las manos.
Debido a la selección del dataset, las imágenes generadas exhiben un estilo similar al de Pony. No obstante, al no referirse a ningún artista, estilo o técnica específica, pueden existir ligeras variaciones estilísticas de acuerdo con los prompts y condiciones del checkpoint.
Fuente del dataset y licencia | Dataset Source & License
Cada imagen del dataset ha sido seleccionada, categorizada y anotada manualmente por el autor, con cientos de imágenes editadas y corregidas a mano.
Este modelo es un modelo gratuito y de código abierto, que los usuarios pueden desplegar en sus dispositivos personales. El autor no recibe ningún pago por venta del modelo. El autor no impone restricciones para el uso de este modelo en servicios comerciales de generación o para generar imágenes con fines comerciales, pero se debe respetar la licencia del Checkpoint y otros LoRAs usados conjuntamente.
El 90%-95% de los datos del dataset son imágenes generadas por IA, pero incluye unas 250+ imágenes recopiladas de medios públicos, prensa y publicaciones para complementar conceptos. Las versiones futuras reemplazarán gradualmente esos materiales. Los usuarios con fines comerciales deben ser conscientes de los posibles riesgos.
Este dataset no incluye datos de entrenamiento de artistas individuales ni contiene atribuciones explícitas a artistas (aunque no se puede descartar errores de etiquetado de IA).
Además, no se permite usar este modelo para aplicaciones comerciales cerradas, venta del modelo, ni para fusionarlo con modelos comerciales cerrados. No hay restricciones para fusionar modelos de código abierto para servicios de generación, pero se recomienda acreditar las fuentes de los modelos fusionados.
Cada imagen en el dataset ha sido seleccionada, categorizada y anotada manualmente por el autor. Además, cientos de imágenes han sido editadas y corregidas manualmente.
Este modelo es un modelo gratuito y de código abierto, permitiendo a los usuarios desplegarlo en sus dispositivos personales. El autor no recibe compensación de la venta del modelo. El autor no impone restricciones para el uso del modelo en servicios comerciales de generación de imágenes o para generar imágenes con fines comerciales, aunque se deben respetar las licencias del Checkpoint y otros LoRAs usados.
Alrededor del 90%-95% del dataset está compuesto por imágenes generadas por IA. Sin embargo, alrededor de 250 imágenes han sido recogidas de medios públicos, noticias y publicaciones para complementar conceptos. Las futuras versiones reemplazarán gradualmente estos materiales. Los usuarios con intenciones comerciales deben estar conscientes de los riesgos.
Este dataset no incluye datos de entrenamiento de artistas individuales ni contiene atribuciones explícitas a artistas (aunque no se puede descartar errores de etiquetado de IA).
Además, este modelo no está permitido para uso en aplicaciones comerciales cerradas, venta del modelo o fusión con modelos comerciales cerrados. No hay restricciones para modelos fusionados de código abierto usados en servicios de generación, pero se recomienda acreditar las fuentes de los modelos fusionados.
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.






