modelos/Pony: People's Works v1-v6 - v3_illu0.1

Pony: People's Works v1-v6 - v3_illu0.1

|
7/18/2025
|
2:27:13 PM
| Discussion|
0
Una chica robot inspirada en steampunk con un cuerpo brillante de porcelana adornado con detalles intrincados de oro y metal, ojos que brillan y una cabeza robótica ancha inusual, ubicada en un interior industrial vintage y ornamentado.
Perfil lateral de una chica android inspirada en nativos americanos con cabello trenzado castaño, extremidades mecánicas, sosteniendo un arco de caza, vistiendo una capa con patrones tribales, con un halcón mecánico posado en su hombro contra un fondo de desierto al atardecer.
Una chica puma rubia con brazos y cola de animal está relajándose, recostada en una gruesa rama de árbol en una jungla exuberante, vistiendo un atuendo tribal con detalles de pelaje dorado.
Imagen fotorrealista en primer plano de una chica con cabello de colores arcoíris lamiendo un cono de helado rosa con iluminación dramática y fondo bokeh
Primer plano de pies envueltos en pantimedias de nylon transparente mojado con gotas de agua, sobre un piso de madera reflectante con tela oscura cerca.
Dos jóvenes arrodilladas y besándose en un campo de flores amarillas brillantes al amanecer bajo un suave cielo al atardecer con un delicado humo en forma de corazón sobre ellas.
Una chica con leggings deportivos y sudadera con capucha jugando alegremente con un golden retriever y un corgi en un parque otoñal dorado con hojas naranjas vibrantes y cálido resplandor del atardecer.

Prompts Recomendados

masterpiece,best quality,very aesthetic

1girl, solo, masterpiece, best quality, very aesthetic

Prompts Negativos Recomendados

worst quality,low quality,displeasing

lowres, bad, text, worst quality, low quality, displeasing

Parámetros Recomendados

samplers

Euler a, DPM++ 2M Karras

steps

25 - 35

cfg

5 - 6

Consejos

Para las versiones V3 y posteriores, use etiquetas positivas como 'masterpiece', 'best quality' y 'very aesthetic'.

Las indicaciones negativas incluyen 'worst quality', 'low quality' y 'displeasing'.

Agregar 'hair intakes' en los prompts podría aliviar en cierta medida los problemas con artefactos en peinados.

Las versiones anteriores a V2 no tienen palabras desencadenantes específicas; por favor, use etiquetas de calidad con los modelos correspondientes.

Tenga en cuenta que las etiquetas de calidad y estética de Animagine v3.1 pueden cambiar el estilo artístico generado por la LoRA.

Intro. 简介:

Un style LoCon entrenado con imágenes de modelos basados en pony recogidos del sitio Civitai con "la mayor cantidad de colecciones" y "la mayor cantidad de reacciones".

这是一个训练自Civitai上点赞最多和收藏最多的pony系模型图片画风LoCon

Este lora no pretende simular ningún estilo o técnica artística específica. PUEDE reflejar el gusto comunitario y la atractividad visual de una imagen hasta cierto punto. Los estilos pueden cambiar sutilmente según las diferentes indicaciones.

这个lora并不意于还原某个特定的画师画风或者绘画技巧。它在某种程度上可能反应了社区审美图片的视觉吸引力。 不同的提示词下可能会有微妙的画风变化。

Uso 使用方法:

Las versiones anteriores a V2 no tienen palabras desencadenantes específicas. Por favor, use las etiquetas de calidad proporcionadas con el modelo correspondiente.

Para las versiones V3 y posteriores, se entrenaron las siguientes etiquetas:

V2以前的版本没有特定触发词。请使用对应模型自带的质量提示词。

对于v3及后续版本,训练了以下标签:

positivo:

masterpiece, best quality, very aesthetic

negativo:

worst quality, low quality, displeasing

Puede editar las indicaciones sobre esta base.

Generación de Datos 数据版本:

v6:

Se añadieron más de 500 imágenes nuevas, algunas seleccionadas de Flux. Eliminé algunas imágenes antiguas que consideré de menor calidad.

El número total de imágenes en el conjunto de datos ahora supera las 3,000, con más de 20 conceptos mejorados/editados manualmente en 6 versiones del conjunto de datos.

El rango del modelo también ha sido aumentado.

新添加了500+张图片其中有一部分选自flux生成的图像。删除了一部分我认为品质不佳的旧图片。

现在总的图片数超过了3000,6个版本的数据总共手动增强/修正了20多条概念。

增加了模型的rank。

v5.9:

El rendimiento del modelo no es el esperado, pero creo que las imágenes en el conjunto de datos de entrenamiento están bien. Planeo ajustar las etiquetas manualmente y ver cómo cambian los resultados.

模型效果不如预期,但是我觉得训练集的图片本身应该没什么问题。打算先手动修正tag看看效果。

2025/1/3更新:

Actualicé manualmente algunas etiquetas, pero parecen no estar relacionadas con brillo y colores. Supongo temporalmente que podría estar relacionado con el desplazamiento de ruido.

手动更新了一部分标签,但是它们和明暗色彩无甚干系。暂时猜测可能和noise offset有关。

v5:

El conjunto de datos se ha ampliado a 2,154 imágenes, con alrededor de 1,000 imágenes de Pony como objetivo principal de entrenamiento.

Aunque los modelos V-pred pueden usar LoRA entrenada en modelos basados en Eps-pred, la calidad de salida disminuye significativamente. Esta versión se entrenará por separado en dos tipos diferentes de modelos.

Las versiones recientes de NoobAI muestran artefactos notables, pero la etiqueta 'jpeg artifact' de Danbooru no parece funcionar eficazmente. Para abordar este problema, se seleccionaron específicamente unas 30 imágenes típicas y visualmente notables como ejemplos negativos.

Se ha observado un fenómeno: Pony v6 y NoobAI tienden a generar un levantamiento triangular en las raíces de peinados con mechas laterales. En Danbooru, este levantamiento a veces se etiqueta como 'hair intakes' o 'curtained hair', pero Pony aplica esta estructura a cada personaje. Esta es una razón clave por la que los peinados generados por Pony a menudo no coinciden con el diseño previsto durante el entrenamiento de personajes. Se observó un problema similar con NoobAI. Mi suposición es que esta característica está presente en un conjunto de datos fuera de Danbooru y no fue etiquetada correctamente.

Las imágenes en el conjunto de datos fueron filtradas, y aproximadamente dos tercios fueron correctamente anotadas. Actualmente, añadir 'hair intakes' en el prompt podría en cierta medida aliviar este problema, pero aún no he encontrado una solución completa.

数据集扩充到2154张图。其中作为主要训练目标的pony图片约1000张。

虽然V-pred模型也能使用基于Eps-pred技术的模型训练的lora,但是生成质量会大打折扣。这个版本将会分别在两个不同类型的模型上训练。

noobAI近期版本有比较明显的伪影,但是danbooru上的“jpeg artifact”并没有起作用。因此专门针对这个问题选择了约30张较为典型的、肉眼可见的图片作为负面案例。

观察到一个现象:pony v6和noobAI在生成有侧发的发型时,倾向于在发根处生成一个三角形的翘起。在danbooru里,这种翘起有时会被标注为“hair intakes”和“curtained hair”,但是pony会给每一个角色都套上这样的结构。这也是pony训练角色时,发型训练不像的一个重要原因。noob也观察到了类似的现象,我的猜测是danbooru以外的某个训练集大量存在这个特征,但没有对这个特征进行正确标注。

对数据集里的图片进行了筛选,其中约2/3的图片进行了正确的标注。现在,在prompt里写上“hair intakes”可能可以一定程度上减轻这个现象,但是我还没有找到根治这个毛病的办法。

v4:

Optimización parcial de las etiquetas del conjunto de datos. Entrenado basado en NoobAI Epsilon-pred v1.

Los modelos basados en Pony generan con fuerte tendencia pendientes, pendientes de oreja y otros accesorios en las orejas, a veces arruinando la estructura de la oreja de los personajes. Reorganicé las etiquetas relacionadas, recorté y edité manualmente algunas imágenes del conjunto de datos con problemas estructurales menores, y eliminé fotos demasiado difíciles de corregir.

对数据集的标注方式进行了部分优化。基于NoobAI Epsilon-pred v1训练。

Pony系模型有很强烈的生成耳环、耳钉以其他类型的耳部饰品的倾向,有时还会破坏人物耳部的结构。对相关的标注进行了整理。剪裁、手工修改了数据集中一部分结构错误不严重的图,剔除了一些太难修改的图片。

v3:

El conjunto de datos se extendió a 1429 imágenes, incluyendo ejemplos con etiquetas positivas y negativas.

774 de las imágenes son del estilo más "deseado".

Entrenado en Illustrious v0.1.

数据集扩展到了1429张图片,包括了正反两种例子。

其中774张是训练的目标风格。

基于Illustrious v0.1训练。

v2:

Se amplió el conjunto de datos a 374 imágenes. Use etiquetas de calidad y etiquetas estéticas que vienen con los modelos para controlar la calidad de generación.

训练数据集扩展到了374张。尝试使用模型自带的质量提示词来稳定生成质量。

v1:

Entrenado con 224 imágenes de Civitai, 393 imágenes para regularización.

Se entrenaron 2 versiones basadas en Animagine v3.1 y Pony v6.

训练了C站上224张图片,393张正则数据集。

有Animagine v3.1和Pony v6两个版本。

versión prueba 4:

Está un poco subajustado pero aún funciona. Encontré que esas etiquetas de calidad y etiquetas auténticas (best quality, masterpiece, very aesthetic, ...) con las que se entrenó Animagine v3.1 pueden cambiar el estilo artístico generado por este checkpoint. Se corregirá en la próxima versión de prueba.

有些欠拟合但是目前是有效的。我发现Animagine v3.1自带的质量控制词和美学提示词会改变生成图片的画风,所以这个实验版本需要不填写质量词。下一版会修复。

Anterior
Void Spectrum - Estilo Arte Conceptual LoRa - v1.0
Siguiente
Nevolution XL/IL - v2-anim

Detalles del Modelo

Tipo de modelo

LORA

Modelo base

Illustrious

Versión del modelo

v3_illu0.1

Hash del modelo

06f1d406c0

Discusión

Por favor log in para dejar un comentario.