modelos/Pony: Obras del Pueblo v1-v6 - v4_noobEv1.0

Pony: Obras del Pueblo v1-v6 - v4_noobEv1.0

|
7/15/2025
|
1:26:46 AM
| Discussion|
0
Chica de anime con corte bob corto naranja sonriendo mientras está sentada sobre el césped, vestida con un vestido negro, zapatillas rosas y una linda bolsa en forma de gato, con un cielo azul claro y fondo de paisaje urbano.
Perfil lateral de una persona que lleva un casco de caballero metálico azul detallado con iluminación cinematográfica dramática y un fondo oscuro difuminado.
Imagen fotorrealista de una mujer androide con cabeza de robot sin rostro y extremidades metálicas sentada en una silla, usando tacones altos negros en un entorno cyberpunk y steampunk con iluminación cinematográfica.
Retrato fotorrealista de una chica werecat con cabello púrpura, ojos púrpuras y orejas de gato, acostada en una cama con sábanas blancas en un dormitorio cálido de San Valentín con una almohada en forma de corazón.
Plano medio fotorealista de una mujer android con extremidades de metal negro brillante y detalles mecánicos steampunk intrincados, iluminada con luz cinematográfica.
Primer plano de una chica asiática con gorro y bufanda de punto blanco, sosteniendo una taza de café al aire libre en una calle nevada con iluminación cinematográfica y fondo desenfocado.
Un joven cyberpunk con mohawk rojo patina en un hoverboard brillante sobre un paisaje urbano futurista al atardecer, con rascacielos y calles iluminadas con neón desde una perspectiva aérea.
Retrato de una chica tímida y nerd con cabello rizado castaño avellana, gafas deslizándose por su nariz, vistiendo un suéter blanco acogedor bajo una iluminación interior suave.
Un gran acorazado steampunk llega de manera dramática a una bahía de fantasía urbana bajo un cielo azul brillante con niños y habitantes del pueblo observando, iluminados por una iluminación dramática y neblina atmosférica.
Primer plano de las piernas robóticas de metal negro de una mujer androide que lleva tacones altos con articulaciones detalladas y un acabado brillante bajo iluminación cinematográfica.

Prompts Recomendados

masterpiece,best quality,very aesthetic

1girl, solo, full lower lip, narrow mouth, long hair, blue eyes, looking at viewer, upper body, masterpiece, best quality, very aesthetic

Prompts Negativos Recomendados

worst quality,low quality,displeasing

worst quality, low quality, displeasing

Parámetros Recomendados

samplers

Euler a

steps

25 - 30

cfg

6 - 7

clip skip

2

resolution

832x1216

Consejos

Para las versiones V3 y posteriores, usa etiquetas positivas como 'masterpiece', 'best quality' y 'very aesthetic'.

Los prompts negativos incluyen 'worst quality', 'low quality' y 'displeasing'.

Agregar 'hair intakes' en los prompts podría aliviar en cierta medida problemas con artefactos en peinados.

Las versiones anteriores a V2 no tienen palabras clave específicas; usa etiquetas de calidad con los modelos correspondientes.

Ten en cuenta que las etiquetas de calidad y estética de Animagine v3.1 pueden cambiar el estilo artístico generado por la LoRA.

Introducción 简介:

Un style LoCon entrenado con imágenes de un modelo basado en pony recogidas del sitio Civitai con "más colecciones" y "más reacciones".

这是一个训练自Civitai上点赞最多和收藏最多的pony系模型图片画风LoCon

Esta lora no pretende simular ningún estilo de artista o técnica específica. PUEDE reflejar el gusto comunitario y el atractivo visual de una imagen hasta cierto punto. Los estilos pueden cambiar sutilmente según diferentes indicaciones.

这个lora并不意于还原某个特定的画师画风或者绘画技巧。它在某种程度上可能反应了社区审美图片的视觉吸引力。 不同的提示词下可能会有微妙的画风变化。

Uso 使用方法:

Las versiones anteriores a V2 no tienen palabras clave específicas. Por favor, usa las etiquetas de calidad proporcionadas con el modelo correspondiente.

Para V3 y versiones posteriores, se entrenaron las siguientes etiquetas:

V2以前的版本没有特定触发词。请使用对应模型自带的质量提示词。

对于v3及后续版本,训练了以下标签:

positivo:

masterpiece, best quality, very aesthetic

negativo:

worst quality, low quality, displeasing

Puedes editar las indicaciones en base a esto.

Generación de Datos 数据版本:

v6:

Se añadieron más de 500 imágenes nuevas, algunas seleccionadas de Flux. Eliminé algunas imágenes antiguas que consideré de menor calidad.

El número total de imágenes en el conjunto de datos ahora supera las 3,000, con más de 20 conceptos mejorados/editados manualmente a lo largo de 6 versiones del conjunto.

También se incrementó el rango del modelo.

新添加了500+张图片其中有一部分选自flux生成的图像。删除了一部分我认为品质不佳的旧图片。

现在总的图片数超过了3000,6个版本的数据总共手动增强/修正了20多条概念。

增加了模型的rank。

v5.9:

El desempeño del modelo no es el esperado, pero creo que las imágenes en el conjunto de datos de entrenamiento están bien. Planeo ajustar manualmente las etiquetas y ver cómo cambian los resultados.

模型效果不如预期,但是我觉得训练集的图片本身应该没什么问题。打算先手动修正tag看看效果。

Actualización 2025/1/3:

Actualicé manualmente algunas etiquetas, pero parecen no estar relacionadas con brillo y colores. Se supone que podría estar relacionado con el offset de ruido.

手动更新了一部分标签,但是它们和明暗色彩无甚干系。暂时猜测可能和noise offset有关。

v5:

El conjunto de datos se amplió a 2,154 imágenes, con aproximadamente 1,000 imágenes de pony como objetivo principal de entrenamiento.

Aunque los modelos V-pred pueden usar LoRA entrenados en modelos basados en Eps-pred, la calidad de salida disminuye significativamente. Esta versión será entrenada por separado en dos tipos diferentes de modelos.

Las versiones recientes de NoobAI muestran artefactos notables, pero la etiqueta 'jpeg artifact' de Danbooru no parece funcionar eficazmente. Para abordar esto, se seleccionaron específicamente unas 30 imágenes típicas y visualmente notables como ejemplos negativos.

Se ha observado un fenómeno: Pony v6 y NoobAI tienden a generar un levantamiento triangular en la raíz de peinados con mechones laterales. En Danbooru, este levantamiento a veces se etiqueta como 'hair intakes' o 'curtained hair', pero Pony aplica esta estructura a cada personaje. Esta es una razón clave por la que los peinados generados por Pony a menudo no coinciden con el diseño previsto durante el entrenamiento de personajes. Se observó un problema similar con NoobAI. Supongo que esta característica es común en un conjunto de datos fuera de Danbooru y no fue correctamente etiquetada.

Las imágenes en el conjunto fueron filtradas y alrededor de dos tercios fueron correctamente anotadas. Actualmente, agregar 'hair intakes' en la indicación podría aliviar en cierta medida este problema, pero no he encontrado una solución completa todavía.

数据集扩充到2154张图。其中作为主要训练目标的pony图片约1000张。

虽然V-pred模型也能使用基于Eps-pred技术的模型训练的lora,但是生成质量会大打折扣。这个版本将会分别在两个不同类型的模型上训练。

noobAI近期版本有比较明显的伪影,但是danbooru上的“jpeg artifact”并没有起作用。因此专门针对这个问题选择了约30张较为典型的、肉眼可见的图片作为负面案例。

观察到一个现象:pony v6和noobAI在生成有侧发的发型时,倾向于在发根处生成一个三角形的翘起。在danbooru里,这种翘起有时会被标注为“hair intakes”和“curtained hair”,但是pony会给每一个角色都套上这样的结构。这也是pony训练角色时,发型训练不像的一个重要原因。noob也观察到了类似的现象,我的猜测是danbooru以外的某个训练集大量存在这个特征,但没有对这个特征进行正确标注。

对数据集里的图片进行了筛选,其中约2/3的图片进行了正确的标注。现在,在prompt里写上“hair intakes”可能可以一定程度上减轻这个现象,但是我还没有找到根治这个毛病的办法。

v4:

Se optimizó parcialmente la etiquetación del conjunto de datos. Entrenado basado en NoobAI Epsilon-pred v1.

Los modelos basados en Pony tienden fuertemente a generar aretes, perforaciones de oreja y otro tipo de accesorios, a veces perjudicando la estructura de la oreja de los personajes. Reorganicé las etiquetas relacionadas, recorté y edité manualmente algunas imágenes del conjunto con problemas estructurales menores, y eliminé aquellas que eran demasiado difíciles de corregir.

对数据集的标注方式进行了部分优化。基于NoobAI Epsilon-pred v1训练。

Pony系模型有很强烈的生成耳环、耳钉以其他类型的耳部饰品的倾向,有时还会破坏人物耳部的结构。对相关的标注进行了整理。剪裁、手工修改了数据集中一部分结构错误不严重的图,剔除了一些太难修改的图片。

v3:

El conjunto de datos se extendió a 1429 imágenes, incluyendo ejemplos con etiquetas positivas y negativas.

774 de las imágenes son del estilo más "deseado".

Entrenado en Illustrious v0.1.

数据集扩展到了1429张图片,包括了正反两种例子。

其中774张是训练的目标风格。

基于Illustrious v0.1训练。

v2:

Conjunto de datos extendido a 374 imágenes. Usa las etiquetas de calidad y estéticas que vienen con los modelos para controlar la calidad de la generación.

训练数据集扩展到了374张。尝试使用模型自带的质量提示词来稳定生成质量。

v1:

Entrenado con 224 imágenes de Civitai, 393 imágenes para regulación.

Entrenado dos versiones basado en Animagine v3.1 y Pony v6.

训练了C站上224张图片,393张正则数据集。

有Animagine v3.1和Pony v6两个版本。

ver. de prueba 4:

Está un poco subentrenado pero aún funciona. Encontré que esas etiquetas de calidad y etiquetas auténticas (best quality, masterpiece, very aesthetic, ...) con las que se entrenó Animagine v3.1 pueden cambiar el estilo artístico generado por este checkpoint. Se corregirá en la próxima versión de prueba.

有些欠拟合但是目前是有效的。我发现Animagine v3.1自带的质量控制词和美学提示词会改变生成图片的画风,所以这个实验版本需要不填写质量词。下一版会修复。

Anterior
R754496 | Shiiro's Styles | Niji - v1.0
Siguiente
A-mix [Illustrious] - A - mix

Detalles del Modelo

Tipo de modelo

LORA

Modelo base

NoobAI

Versión del modelo

v4_noobEv1.0

Hash del modelo

bf047b0dc0

Discusión

Por favor log in para dejar un comentario.