modelos/HelloWorld XL de LEOSAM - HW5.0_Euler_a_Lightning

HelloWorld XL de LEOSAM - HW5.0_Euler_a_Lightning

|
11/30/2025
|
12:50:22 PM
| Discussion|
0
Primer plano de una guerrera de piel oscura con cabello corto que lleva armadura plateada y capa roja, de pie en un bosque al amanecer.

Prompts Recomendados

film grain texture,analog photography aesthetic,studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still

film grain texture, analog photography aesthetic

Prompts Negativos Recomendados

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

(worst quality, low resolution, bad hands), distorted, twisted, watermark, open mouth

Parámetros Recomendados

samplers

DPM++ 2M Karras, Euler a

steps

6 - 25

cfg

1 - 10

resolution

1024x1024, 832x1248, 896x1152, 1248x832, 1360x768, 768x1360, 900x1200

Parámetros Recomendados de Alta Resolución

upscaler

ESRGAN 4x, 8x_NMKD-Faces_160000_G

upscale

1.5

steps

8

denoising strength

0.3

Consejos

Usa la palabra disparadora "leogirl" con HelloWorld 1.0 para resultados estables.

Para fotos de cuerpo completo, utiliza el plugin ADetailer y reparación de alta resolución 1.5x para mejorar detalles.

Los prompts en lenguaje natural mejoran la salida de fotos realistas AI.

Ten cuidado con tonos cálidos en HelloWorld 5.0 debido a texturas de película mejoradas; agrega "studio light" o "sharp focus" en el prompt para mejores tonos de piel.

Evita prompts de estilos animados si no los deseas, pues se añadieron algunos datasets de ilustración en versión 5.0.

Usa los prompts negativos recomendados para mejorar precisión de extremidades, manos y calidad general de la imagen.

Aspectos Destacados de la Versión

Este modelo es una versión acelerada del modelo base HelloWorld SDXL, incorporando tecnologías de SDXL-Lightning. Equipado con el sampler Eular a y CFG 1, es capaz de generar imágenes en 6-8 pasos, tres veces más rápido que la versión original de SDXL. Además, comparado, sus resultados de imagen son superiores a las versiones LCM o Turbo, y se recomienda ampliamente que todos lo prueben y usen.

Los parámetros recomendados para generar imágenes con este modelo son:

Sampler: Eular a (¡Importante! El modelo está adaptado específicamente para Eular a, otros samplers pueden no dar tan buenos resultados)

Escala CFG: 1

Pasos de muestreo: 8 pasos (6 a 8 pasos son aceptables)

Algoritmo Hires: ESRGAN 4x / 8x_NMKD-Faces_160000_G

Factor de ampliación Hires: 1.5x

Pasos Hires: 8 pasos

Fuerza de reducción de ruido Hires: 0.3

Patrocinadores del Creador

🖥️Bienvenido a probar la herramienta de código abierto GPT4V-Image-Captioner, desarrollada por mi amigo y yo. Ofrece instalación con un clic e integra funciones de precompresión de imágenes, etiquetado y estadísticas de etiquetas.

Recientemente, lanzamos la versión plugin webui de esta herramienta, ¡todos están invitados a usarla!

🖥️Bienvenido a probar la herramienta de código abierto GPT4V-Image-Captioner, desarrollada por mi amigo y yo. Ofrece una instalación con un clic e integra múltiples funciones incluyendo precompresión de imágenes, etiquetado de imágenes y estadísticas de etiquetas. Recientemente, también lanzamos la versión plugin webui de esta herramienta, ¡todos están invitados a usarla!

🌍欢迎加入QQ群"兔狲·AIGC梦工北厂",群号 :780132897 ;"兔狲·AIGC梦工南厂",群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1

📖Actualización HelloWorld 7.0 - 13 de junio de 2024

Resumen en una frase: HelloWorld 7.0 es una versión optimizada de forma iterativa, con el mejor desempeño corporal de toda la serie, y un mayor alcance conceptual y riqueza de detalles.

Detalles de la actualización:

  1. Con la adición de imágenes negativas para entrenamiento, el fortalecimiento del entrenamiento de poses y la optimización del modelo clip, se mejoró la precisión de extremidades y manos respecto a versiones anteriores. Las palabras recomendadas para prompts negativos son: "bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality".

  2. Se extrajo el LoRA afinado del modelo oficial SPO e incorporó en HelloWorld 7.0. SPO mejora el método DPO; el modelo base SPO logra mejor rendimiento que DPO XL y el modelo base SDXL original. SPO LoRA puede potenciar detalles, contraste y embellecer imágenes. Gracias al equipo técnico detrás de SPO.

  3. Se continuó ampliando el alcance conceptual del conjunto de entrenamiento, pero se optimizó y depuró (afinar con conjuntos grandes es costoso, y H800 está difícil de alquilar, no se puede costear mucho tiempo local de entrenamiento). El conjunto total actual tiene 20,821 imágenes. La distribución de resolución es:

    (832, 1248) - Conteo: 7128
    (896, 1152) - Conteo: 6250
    (1248, 832) - Conteo: 2402
    (1024, 1024) - Conteo: 1639
    (1360, 768) - Conteo: 928
    (1152, 896) - Conteo: 870
    (768, 1360) - Conteo: 432
    (960, 1088) - Conteo: 506
    (992, 1056) - Conteo: 162
    (1088, 960) - Conteo: 140
    (704, 1472) - Conteo: 120
    (1056, 992) - Conteo: 122
    (1472, 704) - Conteo: 115
    (1632, 640) - Conteo: 75
    (640, 1632) - Conteo: 12
  4. Se utilizó GPT4O para re-etiquetar todos los datasets. Esta vez se empleó un etiquetado estructurado: "descripción resumen en una frase + múltiples etiquetas de elementos en la imagen + inspirado por XXX + palabras descriptivas de calidad estética", divididas en cinco niveles: peor calidad, baja calidad, calidad media, mejor calidad y obra maestra. Un ejemplo típico es:

    arte conceptual con una mano humana envuelta en cintas rojas y beige, aislada sobre fondo claro liso, estilo realista, esquema de colores minimalista, texturas suaves, estética alargada y surrealista, inspirado en obras surrealistas de salvador dalí, obra maestra

Las listas de "Palabras de Etiquetado de Alta Frecuencia" y "Estilos Artísticos de Alta Frecuencia" relacionadas con "inspirado por XXX" para la versión 7.0 de HelloWorld solo se proporcionarán a usuarios con licencia comercial. Socios con autorización previa para modelos HelloWorld XL, contáctenme para obtenerlas gratis si falta algo.

Los usuarios pueden consultar la Lista de Palabras de Etiquetado de Alta Frecuencia de HelloWorld 6.0. Además, he proporcionado más de 150 imágenes de ejemplo de alta calidad de HelloWorld 7.0 en la galería para referencia. ¡La creación del modelo no es fácil, gracias a todos los jugadores por su comprensión y apoyo!

📖Actualización HelloWorld 6.0 - 20 de abril de 2024

LEOSAM HelloWorld 6.0 Lista Top 250 Palabras de Etiquetado de Alta Frecuencia

Gracias por su paciencia. He estado buscando empleo recientemente, lo que retrasó algo las actualizaciones de HelloWorld. Los principales cambios en la versión 6.0 son:

  • HelloWorld 6.0 es una mejora iterativa basada en la versión 5.0. Según mis pruebas, el realismo no difiere mucho de la versión 5.0. La mayor ventaja de 6.0 es su mayor cobertura de conceptos en el conjunto de entrenamiento. Según comentarios, se mejoraron temas en surrealismo, boudoir, fotos grupales, máscaras, origami, renders 3D, autos, dragones y fotografía de maternidad. Algunos ejemplos están en las ilustraciones.

  • HolaWorld 6.0 incluye intencionalmente algunas imágenes de baja calidad para mejorar la respuesta del modelo a prompts negativos. Se recomienda usar en negativos: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".

  • El cuerpo principal del conjunto HelloWorld 6.0 usa etiquetado GPT4v. Para imágenes no etiquetables con GPT4v, se usa cogVQA guiado por blip2-opt-6.7b. El estilo lingüístico de estas etiquetas multimodales difiere mucho del etiquetador tradicional WD1.4. Para facilitar activar conceptos diferentes, compilé las 250 palabras de etiquetado más frecuentes en el conjunto HelloWorld 6.0. Puedes verlas en este documento.

Finalmente, aunque SD3 está por ser lanzado, seguiré actualizando hasta HelloWorld XL 7.0, esperando lograr grandes mejoras en esa versión.

📖Presentación 2024.2.22 del modelo "HW5.0_Euler_a_Lightning"

Este modelo es una versión acelerada del modelo base HelloWorld SDXL, incorporando tecnologías de SDXL-Lightning. Equipado con el sampler Eular a y CFG 1, es capaz de generar imágenes en 6-8 pasos, tres veces más rápido que la versión original de SDXL. Además, comparado, sus resultados de imagen son superiores a las versiones LCM o Turbo.

Los parámetros recomendados para generar imágenes con este modelo son:

Sampler: Eular a (¡Importante! El modelo está adaptado específicamente para Eular a, otros samplers pueden no dar tan buenos resultados)

Escala CFG: 1

Pasos de muestreo: 8 pasos (6 a 8 pasos son aceptables)

Algoritmo Hires: ESRGAN 4x / 8x_NMKD-Faces_160000_G

Factor de ampliación Hires: 1.5x

Pasos Hires: 8 pasos

Fuerza de reducción de ruido Hires: 0.3

📖Presentación 2024.2.11 de "HelloWorld 5.0 GPT4V"

HelloWorld 5.0 es la actualización más importante de la serie HelloWorld, etiquetada con GPT-4v, y ha sufrido una gran afinación en áreas como ciencia ficción, animales, arquitectura e ilustración.

Las pruebas comparativas muestran mejoras en esta versión incluyen:

1. Posturas de personajes y composiciones de imagen más variadas y dinámicas, creando imágenes visualmente atractivas;

2. El conjunto de datos de películas ha sido ampliamente entrenado. Aunque la textura de película era débil de la versión 2.0 a la 4.0, muchos fans extrañaban el estilo leogirl de la versión 1.0. Por eso, esta actualización fortaleció la textura de película sin afectar otras cualidades fotográficas. La textura se puede activar con frases como textura de grano de película y estética de fotografía analógica;

3. Mayor expresividad en temas de ciencia ficción, suspenso y animales, con mechas y otros sujetos con sensación más diseñada. Animales como leopardo de las nieves, panda rojo, panda gigante, tigre, gato de Pallas y gatos y perros domésticos lucen más realistas;

4. Gracias al etiquetado GPT, la adherencia al prompt y la precisión conceptual mejoraron aún más.

Sin embargo, las desventajas de esta versión incluyen:

1. Al ser una actualización considerable, la tasa de error en extremidades puede aumentar ligeramente, algo normal al salir de la zona cómoda hacia nuevas optimizaciones. Versiones previas se enfocaron mucho en extremidades; la nueva tuvo menos tiempo en eso. No obstante, la precisión en extremidades de esta versión es al menos mejor que la 1.0, y seguiré mejorando.

2. Debido a la textura de película reforzada, aunque el etiquetado GPT es lo más preciso posible, puede haber un tono cálido predeterminado inevitable. Se pueden usar prompts como studio light o sharp focus para conseguir imágenes de estudio HD de calidad, y con buen uso de prompts, la salida puede tener mejores tonos de piel y atractivo visual que versiones anteriores.

3. Esta versión incluye más imágenes de personajes de cuerpo completo para realzar el efecto corporal completo; por eso el modelo puede generar escenas más amplias si no se indica composición concreta. Actualmente, los detalles faciales en resolución 1024 en cuerpo completo pueden ser menos nítidos que en fotos de medio cuerpo o primer plano. Esto puede mejorarse con adetailer y un zoom 1.5x a 0.3 intensidad, o usando prompts que eviten cuerpo completo.

4. Dado que se añadieron algunos datasets de alta calidad ilustrativos, hay posibilidad que prompts relacionados con estilos animados produzcan imágenes animadas. Si esto preocupa, ajuste sus prompts.

Estas son las principales novedades de esta versión. Entrenar el modelo base SDXL es difícil y, cuando el conjunto se acerca a diez mil imágenes, el costo por etiquetado y entrenamiento supera los 300 USD. Invito a todos a usar el modelo y agradezco cualquier retroalimentación. Si les gusta, agradecería mucho que lo difundieran.

📖Presentación 2024.1.31 de "HelloWorld 4.0"

HelloWorld 4.0 es una versión progresiva de transición del etiquetado con blip+clip a etiquetado con GPT4V. Inicialmente entrené un modelo puro de etiquetado GPT4V, luego se fusionó con gran proporción de HelloWorld 3.2 y 0.05 proporción de Juggernaut XL (para ajustar el tono de piel). La nueva versión muestra mejoras en cumplimiento de prompts y cobertura conceptual comparado con 3.2.

El nuevo conjunto de entrenamiento para etiquetado GPT4V se duplicó de 4000 imágenes en la serie helloworld3 a 8000 imágenes, cubriendo no solo retratos sino también animales, arquitectura, naturaleza, comida, ilustraciones, etc. Sin embargo, la versión pura GPT4V enfrentó sobreajuste, preliminarmente por el doble de imágenes. Se planea optimizar para incluir muchos conceptos no retrato asegurando buen entrenamiento de retratos. Por ahora, se usa una fusión de versiones nueva y vieja para afinar y mantener transición suave, por lo que las ventajas del etiquetado GPT4V aún no se notan mucho pero se evidenciarán más en futuras versiones 5 y 6.

📖Presentación 2024.1.5 de "HelloWorld 3.2"

La versión 3.2 es una iteración optimizada con tecnología DPO, y comparada con la versión 3.0, hay optimizaciones en tono de piel y precisión de extremidades, aunque no tan significativas. Por eso se marcó como 3.2 y no 4.0.

📖Presentación 2023.12.15 de "HelloWorld 3.0"

  1. La nueva versión amplió el conjunto de entrenamiento, mejorando la capacidad del modelo para expresarse en diferentes estilos artísticos, incluyendo ciencia ficción y arte.

  2. Integró un LoCon de mejora de calidad propio (creado con tecnología slider), para mejorar la textura de imagen y aliviar problemas de distorsión en dedos y extremidades.

📖Presentación 2023.11.17 de "HelloWorld 2.0"

Gracias a todos por su paciencia. Tras superar varios desafíos, la versión HelloWorld 2.0 está finalmente lista en un estado con el que estoy satisfecho. Las principales diferencias con HelloWorld 1.0 son:

  1. HelloWorld 2.0 ya no requiere palabras clave disparadoras y los resultados tienen calidad comparable a la versión 1.0 con estas palabras. La palabra disparadora "leogirl" en 1.0 se asociaba mucho con asiáticos orientales. Tras la eliminación de palabras disparadoras, aunque términos como "1girl" tienden a generar retratos asiáticos sin especificar raza, ahora puedes especificar la raza usando términos de nacionalidad, color de piel, etc. Por ejemplo, efectos disparadores para "Chinese", "Russian", "Iranian", "Jamaican", "Kenyan", "dark-skinned", "pale-skinned", etc. están listados abajo.

    También puedes obtener estilos distintos de personajes escribiendo nombres de personas de diferentes países y géneros en el prompt, como Han Meimei (China), Sophie Martin (Francia), Priya Patel (India), Fatima Al-Hassan (Arabia), Wanjiru Mwangi (Kenia). Estos son solo ejemplos, hay muchas formas y prompts para explorar y compartir.

  2. HelloWorld 2.0 equilibró calidad/color y ofrece más opciones de estilo. La versión 1.0 con "leogirl" tendía a texturas de película fuertes. HelloWorld 2.0 ya no está atado a la textura de película y se puede personalizar con prompts relacionados a calidad. Algunos prompts probados y efectivos incluyen:

    sesión de moda alta gama, foto de introducción de producto, maquillaje coreano popular, aegyo sal, Foto Nítida y de Alta Calidad, luz de estudio, foto de formato medio, fotografía Mamiya, película analógica, Retrato Medio con Luz Suave, imagen real, fotografía editorial refinada, foto sin procesar, foto real, Foto Escaneada, fotograma de película

    Los efectos de color de estos prompts son:

  3. El conjunto de entrenamiento para HelloWorld 2.0 aumentó significativamente la proporción de fotos de cuerpo completo para mejorar los efectos de SDXL generando retratos de cuerpo completo y vista a distancia. Aunque mejor que versión 1.0, se recomienda usar "adetailer" al generar fotos de cuerpo completo. Y para usuarios con suficiente memoria de video (24g), se recomienda reparar la imagen con resolución aumentada 1.5x, lo que mejora los detalles faciales.

📖Presentación 2023.8.29 "HelloWorld" modelo base SDXL

Recordatorio especial: Al usar el modelo HelloWorld 1.0, recuerda añadir la palabra disparadora "leogirl".

Diferente del modelo base SD1.5 “MoonFilm”, “HelloWorld” es una serie nueva realista de modelos base SDXL. Para que más usuarios conozcan HelloWorld, mantuve el enlace del modelo original Moonfilm. Se puede ver como continuación espiritual de Moonfilm en la nueva plataforma SDXL, pero HelloWorld busca más que realismo y calidad de película en retratos. Gracias a la gran información y capacidad de texto de SDXL comparado con SD1.5, HelloWorld es un modelo base que busca representar realísticamente todo, o dicho de otro modo, construir un mundo fotográfico virtual con HelloWorld.

El modelo base realista de SD1.5 está bastante maduro y es improbable que mejore mucho. Salvo breakthroughs tecnológicos en SD1.5, la serie Moonfilm & MoonMix básicamente dejará de actualizarse. Me enfocaré principalmente en HelloWorld SDXL. La versión 1.0 ya está disponible y la 2.0 se desarrolla urgentemente, esperándose actualización en septiembre.

Como modelo SDXL nuevo, HelloWorld tiene tres diferencias frente a modelos SD1.5 tradicionales:

  1. A diferencia de bases SD1.5 que no incluyen palabras disparadoras, usa la palabra "leogirl" en HelloWorld 1.0 para activar mejor el conjunto de entrenamiento.

  2. Soporta salida directa a resolución 1024*1024 píxeles, sin necesidad de ampliación. La calidad de primer plano directo no es inferior a SD1.5 pero tiene fallas en retratos a distancia. Se recomienda usar complemento ADetailer para corregir caras lejanas.

  3. SDXL permite salida más fácil con prompts en lenguaje natural simple. Se recomienda probar más prompts naturales para mejores fotos realistas generadas.

Tras varias pruebas, los parámetros recomendados son:

  • Pasos ≥ 25

  • Sampler: DPM++ 2M Karras

  • Escala CFG: 10

  • Tamaño ≥ 1024x1024

  • ADetailer: activado

Todos son bienvenidos a probar HelloWorld y aportar feedback. ¡Sus valiosas opiniones serán muy importantes para mejorar el modelo!

La serie HelloWorld de modelos (en adelante "el Modelo") ha sido creada por mí (en adelante "el Propietario") con ayuda de la plataforma LiblibAI. Re-publicar el Modelo en plataformas fuera de LiblibAI y Civitai no está autorizado por el Propietario.

El Propietario permite usar imágenes generadas por el Modelo con fines educativos o informativos no comerciales, sin costo, bajo condición de:

- Usuarios cumplan leyes vigentes y no infrinjan derechos del Modelo ni terceros.

- Atribuir claramente las imágenes como "creadas por el modelo base HelloWorld de LEOSAM".

Para cualquier uso comercial se requiere previo acuerdo de licencia comercial con el Propietario. Para consultas de licencia comercial y personalización, contactar al Propietario mediante su página principal.

El desarrollo y distribución gratuita del modelo SDXL representan esfuerzos importantes. El Propietario promete actualizaciones gratuitas continuas para entusiastas como muestra de agradecimiento por contribuciones a código abierto. Las colaboraciones comerciales son vitales para su progreso y refinamiento. Se agradece a todos los usuarios por su comprensión y apoyo.

El uso no autorizado puede violar leyes vigentes y tener consecuencias legales. El Propietario retiene derechos exclusivos de interpretación de esta declaración, regida por leyes aplicables.

Anterior
Big Centaur Lora XL - 0.5
Siguiente
Akira Mizutani Growth Academy (GA) [FLUX, Pony XL, SD 1.5] - v0.96

Detalles del Modelo

Tipo de modelo

Checkpoint

Modelo base

SDXL Lightning

Versión del modelo

HW5.0_Euler_a_Lightning

Hash del modelo

d5e0492911

Creador

Discusión

Por favor log in para dejar un comentario.

Imágenes por HelloWorld XL de LEOSAM - HW5.0_Euler_a_Lightning

Imágenes con modelo base

Imágenes con foto

Imágenes con fotorrealista

Imágenes con realista

Imágenes con mujer