modelos/LEOSAMs HelloWorld XL - HelloWorld XL 70

LEOSAMs HelloWorld XL - HelloWorld XL 70

5/20/2025

1:46:43 PM

Palabras Clave y Etiquetas Relacionadas

573f4a7d35,8ca0bade3c,modelo base,punto de control,leosam,leosams helloworld xl,foto,fotorrealista,real,realista,sdxl 1.0,mujer

Retrato espontáneo nocturno ultrarrealista de una mujer colombiana con fotografía de flash de relleno que muestra temas de deseo y anhelo.

Un tigre blanco con ojos azules y la boca abierta parece estar rugiendo entre la vegetación. Imagen generada por IA usando Stable Diffusion.

Una imagen generada por IA usando Stable Diffusion de un insecto hecho de agujas de pino y ramas descansando sobre una superficie nevada.

Un retrato impactante de una mujer rubia con labios rojos y maquillaje intenso, vistiendo un abrigo cálido, con un fondo desenfocado en un ambiente sombrío. Imagen generada por IA usando Stable Diffusion.

Mujer elegante con un vestido ornamental de fantasía y un tocado floral, creada usando Stable Diffusion.

Una cebra de pie sobre un témpano de hielo en un gran cuerpo de agua, rodeada por un paisaje ártico. Esta es una imagen generada por IA usando Stable Diffusion.

Imagen artística generada por IA usando Stable Diffusion que presenta la silueta de una mujer con una salpicadura colorida de pintura a su alrededor.

Un cachorro lindo generado por AI con una apariencia colorida y bioluminiscente, creado usando tecnología de stable diffusion.

Una imagen vibrante generada por IA de un paisaje urbano futurista usando Stable Diffusion, con rascacielos modernos y orgánicos con exuberante vegetación y árboles floridos y coloridos.

Imagen generada por AI usando Stable Diffusion de una mujer con cabello largo azul y acentos dorados, vistiendo un atuendo detallado en un entorno abstracto de fantasía con patrones de hojas y pintura fluida.

Un retrato detallado de una mujer con rasgos ciborg en cuello y rostro, creado usando Stable Diffusion.

Imagen generada por AI de una mujer fantástica con un vestido intrincado que presenta un paisaje encantado bajo un cielo estrellado, utilizando stable diffusion.

Prompts Recomendados

conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic

film grain texture

analog photography aesthetic

Prompts Negativos Recomendados

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality

Parámetros Recomendados

samplers

Restart

steps

cfg

resolution

832x1248

other models

LeosamHelloWorldV7 (573f4a7d35)

Consejos

Usa ADetailer para corregir caras lejanas.

Usa prompts sencillos en lenguaje natural para mejores fotos realistas generadas por IA.

Los retratos de alta calidad se pueden mejorar con ADetailer y arreglo Hires 1.5x con intensidad 0.3.

Aspectos Destacados de la Versión

Actualización HelloWorld 7.0 - 13 de junio de 2024

Resumen de actualización en una frase: HelloWorld 7.0 es una versión optimizada iterativamente, con el mejor rendimiento corporal de toda la serie, y con mayor alcance conceptual y riqueza de detalles.

Detalles de la actualización:

Al agregar imágenes negativas para entrenamiento, fortalecer el entrenamiento de poses y optimizar el modelo clip, se mejoró la precisión de las extremidades y manos del modelo en comparación con versiones anteriores. Las palabras recomendadas para el prompt negativo son: "mano mala, anatomía mala, peor calidad, imágenes generadas por IA, baja calidad, calidad promedio".
Se extrajo el LoRA ajustado del modelo oficial SPO y se incorporó a HelloWorld 7.0. SPO es una mejora adicional del método DPO. El modelo base SPO ofrece mejor rendimiento que el modelo base DPO XL y el modelo base original SDXL. El LoRA SPO puede mejorar los detalles y el contraste de las imágenes, además de embellecerlas. Gracias al equipo técnico detrás de SPO.
Se continuó ampliando el alcance conceptual del conjunto de entrenamiento, pero se optimizó y redujo el conjunto (afinar conjuntos grandes es muy costoso y alquilar H800 ha sido difícil recientemente, no se puede costear el tiempo local). Actualmente el conjunto total es de 20,821 imágenes. La distribución de resoluciones es la siguiente, y se recomienda usar varias resoluciones con mayor cantidad de imágenes para la salida:
```
(832, 1248) - Cantidad: 7128
(896, 1152) - Cantidad: 6250
(1248, 832) - Cantidad: 2402
(1024, 1024) - Cantidad: 1639
(1360, 768) - Cantidad: 928
(1152, 896) - Cantidad: 870
(768, 1360) - Cantidad: 432
(960, 1088) - Cantidad: 506
(992, 1056) - Cantidad: 162
(1088, 960) - Cantidad: 140
(704, 1472) - Cantidad: 120
(1056, 992) - Cantidad: 122
(1472, 704) - Cantidad: 115
(1632, 640) - Cantidad: 75
(640, 1632) - Cantidad: 12
```
Se utilizó GPT4O para re-etiquetar todos los conjuntos de datos. Esta vez se empleó un método de etiquetado estructurado con la estructura específica: "descripción resumen en una frase + múltiples etiquetas de elementos de imagen + inspirado en XXX + palabras de descripción de calidad estética", donde las palabras de calidad estética se dividen en cinco niveles: peor calidad, baja calidad, calidad promedio, mejor calidad y obra maestra. Un ejemplo típico de etiquetado es:
```
arte conceptual con una mano humana envuelta en cintas rojas y beige, aislada contra un fondo sencillo y claro, estilo realista, esquema de color minimalista, texturas suaves, estética elongada y surrealista, inspirado en las obras surrealistas de salvador dalí, obra maestra
```

La "Lista de Palabras de Etiquetado de Alta Frecuencia" y la "Lista de Estilos Artísticos de Alta Frecuencia" involucradas en Inspirado en XXX para la versión HelloWorld 7.0 solo estarán disponibles para usuarios con licencia comercial. Socios que hayan comprado la autorización del modelo de la serie Helloworld XL en el pasado, por favor contáctenme si falta algo para obtenerlo gratis.

Los jugadores pueden referirse a la Lista de Palabras de Etiquetado de Alta Frecuencia de HelloWorld 6.0. Además, he proporcionado más de 150 imágenes de ejemplo de alta calidad de HelloWorld 7.0 en la galería, que pueden usarse como referencia para las salidas de todos. Hacer modelos no es fácil, ¡gracias a los jugadores por su comprensión y tolerancia!

Patrocinadores del Creador

🖥️Bienvenido a probar el código abierto GPT4V-Image-Captioner, desarrollado por mi amigo y yo. Ofrece una instalación con un clic e integra múltiples funciones incluyendo precompresión de imágenes, etiquetado de imágenes y estadísticas de etiquetas. Recientemente, también lanzamos la versión plugin webui de esta herramienta, ¡todos están invitados a usarla!

🌍欢迎加入 QQ Grupo '兔狲·AIGC梦工北厂', número de grupo: 780132897; '兔狲·AIGC梦工南厂', número de grupo: 835297318 (respuesta para entrar: 兔狲). Grupo de Telegram "兔狲的SDXL百老汇", enlace:https://t.me/+KkflmfLTAdwzMzI1

🌍欢迎加入 QQ Grupo "兔狲·AIGC梦工北厂", número de grupo: 780132897; "兔狲·AIGC梦工南厂", número de grupo: 835297318 (respuesta para entrar: 兔狲). Grupo de Telegram "兔狲的SDXL百老汇", enlace: https://t.me/+KkflmfLTAdwzMzI1

📖Actualización HelloWorld 7.0 - 13 de junio de 2024

Detalles de la actualización:

Al agregar imágenes negativas para entrenamiento, fortalecer el entrenamiento de poses y optimizar el modelo clip, se mejoró la precisión de las extremidades y manos del modelo en comparación con versiones anteriores. Las palabras recomendadas para el prompt negativo son: "mano mala, anatomía mala, peor calidad, imágenes generadas por IA, baja calidad, calidad promedio".
Se extrajo el LoRA ajustado del modelo oficial SPO y se incorporó a HelloWorld 7.0. SPO es una mejora adicional del método DPO. El modelo base SPO ofrece mejor rendimiento que el modelo base DPO XL y el modelo base original SDXL. El LoRA SPO puede mejorar los detalles y el contraste de las imágenes, además de embellecerlas. Gracias al equipo técnico detrás de SPO.
Se continuó ampliando el alcance conceptual del conjunto de entrenamiento, pero se optimizó y redujo el conjunto (afinar conjuntos grandes es muy costoso y alquilar H800 ha sido difícil recientemente, no se puede costear el tiempo local). Actualmente el conjunto total es de 20,821 imágenes. La distribución de resoluciones es la siguiente, y se recomienda usar varias resoluciones con mayor cantidad de imágenes para la salida:
```
(832, 1248) - Cantidad: 7128
(896, 1152) - Cantidad: 6250
(1248, 832) - Cantidad: 2402
(1024, 1024) - Cantidad: 1639
(1360, 768) - Cantidad: 928
(1152, 896) - Cantidad: 870
(768, 1360) - Cantidad: 432
(960, 1088) - Cantidad: 506
(992, 1056) - Cantidad: 162
(1088, 960) - Cantidad: 140
(704, 1472) - Cantidad: 120
(1056, 992) - Cantidad: 122
(1472, 704) - Cantidad: 115
(1632, 640) - Cantidad: 75
(640, 1632) - Cantidad: 12
```
Se utilizó GPT4O para re-etiquetar todos los conjuntos de datos. Esta vez se empleó un método de etiquetado estructurado con la estructura específica: "descripción resumen en una frase + múltiples etiquetas de elementos de imagen + inspirado en XXX + palabras de descripción de calidad estética", donde las palabras de calidad estética se dividen en cinco niveles: peor calidad, baja calidad, calidad promedio, mejor calidad y obra maestra. Un ejemplo típico de etiquetado es:
```
arte conceptual con una mano humana envuelta en cintas rojas y beige, aislada contra un fondo sencillo y claro, estilo realista, esquema de color minimalista, texturas suaves, estética elongada y surrealista, inspirado en las obras surrealistas de salvador dalí, obra maestra
```

📖Actualización HelloWorld 6.0 - 20 de abril de 2024

LEOSAM HelloWorld 6.0 Las 250 Palabras de Etiquetado de Alta Frecuencia Principales

Gracias por su paciencia. He estado buscando trabajo recientemente, lo que causó algunos retrasos en las actualizaciones de HelloWorld. Aquí están las actualizaciones principales de la versión 6.0:

HelloWorld 6.0 es una mejora iterativa basada en la versión 5.0. Según mis pruebas, el realismo no cambia mucho respecto a la versión 5.0. La principal ventaja de la versión 6.0 está en su mayor cobertura de conceptos en el conjunto de entrenamiento. Según los comentarios, se han mejorado temas diversos como surrealismo, boudoir, fotos grupales, máscaras, origami, renders 3D, coches, dragones y fotografía de maternidad. Se proporcionan algunos ejemplos en las ilustraciones.
HelloWorld 6.0 incluye intencionadamente algunas imágenes de baja calidad en el entrenamiento para mejorar la respuesta del modelo a prompts negativos. Se recomienda usar en prompts negativos términos como: "baja calidad, artefactos jpeg, borroso, mal dibujado, feo, peor calidad".
El cuerpo principal del conjunto de entrenamiento HelloWorld 6.0 usa etiquetado GPT4v. Para las imágenes que GPT4v no puede etiquetar, se usa cogVQA guiado por blip2-opt-6.7b para el etiquetado. El estilo de lenguaje usado por estos modelos multimodales difiere mucho del etiquetador tradicional WD1.4. Para facilitar disparadores más precisos de diferentes conceptos en el conjunto, compilé las 250 palabras más frecuentes de etiquetado en HelloWorld 6.0. Puede consultarlas en este documento.

Finalmente, aunque SD3 está a punto de lanzarse, seguiré actualizando a HelloWorld XL 7.0, ¡esperando lograr mayores mejoras en la versión 7.0!

📖22.2.2024 Presentación de "HW5.0_Euler_a_Lightning"

Este modelo es una versión acelerada del modelo base HelloWorld SDXL, que incorpora tecnologías SDXL-Lightning. Equipado con el muestreador Eular a y CFG 1, puede generar imágenes en 6-8 pasos, lo que es tres veces más rápido que la versión original SDXL. Además, al comparar, sus resultados de imágenes son superiores a los de las versiones LCM o Turbo.

Los parámetros recomendados para generar imágenes con este modelo son:

Muestreador: Eular a (¡Importante! El modelo está especialmente adaptado a Eular a, otros muestreadores podrían no dar tan buenos resultados)

Escala CFG: 1

Pasos de muestreo: 8 pasos (6~8 pasos son aceptables)

Algoritmo Hires: ESRGAN 4x / 8x_NMKD-Faces_160000_G

Factor de aumento Hires: 1.5x

Pasos Hires: 8 pasos

Fuerza de eliminación de ruido Hires: 0.3

📖11.2.2024 Presentación de "HelloWorld 5.0 GPT4V"

HelloWorld 5.0 es la actualización más importante en la historia de la serie HelloWorld, etiquetada con GPT-4v, y ha pasado por afinaciones importantes en campos como ciencia ficción, animales, arquitectura e ilustración.

Las pruebas comparativas muestran que las mejoras de esta versión incluyen:

1. Poses de personajes y composiciones de imagen más variadas y dinámicas, creando imágenes visualmente atractivas;

2. El conjunto de datos de película ha sido ampliamente entrenado. Mientras que la textura de película era débil en las versiones 2.0 a 4.0, muchos fans extrañaban el estilo leogirl de la versión 1.0. Por eso, esta actualización ha fortalecido la textura de película sin comprometer otras cualidades fotográficas. La textura de película puede activarse con frases como textura de grano de película y estética de fotografía analógica;

3. Expresividad mejorada en temas como ciencia ficción, thriller y animales, con mechas y otros sujetos con sensación más diseñada. Animales como leopardo de las nieves, panda rojo, panda gigante, tigre, gato de Pallas y gatos y perros domésticos son más realistas;

4. Gracias al etiquetado GPT, la adherencia al prompt y la precisión conceptual mejoraron aún más.

Sin embargo, los inconvenientes incluyen:

1. Como esta es una actualización grande de afinación, la tasa de error en extremidades puede aumentar un poco, cosa normal al dejar la zona de confort hacia nuevas áreas. Versiones anteriores realizaron mucho testeo para mejorar extremidades, la nueva versión tuvo menos tiempo en ello. Aun así, la precisión de extremidades en esta versión es al menos mejor que la 1.0, y seguiré mejorando en futuras actualizaciones.

2. Debido a la textura de película reforzada, aunque el etiquetado GPT es lo más preciso posible, puede haber un tono cálido predeterminado en las imágenes. Pero se puede usar prompts como luz de estudio o enfoque nítido para obtener imágenes de calidad de estudio en alta definición, y bien usados pueden dar mejor tono de piel y atractivo visual que versiones anteriores.

3. Esta versión incluye más imágenes de personajes de cuerpo entero para mejorar efecto completo, por lo que el modelo puede generar escenas más amplias si no se dirige composición específica del personaje. Actualmente, los detalles faciales en tomas de cuerpo entero a resolución 1024 pueden ser menos nítidos que en tomas de medio cuerpo o cercanas. Esto puede mejorarse con adetailer y un arreglo Hires 1.5x con intensidad 0.3, o usando prompts especificando composición para evitar imágenes de cuerpo entero.

4. Al añadirse algunos conjuntos de datos de ilustración de alta calidad, existe la posibilidad de que prompts relacionados con estilo animado generen imágenes animadas. Si esto es indeseado, ajuste sus prompts.

Estas son las actualizaciones principales de esta versión. Entrenar el modelo base SDXL es difícil, y cuando el conjunto de entrenamiento alcanza cerca de diez mil imágenes, el costo de etiquetado y entrenamiento por modelo supera los 300 USD. ¡Invito a todos a usar el modelo y agradecería cualquier retroalimentación! Si les gusta, agradecería mucho que ayudaran a compartirlo.

📖31.1.2024 Presentación "HelloWorld 4.0"

HelloWorld 4.0 es una versión transicional progresiva del etiquetado con blip+clip al etiquetado con GPT4V. Inicialmente entrené un modelo de etiquetado GPT4V puro, luego lo fusioné con una gran parte de HelloWorld 3.2 y un 0.05 del Juggernaut XL (para ajustar el tono de piel). La nueva versión mostró mejoras en cumplimiento de prompts y cobertura conceptual comparada con la 3.2.

El nuevo conjunto de entrenamiento de etiquetado GPT4V se duplicó de 4000 imágenes en la serie helloworld3 a 8000 imágenes, cubriendo no solo retratos sino también animales, arquitectura, naturaleza, comida, ilustraciones y más. Sin embargo, la versión GPT4V pura tuvo un problema de sobreajuste, preliminarmente atribuido al aumento del número de imágenes. Uno de los siguientes pasos de optimización iterativa es lograr incluir tantos conceptos no retratos como sea posible asegurando suficiente entrenamiento de retratos. En esta etapa, se usó una fusión de versiones nueva y vieja para afinación asegurando transición suave, por lo que las ventajas del conjunto ampliado y etiquetado GPT4V no son muy perceptibles aún. Estas ventajas serán más evidentes en generaciones 5 y 6 del modelo.

📖5.1.2024 Presentación "HelloWorld 3.2"

La versión 3.2 es una iteración optimizada con DPO tecnología, y comparada con la 3.0, hay optimizaciones en tono de piel y precisión en extremidades, pero no son significativas. Por eso esta versión se etiquetó como 3.2 y no 4.0.

📖15.12.2023 Presentación "HelloWorld 3.0"

La nueva versión amplió el conjunto de entrenamiento, mejorando la capacidad del modelo para expresarse en diversos estilos artísticos, incluyendo ciencia ficción y arte.
Se integró un LoCon de mejora de calidad hecho a mano (creado con tecnología slider), para mejorar la textura y aliviar problemas de distorsión en dedos y extremidades.

📖17.11.2023 Presentación "HelloWorld 2.0"

Gracias a todos por la paciencia. Tras superar varios retos, la versión HelloWorld 2.0 está finalmente lista para presentarse en un estado satisfactorio. Las diferencias principales entre HelloWorld 2.0 y 1.0 son:

HelloWorld 2.0 ya no requiere palabras clave, y los resultados tienen calidad comparable a 1.0 con palabras clave. La palabra clave "leogirl" en 1.0 estaba muy asociada a asiáticos orientales. Tras cancelar las palabras clave, palabras como "1girl" seguirán probablemente generando retratos asiáticos sin especificar raza, pero ahora puedes especificar raza usando palabras como nacionalidad, color de piel, etc. Por ejemplo, los efectos de disparador para palabras como "chino", "ruso", "iraní", "jamaicano", "keniano", "piel oscura", "piel clara", etc., se listan abajo.
También puedes obtener estilos diferentes de personajes escribiendo en el prompt nombres de personas de diferentes países y géneros, como Han Meimei (China), Sophie Martin (Francia), Priya Patel (India), Fatima Al-Hassan (Árabe), Wanjiru Mwangi (Kenya). Los prompts anteriores son solo ejemplos, hay muchos prompts y formas de jugar, ¡te invitamos a explorar y compartir!
HelloWorld 2.0 equilibró calidad/color y ofrece más opciones de estilo. La versión 1.0, usada con "leogirl", tendería a producir imágenes con textura de película fuerte. HelloWorld 2.0 ya no está ligado a textura de película y se puede personalizar con prompts relacionados con calidad. Algunos prompts probados que funcionan bien incluyen:
sesión de fotos de alta moda, foto presentación de producto, maquillaje coreano popular, aegyo sal, Foto Nítida de Alta Calidad, luz de estudio, foto en formato medio, fotografía Mamiya, película analógica, Retrato Medio con Luz Suave, imagen real, fotografía editorial refinada, foto en crudo, foto real, Foto Escaneada, fotograma de película
Los efectos de color de estos prompts son los siguientes:
El conjunto de entrenamiento de HelloWorld 2.0 aumentó significativamente la proporción de fotos de cuerpo entero para mejorar los efectos de SDXL en generación de retratos de cuerpo completo y vistas lejanas. Aunque mejoró respecto a 1.0, se recomienda fuertemente usar 'adetailer' al generar fotos de cuerpo completo. Además, para usuarios con suficiente memoria de video (24g), se recomienda realizar reparación de alta resolución 1.5x en la imagen, mejorando notablemente detalles faciales.

📖29.8.2023 Presentación del modelo base "HelloWorld" SDXL

Recordatorio especial: Al usar el modelo HelloWorld 1.0, recuerda añadir la palabra clave "leogirl".

Diferente del modelo base SD1.5 “MoonFilm”, “HelloWorld” es una nueva serie realista de modelo base SDXL. Para que más usuarios descubran HelloWorld, he conservado el enlace original de Moonfilm. Se puede percibir como una continuación espiritual de Moonfilm en la nueva plataforma SDXL, pero HelloWorld pretende lograr más que realismo y calidad tipo película en retratos. Gracias a la mucho mayor cantidad de información y capacidad de comprensión de texto de SDXL comparado con SD1.5, HelloWorld es un modelo base que busca representar de forma realista todas las cosas, o dicho de otro modo, espero construir gradualmente un mundo de fotografía virtual usando HelloWorld.

El modelo base realista SD1.5 ha madurado bastante y es poco probable que tenga mejoras significativas. A menos que haya un avance tecnológico para la plataforma SD1.5, las series Moonfilm & MoonMix básicamente dejarán de actualizarse. Voy a dedicar mi principal energía al desarrollo del modelo grande HelloWorld SDXL. La versión 1.0 está disponible para descargar y la versión 2.0 se desarrolla con urgencia, prevista para actualizarse a inicios de septiembre.

Como nuevo modelo SDXL, HelloWorld tiene tres diferencias con modelos SD1.5 tradicionales:

A diferencia de modelos base SD1.5, que no usan palabras clave, por favor recuerda usar la palabra clave "leogirl" al usar HelloWorld 1.0. Esto asegura que el modelo SDXL active el efecto conjunto de entrenamiento de forma más estable.
El modelo HelloWorld soporta salida directa en resolución 1024*1024 píxeles, eliminando necesidad de ampliación de alta resolución. La calidad del retrato cercano es comparable a la versión SD1.5, aunque hay defectos al salir retratos lejanos directamente. Se sugiere usar el plugin ADetailer, que corrige eficazmente problemas de caras lejanas.
SDXL permite ahora salidas más fáciles usando prompts en lenguaje natural simple. Se recomienda probar más prompts en lenguaje natural, lo que mejora resultados para fotos realistas generadas por IA.

Tras varias pruebas, los parámetros sugeridos son:

Pasos ≥ 25
Muestreador: DPM++ 2M Karras
Escala CFG: 10
Tamaño ≥ 1024x1024
ADetailer: activado

Todo el mundo es bienvenido a probar HelloWorld y aportar comentarios. ¡Tus opiniones son muy importantes para la mejora del modelo!

Declaración de derechos de autor:

La serie de modelos HelloWorld (en adelante, "el Modelo") ha sido creada por mí (en adelante, "el Propietario") con la ayuda de la plataforma LiblibAI. La republicación del Modelo en plataformas excepto LiblibAI y Civitai no está autorizada por el Propietario.

El Propietario permite usar las imágenes generadas por el Modelo para fines educativos o informativos no comerciales sin costo, bajo la condición de que:

- Los usuarios cumplan con leyes aplicables y no violen derechos del Modelo ni de terceros.

- Se atribuya claramente la autoría de las imágenes como "creado por el modelo base HelloWorld de LEOSAM".

Para cualquier uso comercial, se requiere un acuerdo de licencia comercial previo con el Propietario. Para consultas sobre licencia comercial y personalización del modelo, contactar al Propietario vía la información en su página principal.

El desarrollo y distribución gratuita del modelo SDXL representan esfuerzos significativos. El Propietario se compromete a actualizaciones gratuitas continuas del modelo HelloWorld para entusiastas individuales, como agradecimiento por las contribuciones a desarrollo open-source. Colaboraciones comerciales son vitales para avance y perfeccionamiento del Modelo. El Propietario agradece a cada usuario por su comprensión y apoyo.

El uso no autorizado puede violar leyes y tener consecuencias legales. El Propietario tiene derechos exclusivos para interpretar esta declaración, que está regida por leyes y regulaciones vigentes.