HelloWorld XL de LEOSAM - HelloWorld XL 1.0
Palabras Clave y Etiquetas Relacionadas
Prompts Recomendados
studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still,film grain texture,analog photography aesthetic
leogirl
Prompts Negativos Recomendados
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly
(worst quality, low quality, cgi, bad eye, worst eye, illustration, deformed, cartoon), distorted, disfigured, poorly drawn, bad anatomy, wrong anatomy, open mouth
Parámetros Recomendados
samplers
steps
cfg
clip skip
resolution
Parámetros Recomendados de Alta Resolución
upscaler
upscale
steps
Consejos
Añade la palabra clave 'leogirl' al usar HelloWorld 1.0 para activar efectos de entrenamiento estables.
Usa el plugin 'adetailer' para corregir problemas en retratos lejanos, especialmente en cuerpo completo.
Para mejor detalle facial en imágenes de cuerpo completo, realiza reparación de alta resolución 1.5x con intensidad cerca de 0.3.
Usa prompts en lenguaje natural para mejorar calidad de salida con modelos SDXL.
Evita tonos cálidos no deseados usando prompts como 'luz de estudio' y 'foco nítido'.
Las imágenes de cuerpo completo pueden tener escenas más amplias y detalles faciales menos nítidos a resolución 1024; usa prompts de composición o adetailer para mejorar.
El modelo incluye conceptos diversos como surrealismo, boudoir, máscaras, origami, mechas, animales y texturas de película.
Aspectos Destacados de la Versión
Como nuevo modelo SDXL, HelloWorld difiere del SD1.5 en tres puntos:
A diferencia de los modelos base SD1.5 que usualmente no incluyen palabras clave, recuerda usar la palabra clave "leogirl" con HelloWorld 1.0 para asegurar que el modelo SDXL active el efecto del conjunto de entrenamiento más establemente.
El modelo HelloWorld soporta salida directa a resolución 1024*1024, sin necesidad de ampliación de alta resolución. La calidad de retrato cercano no es inferior a SD1.5, pero hay fallas al generar retratos lejanos directamente; se recomienda usar el plugin ADetailer para corregir problemas de caras lejanas.
SDXL ahora permite usar prompts en lenguaje natural simple. Se recomienda probar más prompts naturales para obtener mejores resultados en fotos AI realistas.
Tras múltiples pruebas, se sugieren los siguientes parámetros:
Pasos ≥ 25
Muestreador: DPM++ 2M Karras
Escala CFG: 10
Tamaño ≥ 1024x1024
ADetailer: activado
作为全新的SDXL模型,HelloWorld在使用时有三点与传统SD1.5模型的不同:
HelloWorld 1.0模型使用必备的触发词是leogirl,除此以外,建议同时添加realistic和looking at viewer两个正向提示词。建议使用的负面提示词是:bad eyes, incorrect hands, worst teeth, abnormal anatomy, wrong lips, illustration, cartoon, painting。
HelloWorld模型支持1024*1024分辨率直接出图,不需要高分辨率放大,目前在近景人像直出质感上不输于SD1.5版本,但直出远景人像时仍存在瑕疵,因此建议搭配ADetailer插件使用,可以很好地修正远景人脸问题。
SDXL现在可以使用更简单的自然语言提示词进行出图,建议多多尝试自然语言提示词,输出AI写实照片时会有更好的效果。
经过多轮测试,建议的绘图参数设置包括:
Steps ≥ 25
Sampler: DPM++ 2M Karras
CFG scale: 10
Size ≥ 1024x1024
ADetailer: open
Patrocinadores del Creador
🖥️Prueba el open-source GPT4V-Image-Captioner con instalación en un clic y funciones como precompresión y etiquetado de imágenes.
Usa la versión plugin webui para integración sencilla.
🖥️Bienvenido a probar el open-source GPT4V-Image-Captioner, desarrollado por mi amigo y yo. Ofrece instalación con un solo clic e integra múltiples funciones incluyendo precompresión de imágenes, etiquetado de imágenes y estadísticas de etiquetas. Recientemente, también lanzamos la versión plugin webui de esta herramienta, ¡todos están invitados a usarla!
🌍Bienvenidos a unirse a los grupos QQ "兔狲·AIGC梦工北厂" con ID: 780132897 y "兔狲·AIGC梦工南厂" con ID: 835297318 (respuesta para entrar: 兔狲). Grupo Telegram “兔狲的SDXL百老汇”, enlace: https://t.me/+KkflmfLTAdwzMzI1
📖Actualización HelloWorld 7.0 - 13 de junio, 2024
Resumen en una frase: HelloWorld 7.0 es una versión optimizada iterativamente, con el mejor desempeño corporal en toda la serie y un alcance conceptual y riqueza de detalles aún mejorados.
Detalles de la actualización:
Con la adición de imágenes negativas en entrenamiento, fortalecimiento en poses y optimización del modelo clip, se ha mejorado la precisión de extremidades y manos en comparación con versiones previas. Las palabras de prompt negativas recomendadas son: "mano mala, anatomía incorrecta, peor calidad, imágenes generadas por IA, baja calidad, calidad promedio".
Extraída la LoRA ajustada fina del modelo oficial SPO e incorporada en HelloWorld 7.0. SPO mejora la metodología DPO. El modelo base SPO ofrece mejor rendimiento que DPO XL y el SDXL base original. La LoRA SPO mejora detalles y contraste, y embellece imágenes. Gracias al equipo técnico detrás de SPO.
Se continuó ampliando el alcance conceptual del conjunto de entrenamiento, optimizando y simplificando el conjunto (el ajuste fino de conjuntos grandes es muy costoso y H800 está difícil de rentar; no se puede costear el tiempo de entrenamiento local). El conjunto total actual es de 20,821 imágenes. La distribución de resoluciones es la siguiente y se recomienda usar varias resoluciones con más imágenes para la salida:
(832, 1248) - Cantidad: 7128 (896, 1152) - Cantidad: 6250 (1248, 832) - Cantidad: 2402 (1024, 1024) - Cantidad: 1639 (1360, 768) - Cantidad: 928 (1152, 896) - Cantidad: 870 (768, 1360) - Cantidad: 432 (960, 1088) - Cantidad: 506 (992, 1056) - Cantidad: 162 (1088, 960) - Cantidad: 140 (704, 1472) - Cantidad: 120 (1056, 992) - Cantidad: 122 (1472, 704) - Cantidad: 115 (1632, 640) - Cantidad: 75 (640, 1632) - Cantidad: 12Se usó GPT4O para re-etiquetar todos los datasets. Esta vez, se implementó un método de etiquetado estructurado con la estructura: "descripción resumen en una frase + múltiples etiquetas de elementos de imagen + inspirado por XXX + palabras de calidad estética", donde la calidad estética se divide en cinco niveles: peor calidad, baja calidad, calidad promedio, mejor calidad y obra maestra. Un ejemplo típico de etiquetado es:
arte conceptual con una mano humana envuelta en cintas rojas y beige, aislada sobre un fondo claro simple, estilo realista, esquema de color minimalista, texturas suaves, estética elongada y surrealista, inspirado en obras surrealistas de Salvador Dalí, obra maestra
La "Lista de Palabras de Etiquetado de Alta Frecuencia" y la "Lista de Estilos Artísticos de Alta Frecuencia" involucradas en la sección Inspirado por XXX para la versión HelloWorld 7.0 solo se proporcionarán a usuarios con licencia comercial. Los socios que hayan adquirido autorización para la serie Helloworld XL pueden contactarme para obtenerla gratis en caso de omisiones.
Los usuarios pueden consultar la Lista de Palabras de Etiquetado de Alta Frecuencia de HelloWorld 6.0. Además, he proporcionado más de 150 imágenes de ejemplo de alta calidad en la galería para referencia de todos. Crear modelos no es fácil, ¡gracias a los usuarios por su comprensión y paciencia!
📖Actualización HelloWorld 6.0 - 20 de abril, 2024
Lista de 250 Palabras de Etiquetado Más Frecuentes de HelloWorld 6.0 por LEOSAM
Gracias por su paciencia. He estado buscando trabajo últimamente, lo que provocó algunos retrasos en las actualizaciones de HelloWorld. Aquí están las principales novedades en la versión 6.0:
HelloWorld 6.0 es una mejora iterativa basada en la versión 5.0. Según mis pruebas, el realismo no varía significativamente respecto a la v5.0. La principal ventaja es la ampliación del coberturismo conceptual en el conjunto de entrenamiento. Según retroalimentación, se ha mejorado en temas como surrealismo, boudoir, fotos de grupo, máscaras, origami, renders 3D, autos, dragones, y fotografía de maternidad. Algunos ejemplos en las ilustraciones.
HelloWorld 6.0 incluye deliberadamente imágenes de baja calidad para fortalecer la respuesta del modelo a prompts negativos. Se recomiendan las siguientes palabras negativas: "baja calidad, artefactos jpeg, borroso, mal dibujado, feo, peor calidad".
El cuerpo principal del set de entrenamiento usa etiquetado GPT4v. Para imágenes que GPT4v no puede etiquetar, se utiliza cogVQA guiado por blip2-opt-6.7b. El estilo de lenguaje de estos modelos multimodales difiere mucho del etiquetador WD1.4 tradicional. Para facilitar la activación precisa de diferentes conceptos, compilé las 250 palabras de etiquetado más frecuentes del conjunto de HelloWorld 6.0. Puedes ver estas palabras en este documento.
Finalmente, aunque SD3 está por salir, seguiré actualizando a HelloWorld XL 7.0 esperando lograr mejoras mayores en la versión 7.0.
📖Presentación 2024.2.22 del modelo "HW5.0_Euler_a_Lightning"
Este modelo es una versión acelerada del modelo base HelloWorld SDXL, que incorpora tecnologías de SDXL-Lightning. Equipado con el muestreador Eular a y CFG 1, es capaz de generar imágenes en 6-8 pasos, tres veces más rápido que la versión SDXL original. Además, comparado, los resultados son superiores a los de las versiones LCM o Turbo.
Los parámetros recomendados para generar imágenes con este modelo son:
Muestreador: Eular a (¡Importante! El modelo está adaptado específicamente a Eular a, otros muestreadores pueden no dar buenos resultados)
Escala CFG: 1
Pasos de muestreo: 8 pasos (6~8 pasos aceptables)
Algoritmo Hires: ESRGAN 4x / 8x_NMKD-Faces_160000_G
Factor de escalado Hires: 1.5x
Pasos Hires: 8 pasos
Fuerza de denoising Hires: 0.3
📖Presentación 2024.2.11 de "HelloWorld 5.0 GPT4V"
HelloWorld 5.0 es la actualización más sustancial de la serie HelloWorld, etiquetada con GPT-4v y ajustada finamente en campos como ciencia ficción, animales, arquitectura e ilustración.
Pruebas comparativas muestran mejoras en esta versión:
1. Posturas de personajes y composiciones de imagen más variadas y dinámicas, creando imágenes visualmente atractivas;
2. El dataset de película ha sido extensamente entrenado. Mientras que la textura de película era débil de las versiones 2.0 a 4.0, muchos fans extrañaban el estilo leogirl de la 1.0. Por lo tanto, esta actualización fortalece específicamente la textura de película sin afectar otras cualidades fotográficas. La textura de película puede activarse con frases como granulado de película y estética de fotografía analógica;
3. Mayor expresividad en temas como ciencia ficción, thriller y animales, con mechas y otros sujetos con una sensación más diseñada. Animales como el leopardo de las nieves, panda rojo, panda gigante, tigre, gato de Pallas y gatos y perros domésticos son más realistas;
4. Gracias al etiquetado GPT, la adherencia a prompts y la precisión conceptual han mejorado aún más.
Sin embargo, las desventajas incluyen:
1. Al ser un ajuste fino sustancial, la tasa de error en extremidades puede aumentar ligeramente, fenómeno común al salir de zonas de confort hacia nuevas optimizaciones. Versiones anteriores hicieron pruebas extensas para mejorar extremidades, pero esta tuvo tiempo limitado. Aun así, la precisión en extremidades es al menos mejor que en v1.0, y seguiré mejorando en próximas versiones.
2. Por la textura de película reforzada, aunque el etiquetado GPT es lo más preciso posible, puede haber un tono cálido predeterminado inevitable en imágenes. Sin embargo, usar prompts como luz de estudio o foco nítido produce imágenes HD de calidad de estudio, y con buen uso de prompts, tonos de piel y atractivo visual superan versiones anteriores.
3. Esta versión incluye más imágenes de personajes de cuerpo completo para mejorar ese efecto, por lo que puede generar escenas más amplias si no se dirige composición específica. Actualmente, detalles faciales a resolución 1024 en cuerpo completo pueden ser menos nítidos comparado con planos medios o primeros planos. Esto puede mejorarse con adetailer y escalado 1.5x con intensidad 0.3, o usando prompts que especifican composición para evitar cuerpo completo.
4. Se añadieron algunos datasets de ilustraciones de alta calidad, por lo que prompts relacionados a estilos animados podrían generar imágenes animadas. Si preocupa, ajuste sus prompts.
Estas son las principales novedades de esta versión. Entrenar modelos base SDXL es difícil, y cuando el conjunto de entrenamiento se acerca a 10,000 imágenes, etiquetado y entrenamiento cuesta más de 300 USD por modelo. ¡Invito a todos a usar el modelo y feedback es muy bienvenido! Si te agrada el modelo, agradecería mucho que ayudes a difundirlo.
📖Presentación 2024.1.31 de "HelloWorld 4.0"
HelloWorld 4.0 es una versión progresiva de transición de etiquetado con blip+clip a GPT4V. Inicialmente entrené un modelo puro GPT4V, luego lo combiné con alta proporción del HelloWorld 3.2 y 0.05 de Juggernaut XL (para ajustar tono de piel). La nueva versión muestra mejoras en cumplimiento de prompts y cobertura conceptual respecto a 3.2.
El nuevo conjunto con etiquetado GPT4V se duplicó de 4,000 imágenes en la serie helloworld3 a 8,000 imágenes, cubriendo no solo retratos sino también animales, arquitectura, naturaleza, comida, ilustraciones y más. Sin embargo, la versión pura GPT4V enfrentó un problema de sobreajuste, preliminarmente atribuido a la duplicación de imágenes. Uno de los próximos pasos es cómo incluir muchos conceptos no retrato manteniendo el suficiente entrenamiento de retratos. Por ahora se usa fusión de versiones nueva y vieja para ajustes finos y asegurar transición suave, por eso las ventajas del conjunto ampliado y el etiquetado GPT4V no son muy perceptibles. Estas ventajas serán más evidentes en siguientes generaciones 5 y 6.
📖Presentación 2024.1.5 de "HelloWorld 3.2"
La versión 3.2 es una iteración optimizada con tecnología DPO, y comparada con la 3.0, hay optimizaciones en tono de piel y precisión en extremidades, pero no son muy significativas. Por eso se marca como 3.2 y no 4.0.
📖Presentación 2023.12.15 de "HelloWorld 3.0"
La nueva versión amplió el conjunto de entrenamiento, mejorando la capacidad del modelo para expresarse en diferentes estilos artísticos, incluyendo ciencia ficción y arte.
Integró un LoCon propio para mejora de calidad (creado con tecnología slider), para mejorar la textura y aliviar problemas de distorsión en dedos y extremidades.
📖Presentación 2023.11.17 de "HelloWorld 2.0"
Gracias a todos por la paciencia. Tras superar varios desafíos, la versión HelloWorld 2.0 finalmente está lista en un estado satisfactorio para mí. Las diferencias principales con la 1.0 son:
HelloWorld 2.0 ya no requiere palabras clave, y la calidad es comparable a la 1.0 usando palabras clave. La palabra clave 'leogirl' en 1.0 estaba muy asociada con asiáticos orientales. Tras la eliminación de palabras clave, mientras términos como '1girl' aún generarán retratos asiáticos si no se especifica raza, ahora se puede puntualizar con palabras como nacionalidad, color de piel, etc. Por ejemplo, efectos para 'chino', 'ruso', 'iraní', 'jamaicano', 'keniano', 'de piel oscura', 'de piel pálida', etc., se describen a continuación.

También puedes obtener estilos diferentes mencionando nombres de personas de distintos países y géneros en el prompt, como Han Meimei (China), Sophie Martin (Francia), Priya Patel (India), Fatima Al-Hassan (árabe), Wanjiru Mwangi (Kenia). Estos prompts son ejemplos, hay muchas maneras de jugar y compartir.

HelloWorld 2.0 equilibró calidad/color y ofrece más opciones de estilo. La 1.0 con ‘leogirl’ producía imágenes con fuerte textura de película. HelloWorld 2.0 ya no está ligada a textura de película y puede personalizarse con ciertos prompts relacionados con calidad. Algunos prompts probados y efectivos son:
sesión de fotos de alta moda, foto de presentación de producto, maquillaje popular coreano, aegyo sal, foto nítida de alta calidad, luz de estudio, foto formato medio, fotografía Mamiya, película análoga, retrato medio con luz suave, imagen real, fotografía editorial refinada, foto raw, foto real, foto escaneada, escena de película
Los efectos de color de estos prompts son:

El conjunto de entrenamiento aumentó significativamente la proporción de fotos de cuerpo completo para mejorar efectos SDXL en generar retratos completos y a distancia. Aunque mejoró respecto a 1.0, se recomienda usar ‘adetailer’ para generar fotos de cuerpo completo. Para usuarios con suficiente memoria (24g), se recomienda reparación de alta resolución 1.5x, que mejora mucho detalles faciales.
📖Presentación 2023.8.29 del modelo base "HelloWorld" SDXL
Recordatorio especial: Al usar el modelo HelloWorld 1.0, recuerda añadir la palabra clave "leogirl".
Distinto del modelo base SD1.5 “MoonFilm”, “HelloWorld” es una nueva serie realista de base SDXL. Para que más usuarios descubran HelloWorld, mantuve el enlace original de MoonFilm. Se le puede considerar una continuación espiritual de MoonFilm en la plataforma SDXL, pero HelloWorld apunta a lograr más que realismo y calidad tipo película en retratos. Gracias a la superior capacidad de SDXL para entender información y texto respecto a SD1.5, HelloWorld es un modelo base que busca representar todo de manera realista, o en otras palabras construir gradualmente un mundo de fotografía virtual usando HelloWorld.
El modelo base realista SD1.5 está bastante maduro y difícilmente mejorará en rendimiento. A menos de una tecnología revolucionaria para SD1.5, Moonfilm & MoonMix dejarán de actualizarse. Pondré mi energía en el desarrollo del modelo grande HelloWorld SDXL. La versión 1.0 ya está disponible y la 2.0 se desarrolla apresuradamente para septiembre.
Como nuevo modelo SDXL, HelloWorld difiere del SD1.5 en tres aspectos:
A diferencia del SD1.5 que usualmente no usa palabras clave, recuerda usar la palabra clave "leogirl" con HelloWorld 1.0 para estabilizar el efecto del conjunto de entrenamiento en SDXL.
El modelo HelloWorld soporta salida directa en resolución 1024*1024 sin necesidad de ampliación. La calidad de retrato cercano directo no es inferior a la SD1.5, pero hay fallos en retrato lejano directo, por lo que se recomienda usar el plugin ADetailer para corregir problemas en caras lejanas.
Ahora SDXL permite usar prompts en lenguaje natural simple, se recomienda probar más prompts naturales para mejores fotos realistas AI.
Tras varias pruebas, los parámetros recomendados son:
Pasos ≥ 25
Muestreador: DPM++ 2M Karras
Escala CFG: 10
Tamaño ≥ 1024x1024
ADetailer: activado
Todos están invitados a probar HelloWorld y aportar feedback valioso para mejoras futuras.
Declaración de Derechos de Autor:
La serie de modelos HelloWorld ("el Modelo") ha sido creada por mí mismo ("el Propietario") con ayuda de la plataforma LiblibAI. Está prohibida la republicación del Modelo en plataformas fuera de LiblibAI y Civitai sin autorización del Propietario.
El Propietario permite usar las imágenes generadas por el Modelo para fines educativos o informativos no comerciales sin costo, bajo la condición que:
- Los usuarios cumplan con las leyes vigentes y no violen derechos del Modelo o terceros.
- Las imágenes se atribuyan claramente como "creadas por el modelo base HelloWorld de LEOSAM".
Para usos comerciales se requiere acuerdo previo de licencia con el Propietario. Consultas sobre licencias comerciales y personalización del modelo deben dirigirse al Propietario mediante la información de contacto en su página.
El desarrollo y distribución gratuita de modelos SDXL representa un esfuerzo considerable. El Propietario se compromete a actualizaciones gratuitas para entusiastas individuales como muestra de agradecimiento por el apoyo comunitario al open-source. Colaboraciones comerciales son vitales para el avance y mejora del Modelo. El Propietario agradece a todos los usuarios por su comprensión y apoyo.
Uso no autorizado puede violar leyes con consecuencias legales. El Propietario posee derechos exclusivos de interpretación de esta declaración sujeta a leyes vigentes.
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Palabras entrenadas
Creador
Discusión
Por favor log in para dejar un comentario.
