modelos/ThinkDiffusionXL - v1.0

ThinkDiffusionXL - v1.0

Marta García

5/26/2025

10:59:04 AM

| Discussion

Palabras Clave y Etiquetas Relacionadas

modelo base,punto de control,sdxl 1.0

Retrato de un hombre anciano con profundas arrugas y barba blanca, que lleva un sombrero beige y camisa amarilla, capturado con luz intensa de verano y fondo desenfocado de parque verde.

Imagen generada por IA altamente detallada usando stable diffusion de una criatura demoníaca con rasgos esqueléticos y armadura intrincada con púas. Ambiente oscuro y tenebroso.

Un segador en un bosque oscuro con una atmósfera nebulosa y espeluznante, creado usando stable diffusion.

Una imagen dramática generada por IA usando Stable Diffusion de un segador con rostro esquelético, vistiendo túnicas raídas, de pie sobre una roca con los brazos extendidos mientras cae un rayo. El fondo presenta un cielo oscuro y tormentoso y un paisaje escarpado.

Vista de perfil de una mujer con un tatuaje intrincado en el cuello y el hombro, y un peinado con moño elegante, imagen generada por IA usando stable diffusion.

Dragón etéreo con alas translúcidas en un palacio en ruinas, cielo nublado de fondo, imagen generada por IA usando Stable Diffusion.

Parámetros Recomendados

samplers

DPM++ 2M Karras

steps

cfg

4 - 8

Consejos

Considera usar TDXL para proyectos que requieren alto detalle y calidad, ya que sobresale en estas áreas.

El modelo ofrece flexibilidad para generar imágenes sin sesgos inherentes, adecuado para cualquier estilo o tema.

Patrocinadores del Creador

Se puede encontrar precargado en ThinkDiffusion.

Lee más sobre el modelo, haz clic aquí

Por favor, deja una reseña si estás satisfecho con él, esto nos animará a crear más y mejorar.

ThinkDiffusionXL (TDXL)

ThinkDiffusionXL es el resultado de nuestro objetivo de construir un modelo de referencia capaz de un increíble fotorrealismo que también sea lo suficientemente versátil para generar imágenes de alta calidad en una variedad de estilos y temas sin necesidad de ser un genio en prompt.

Se puede encontrar precargado en ThinkDiffusion.

Lee más sobre el modelo, haz clic aquí

Por favor, deja una reseña si estás satisfecho con él, esto nos animará a crear más y mejorar.

El trabajo

Fuente de datos: TDXL está entrenado con más de 10,000 imágenes diversas que abarcan fotorrealismo, arte digital, anime y más. La resolución más pequeña en nuestro conjunto de datos es 1365x2048, pero muchas imágenes llegan hasta resoluciones tan altas como 4622x6753. En total, nuestro conjunto ocupa 42GB.
Entrenamiento: Con 1.8 millones de pasos, hemos hecho el trabajo. Para comparación, Juggernaut tiene 600k pasos y RealVisXL 348k pasos.
Imágenes con descripciones manuales: Cada imagen está cuidadosamente descrita a mano, mejorando la capacidad del modelo para generar resultados precisos y de alta calidad a partir de prompts mínimos.
Capacidades NSFW: El modelo incluye más de 1,000 imágenes NSFW seleccionadas con buen gusto.

Nuestras impresiones

Detalle y calidad: La mayoría de los modelos XL en la categoría Realista sufren de falta de detalle, especialmente en el fondo e incluso en características básicas como ojos, dientes y piel. Creemos que TDXL sobresale en estas áreas gracias a su gran conjunto de datos de alta calidad. Para comparación, Juggernaut tiene aproximadamente la mitad del material de imagen, y RealVisXL solo 1,700 imágenes. En última instancia, TDXL simplemente posee mucho más "conocimiento".
Menos sesgo: Nos aseguramos de usar un número igual de imágenes para cada estilo, género, etc. Otros modelos que probamos en los últimos meses presentaban algún tipo de sesgo, a veces hacia retratos, sesgo de género, ciertas etnias, etc. Por ejemplo, Juggernaut tiene sesgo en área Close-Up, y la Luz Cinematográfica es bastante dominante en ese modelo. RealVisXL también tiene un sesgo hacia retratos. Por otro lado, TDXL te ofrece lo que quieres: Paisajes, plano medio, cuerpo entero, primer plano, retrato, vista lateral, vista trasera, escenas de acción, cinematográficas... lo que quieras sin estar siempre empujado en una dirección por un sesgo.
Base versátil: Debido a su gran conjunto de datos equilibrado y de calidad, TDXL es versátil para servir como modelo base para futuros entrenamientos. Puedes crear nuevos afinamientos en direcciones completamente diferentes, agregar LoRAs para cubrir conceptos faltantes o hacer entrenamientos adicionales con datos de calidad equilibrada.