ThinkDiffusionXL - v1.0
Palabras Clave y Etiquetas Relacionadas
Parámetros Recomendados
samplers
steps
cfg
Consejos
Considera usar TDXL para proyectos que requieren alto detalle y calidad, ya que sobresale en estas áreas.
El modelo ofrece flexibilidad para generar imágenes sin sesgos inherentes, adecuado para cualquier estilo o tema.
Patrocinadores del Creador
Se puede encontrar precargado en ThinkDiffusion.
Lee más sobre el modelo, haz clic aquí
Por favor, deja una reseña si estás satisfecho con él, esto nos animará a crear más y mejorar.
ThinkDiffusionXL (TDXL)
ThinkDiffusionXL es el resultado de nuestro objetivo de construir un modelo de referencia capaz de un increíble fotorrealismo que también sea lo suficientemente versátil para generar imágenes de alta calidad en una variedad de estilos y temas sin necesidad de ser un genio en prompt.
Se puede encontrar precargado en ThinkDiffusion.
Lee más sobre el modelo, haz clic aquí
Por favor, deja una reseña si estás satisfecho con él, esto nos animará a crear más y mejorar.
El trabajo
Fuente de datos: TDXL está entrenado con más de 10,000 imágenes diversas que abarcan fotorrealismo, arte digital, anime y más. La resolución más pequeña en nuestro conjunto de datos es 1365x2048, pero muchas imágenes llegan hasta resoluciones tan altas como 4622x6753. En total, nuestro conjunto ocupa 42GB.
Entrenamiento: Con 1.8 millones de pasos, hemos hecho el trabajo. Para comparación, Juggernaut tiene 600k pasos y RealVisXL 348k pasos.
Imágenes con descripciones manuales: Cada imagen está cuidadosamente descrita a mano, mejorando la capacidad del modelo para generar resultados precisos y de alta calidad a partir de prompts mínimos.
Capacidades NSFW: El modelo incluye más de 1,000 imágenes NSFW seleccionadas con buen gusto.
Nuestras impresiones
Detalle y calidad: La mayoría de los modelos XL en la categoría Realista sufren de falta de detalle, especialmente en el fondo e incluso en características básicas como ojos, dientes y piel. Creemos que TDXL sobresale en estas áreas gracias a su gran conjunto de datos de alta calidad. Para comparación, Juggernaut tiene aproximadamente la mitad del material de imagen, y RealVisXL solo 1,700 imágenes. En última instancia, TDXL simplemente posee mucho más "conocimiento".
Menos sesgo: Nos aseguramos de usar un número igual de imágenes para cada estilo, género, etc. Otros modelos que probamos en los últimos meses presentaban algún tipo de sesgo, a veces hacia retratos, sesgo de género, ciertas etnias, etc. Por ejemplo, Juggernaut tiene sesgo en área Close-Up, y la Luz Cinematográfica es bastante dominante en ese modelo. RealVisXL también tiene un sesgo hacia retratos. Por otro lado, TDXL te ofrece lo que quieres: Paisajes, plano medio, cuerpo entero, primer plano, retrato, vista lateral, vista trasera, escenas de acción, cinematográficas... lo que quieras sin estar siempre empujado en una dirección por un sesgo.
Base versátil: Debido a su gran conjunto de datos equilibrado y de calidad, TDXL es versátil para servir como modelo base para futuros entrenamientos. Puedes crear nuevos afinamientos en direcciones completamente diferentes, agregar LoRAs para cubrir conceptos faltantes o hacer entrenamientos adicionales con datos de calidad equilibrada.
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.






