modelos/AlbedoBase XL - v2.1

AlbedoBase XL - v2.1

Marta García

7/7/2025

1:56:55 PM

| Discussion|

Palabras Clave y Etiquetas Relacionadas

Una mujer sosteniendo una vela encendida con un fondo completamente oscuro que ilumina la mitad de su rostro con la cálida luz de la vela.

Ilustración detallada de un tornado girando sobre un paisaje rural con casas y una camioneta pickup, representado en pergamino envejecido con salpicaduras de tinta y efectos de textura.

Figura hacker digitalizada con capucha en estilo cyberpunk con cables mecánicos y vestimenta futurista oscura

Una figura misteriosa y pálida con un largo abrigo negro flotante sosteniendo un arma, de pie en una calle oscura y brumosa de la ciudad con un coche retro y una farola al fondo, en un estilo neo-noir.

Una escena fantástica kawaii con una chica de cabello rojo con vestido blanco sentada frente a una gran criatura verde con boca ancha y dentada, rodeada de varios pequeños animales adorables que se parecen a conejos.

Barcos y palmeras en silueta sobre un río al atardecer con un cielo naranja ardiente en estilo collagraph por William Wray.

Dos personas en silueta de un barco de pesca sobre agua calma con reflejo de luz solar brillante, obra de arte estilo collagraph de William Wray

Un pato antropomórfico con gafas oldschool y chaqueta de cuero montando una motocicleta con un pato blanco sentado al frente.

Retrato de una joven hermosa con cabello suelto y look de moda sexy, posando en un patio soleado de una mansión toscana con colores vibrantes y atuendo de alta costura.

Vehículo de carrera de monociclo retrofuturista con un conductor con casco y chaqueta de cuero, representado en el estilo de un collagráfico de William Wray

Silueta negra de un hombre de pie con cabello puntiagudo y chaqueta, sobre un fondo abstracto beige y blanco salpicado en estilo arte callejero.

Tres individuos punk con pelo pinchado y tatuajes vestidos con atuendo preppy sobre un fondo amarillo, ilustrados con estilo de espátula inspirado en Dave McKean.

Prompts Negativos Recomendados

strabismus

lowres

Parámetros Recomendados

samplers

DPM++ 2M SDE Heun Karras

steps

24 - 60

cfg

7.5 - 8

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Consejos

Si la generación de imagen no produce nada, intenta cambiar a CLIP SKIP 2 o modifica ligeramente el prompt cambiando el orden de las palabras o usando otras diferentes.

Dejar el campo de prompt negativo vacío puede producir imágenes de buena calidad, especialmente en la versión 1.3.

Usar prompts en forma de oración en lugar de tags (lista de palabras) puede mejorar la calidad de la imagen debido a los efectos de la LoRA.

Consulta la tabla de especificaciones antes de usar el modelo para obtener los mejores ajustes, disponible a través de los enlaces de descarga proporcionados.

Aspectos Destacados de la Versión

Re-fusión y ajuste de v0.1 a 2.0 usando nuevo algoritmo y fórmula de fusión.

Patrocinadores del Creador

Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución será dedicada enteramente a avanzar la comunidad SDXL.

🙋🏼‍♂️ únete a nosotros (discord) ㅤ|ㅤ 🛒 compra ㅤ|ㅤ 🌱 dona

Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución será dedicada enteramente a avanzar la comunidad SDXL.

🙋🏼‍♂️ únete a nosotros (discord) ㅤ|ㅤ 🛒 compraㅤ |ㅤ 🌱 dona

AlbedoBase XL (SFW&NSFW)

El refiner no es necesario, e incluye VAE.

OBJETIVO

Stable Diffusion XL tiene 3.5 mil millones de parámetros (excluyendo el Refiner), que es aproximadamente 3.6 veces más que la versión SD v1.5. Creo que esto no es solo un número, sino un número que puede llevar a una mejora significativa en el rendimiento.

Ha pasado tiempo desde que nos dimos cuenta que el rendimiento general de SD v1.5 ha mejorado más allá de toda imaginación gracias a las aportaciones explosivas de nuestra comunidad. Por lo tanto, estoy trabajando en completar este modelo AlbedoBase XL para reproducir óptimamente la mejora de rendimiento ocurrida en v1.5 también en esta versión XL.

Mi objetivo es probar directamente el rendimiento de todos los Checkpoints y LoRAs que se suben públicamente a Civitai, y fusionar solo los recursos que se consideren óptimos después de pasar varios filtros. Esto superará el rendimiento de la IA generadora de imágenes de empresas como Midjourney.

Hasta ahora, AlbedoBase XL v3.1 Large ha fusionado alrededor de 200 checkpoints seleccionados y 251 LoRAs.

REGISTRO

v3.1-Large

• Fusionó más de 50 últimas versiones seleccionadas de modelos SDXL usando el script recursivo empleado en la V3.

La tabla de especificaciones (370.7 MB): descargar

v3-mini

Ofrezco sinceras disculpas por hacerles esperar tanto tiempo.

He estado lidiando con algunos asuntos personales y, mientras trabajaba en la nueva versión, también enfrenté problemas de salud. Incluso mientras escribo esto, sigo enfrentando estos desafíos.

Siento que no bastaría con ofrecer una actualización breve, así que pido amablemente su comprensión mientras comparto este mensaje más detallado.

Desde el lanzamiento de la versión 2.0, me he dedicado a estudiar aprendizaje profundo de manera independiente. No tengo un título formal y, aparte de una aptitud modesta para la programación, solo tengo formación en artes. Como resultado, carezco de la base matemática y científica para lograr avances significativos, dadas el tiempo y esfuerzo invertidos. A pesar de esto, la experiencia de sumergirme en este estudio y investigación autodirigidos ha sido un tesoro invaluable en mi vida.

Recientemente, me topé con una idea que podría ser un avance importante. Después de rehacer cientos de fórmulas y métodos desde la versión 2.0, logré desarrollar un algoritmo bastante intrigante y exitoso. El proceso de fusión de modelos se basó en SDXL1.0 y SD1.5, junto con otros modelos cuidadosamente seleccionados. Estos se categorizaron en cinco clasificaciones principales: "ANIME", "REALISMO", "ARTÍSTICO", "NSFW" y "BASE", y se alimentaron al algoritmo de fusión como conjuntos de datos. Este enfoque ha dado resultados fascinantes.

Sin embargo, tan desafiante como fue el desarrollo del algoritmo, nada ha sido tan exigente como la fase de prueba de rendimiento. Mi salud física y mental se deterioró significativamente durante este período, hasta el punto de darme cuenta que no podía continuar este trabajo solo. Esto fue lo que finalmente me llevó a decidir lanzar esta versión.

Y ahora, estoy emocionado de anunciar el lanzamiento de la tan esperada versión AlbedoBaseXL V3 Mini. Aunque este modelo es una fusión a menor escala, no está limitado a ninguna área específica y funciona notablemente bien en varios dominios. Tiene el potencial de servir como un nuevo modelo base para SDXL1.0. (Para referencia, mi algoritmo de fusión no es una "fusión lineal", por lo que esencialmente puede considerarse un nuevo modelo afinado).

Este modelo, junto con los modelos AlbedoBase existentes, es versátil y supera todas las versiones previas en todos los aspectos. (El contenido NSFW, aunque no es extremo, ofrece un rango de expresión más amplio comparado con versiones anteriores como la v2.1. Un modelo de fusión NSFW dedicado será lanzado en el futuro.)

Por otro lado, he notado que muchos modelos compartidos recientemente han comenzado a adoptar licencias que prohíben la fusión o la comercialización externa. Esto ha sido decepcionante, ya que me ha impedido usar algunos modelos realmente excelentes para fusionar.

Quiero expresar mi más sincero agradecimiento a los desarrolladores de modelos que han proporcionado licencias gratuitas, permitiendo que sus modelos de alta calidad —producto de considerable tiempo y esfuerzo— sean usados para la fusión.

Volveré pronto.

Espero con ansias sus pruebas de rendimiento en una amplia gama de áreas, incluyendo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D y NSFW.

Como desarrolladores de modelos, solo plantamos las semillas. En última instancia, son ustedes, los usuarios y artistas del modelo, quienes las cultivan y hacen florecer.

Gracias, como siempre.

Para quienes deseen apoyar mi trabajo con una pequeña contribución financiera, por favor consideren usar los enlaces a continuación. Actualmente no puedo conseguir empleo y enfrento un futuro incierto respecto a mi sustento.

🌱 dona

La tabla de especificaciones (380.5 MB): descargar

v2.1
Re-fusión y ajuste de v0.1 a 2.0 usando nuevo algoritmo y fórmula de fusión.

La tabla de especificaciones (424.5 MB): descargar

v2.0

Quiero agradecer a todos los que me ayudaron en el lado AlbedoBase XL Pre. Sin ustedes, la fecha de lanzamiento probablemente hubiera sido mucho más tarde. ¡Muchas gracias!

He escrito un script personalizado para converger los modelos existentes AlbedoBase XL en uno solo. Alineando minuciosamente los pesos de filas y columnas de todos los bloques U-NET y CLIP según una fórmula única mía.
Si encuentras un error en la generación de imágenes (si no se genera nada), ¡por favor cambia a CLIP SKIP 2 o modifica ligeramente el prompt! Puede haber combinaciones de prompts que CLIP no reconozca. En ese caso, puedes cambiar el orden de las palabras, usar palabras diferentes o, más simplemente, cambiar el CLIP SKIP. Trabajaré gradualmente en resolver estos problemas en el futuro como en v1.3.

La tabla de especificaciones (403.5 MB): descargar

v1.3

Para ilustrar la calidad relacionada con la aleatoriedad del modelo, estandaricé el valor de la semilla a '9' para todas las imágenes de muestra destinadas a muestreo y procedí con su generación inmediata.
Especialmente con esta versión, debido al impacto significativo de los prompts negativos, dejar el campo de prompt negativo vacío probablemente produzca una buena calidad.

La tabla de especificaciones (438.7 MB): descargar

Como puedes ver, al aumentar el número de Steps, se vuelve disponible para todos los samplers y la calidad mejora.
Debido al efecto de la LoRA que desarrollé y fusioné, como se describe abajo, usar prompts en forma de oración en lugar de tags (lista de palabras) está directamente relacionado con la mejora de la calidad.

Fusioné 45 checkpoints y 7 LoRAs. Después de eso, fusioné AlbedoBase v0.4 y v0.3 en orden, menos del 0~5%, para reavivar los modelos fusionados que se habían diluido y quedado obsoletos.
Entre las 7 LoRAs, una está creada por mí. Involucra analizar y anotar subtítulos para un total de 174 fotografías pictóricas de alta calidad usando GPT4-V. La fusión de esta LoRA resultó en imágenes asombrosamente claras y una impresionante comprensión de los prompts.

Mis LoRAs auto-creadas están exclusivamente disponibles para compra por mis seguidores de Ko-fi a nivel Creative o superior.

v1.2

Fusioné los 22 checkpoints más recientes.

La tabla de especificaciones (565.6 MB): descargar

v1.1

Estabilizado.
Más detallado.
Si crees que eres un usuario avanzado, recomiendo la versión 1.0. Si la versión 1.0 encuentra los ajustes correctos, puede generar obras mucho más vívidas.

La tabla de especificaciones (349.7 MB): descargar

v1.0

Fusioné 106 LoRAs.
Fusioné 19 Checkpoints.

El modelo puede producir resultados diferentes según los ajustes que elijas, por lo que es importante consultar la tabla de especificaciones antes de usarlo.
- He encontrado que usar algunos prompts negativos específicos puede ayudar a resolver el problema de ojos asimétricos o imágenes pixeladas. La tabla de especificaciones puede variar según tu CPU o GPU, así que úsala como referencia general. Experimenta con algunos prompts negativos para mejorar la calidad (ej: estrabismo). Encontré que es difícil satisfacer todos los ajustes por igual al aumentar el número de LoRA fusionadas. Sin embargo, quiero que te enfoques en esta ventaja de la versión 1.0, ya que puede producir obras de calidad asombrosa en varios aspectos con los ajustes adecuados. Volveré con una versión más estable en el futuro.
Puedes encontrar valores útiles de configuración en la muestra o buscando entre otros usuarios.
Como siempre, es mejor dejar el prompt negativo en blanco para obtener los mejores resultados.
Esta v1.0 requirió mucho trabajo, así que me tomo un descanso por un tiempo. Espero que disfrutes usar el modelo y si lo fusionas, por favor compártelo en Civitai de forma gratuita. Así, todos podemos seguir mejorándolo.

La tabla de especificaciones (479.4 MB): descargar

v0.4

Fusioné 132 LoRAs.
Fusioné 4 Checkpoints.

La tabla de especificaciones: descargar

v0.3

Mejoras en todos los samplers.
Realismo logrado.
Estabilizado.

La tabla de especificaciones: descargar

v0.2

Mejoras significativas en claridad y detalles.
Mejora en la implementación de manos y pies.
Grandes mejoras estéticas; composición, abstracción, fluidez, luz y color, etc.

v0.1

Después de un afinamiento adecuado sobre el modelo SDXL1.0, fusionar meticulosamente y con propósito más de 40 modelos de alta calidad disponibles públicamente en Civitai.
Las pruebas se han centrado principalmente en asegurar la máxima calidad con el mínimo número de tokens en el prompt, y no se ha confirmado cuánto puede mejorar la calidad usando un número grande de tokens. (Por favor realiza tus propias pruebas y comparte los resultados)
Normalmente, los resultados más bellos se logran en el punto medio entre la realidad y la animación.
Sin embargo, al usar un prompt apropiado, generalmente no hay nada que no pueda expresar. (Afirmo que posee un valor abundante como modelo base que supera a otros en fusión. Sin embargo, ten en cuenta que actualmente está en v0.1)