modelos/AlbedoBase XL - v2.0

AlbedoBase XL - v2.0

7/31/2025

1:23:19 PM

Palabras Clave y Etiquetas Relacionadas

2d,3d,albedobase xl,albedobond,todo en uno,anime,modelo base,punto de control,cinematográfico,juego,lora,fusión de modelos,fotorrealista,sdxl 1.0,sdxl1.0,stable diffusion xl,último,unificar,v2.0

Un joven al estilo Gatsby vestido con elegante atuendo de los locos años veinte con chaleco negro y pajarita, posando con confianza en un fondo de fiesta lujosa que combina la viveza del anime con el realismo de John Singer Sargent.

Una figura poderosa de Vergil con cabello plateado empuñando una katana brillante, rodeado por un aura de tormenta y salpicaduras de magia oscura, sobre un fondo gótico oscuro.

Una catedral gótica envuelta en llamas naranjas brillantes y luz divina, con figuras con túnicas rodeando la escena ígnea bajo cielos ardientes.

Espadachín rana antropomórfico con armadura detallada y capa verde, en posición con una espada en un campo de batalla boscoso iluminado por el sol.

Sereno estanque de loto de noche iluminado por la luz de la luna, con pabellones tradicionales asiáticos y sus reflejos en el agua

Retrato de un inventor histórico vestido con un dirndl espacial caleidoscópico y atuendo holográfico negro carbón, de pie en una intricada estación de viaje en el tiempo steampunk con iluminación nostálgica.

Retrato de una dama medieval baja con armadura brigandina reforzada con peto metálico y brazales en los brazos, de pie en una plaza medieval con ojos amarillos y cabello negro corto.

Una escena de ciudad prehistórica con grandes edificios de piedra con techos de torres de paja donde los habitantes se reúnen y almacenan granos cosechados bajo los rayos brillantes del sol.

Máquina de escribir antigua y desgastada con teclas turquesa brillantes que hacen clic y muestran texto holográfico con chispas volando desde las teclas metálicas.

Un oscuro callejón de mercado cyberpunk iluminado por luces de neón con comerciantes vendiendo gadgets y pociones, bullicioso bajo un horizonte futurista de la ciudad.

Escultura de ladrillo de un perro ais-brickz con sombrero y gafas de sol sentado junto a una boca de incendio de ladrillo en una acera urbana.

Una figura femenina hecha de ladrillos rojizos de pie bajo una ducha en funcionamiento en un baño con azulejos, con gotas de agua cayendo.

Prompts Negativos Recomendados

strabismus,asymmetrical eyes,pixelated images

amateur quality, vague shapes, vague texture, wrong perspective, ugly, dowdy style

Parámetros Recomendados

samplers

DPM++ 2M SDE Heun Karras

steps

cfg

clip skip

resolution

1024x1024, 720x1280

vae

Included VAE - default

Consejos

Si encuentras un error donde no se genera nada, cambia a CLIP SKIP 2 o modifica ligeramente el prompt.

Usar prompts en forma de oración en lugar de una lista de etiquetas mejora la calidad de la imagen.

Dejar el campo de prompt negativo vacío a menudo produce las mejores imágenes de calidad.

Revisa la grilla de especificaciones para configuraciones recomendadas antes de usarlo.

Experimenta con algunos prompts negativos para resolver problemas como ojos asimétricos o pixelación.

Aspectos Destacados de la Versión

He escrito un script personalizado para converger los modelos existentes AlbedoBase XL en uno solo. Alineando intrincadamente los pesos de fila y columna de todos los bloques U-NET y CLIP según una fórmula única mía.

Patrocinadores del Creador

Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución será dedicada íntegramente a avanzar la comunidad de SDXL.

🙋🏼‍♂️ únete a nosotros (discord) ㅤ|ㅤ 🛒 comprarㅤ |ㅤ 🌱 donar

Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución será dedicada íntegramente a avanzar la comunidad de SDXL.

🙋🏼‍♂️ únete a nosotros (discord) ㅤ|ㅤ 🛒 comprarㅤ |ㅤ 🌱 donar

AlbedoBase XL (SFW&NSFW)

No es necesario el refinador, y el VAE está incluido.

OBJETIVO

Stable Diffusion XL tiene 3.5 mil millones de parámetros (excluyendo el Refinador), que es alrededor de 3.6 veces más que la versión SD v1.5. Creo que esto no es solo un número, sino un número que puede conducir a una mejora significativa en el rendimiento.

Ha pasado un tiempo desde que nos dimos cuenta de que el rendimiento general de SD v1.5 mejoró más allá de la imaginación gracias a las explosivas contribuciones de nuestra comunidad. Por lo tanto, estoy trabajando para completar este modelo AlbedoBase XL para reproducir de forma óptima la mejora de rendimiento que ocurrió en v1.5 en esta versión XL también.

Mi objetivo es probar directamente el rendimiento de todos los Checkpoints y LoRAs que están públicamente subidos en Civitai, y fusionar solamente los recursos que se consideren óptimos tras pasar por varios filtros. Esto superará el rendimiento de la IA generadora de imágenes de compañías como Midjourney.

Hasta ahora, AlbedoBase XL v3.1 Large ha fusionado aproximadamente 200 checkpoints seleccionados y 251 LoRAs.

REGISTRO

v3.1-Large

• Fusionó más de 50 versiones seleccionadas recientes de modelos SDXL utilizando el script recursivo empleado en V3.

La grilla de especificaciones(370.7 MB): descargar

v3-mini

Ofrezco una sincera disculpa por haberte hecho esperar tanto tiempo.

He estado lidiando con asuntos personales, y mientras trabajaba en la nueva versión también enfrenté problemas de salud. Incluso mientras escribo esto, todavía estoy lidiando con esos desafíos.

Sentí que no sería suficiente solo proporcionar una actualización breve, por eso te pido amablemente comprensión al compartir este mensaje más detallado.

Desde el lanzamiento de la versión 2.0, me he dedicado a estudiar aprendizaje profundo de forma independiente. No tengo un título formal, y aparte de una aptitud modesta para programación, solo tengo formación en artes. Como resultado, carezco de la base matemática y científica para lograr avances significativos, dado el tiempo y esfuerzo invertidos. A pesar de ello, la experiencia de sumergirme en este estudio y investigación autodidacta ha sido un tesoro invaluable en mi vida.

Recientemente, encontré una idea que podría ser un gran avance. Tras rehacer cientos de fórmulas y métodos desde la versión 2.0, logré desarrollar un algoritmo bastante intrigante y exitoso. El proceso de fusión de modelos se basó en SDXL1.0 y SD1.5, junto con otros modelos cuidadosamente seleccionados. Estos se categorizaron en cinco clasificaciones principales: “ANIME,” “REALISMO,” “ARTÍSTICO,” “NSFW,” y “BASE,” y se alimentaron al algoritmo de fusión como conjuntos de datos. Este enfoque ha dado resultados fascinantes.

Sin embargo, tan desafiante como fue el desarrollo del algoritmo, nada fue tan complicado como la fase de pruebas de rendimiento. Mi salud física y mental se deterioró significativamente durante este período, hasta el punto de darme cuenta de que no podía continuar este trabajo solo. Esto fue lo que finalmente me llevó a decidir liberar esta versión.

Y ahora, estoy emocionado de anunciar el lanzamiento de la tan esperada versión AlbedoBaseXL V3 Mini. Aunque este modelo es una fusión a menor escala, no está limitado a un área específica y funciona notablemente bien en diversos dominios. Tiene el potencial de servir como un nuevo modelo base para SDXL1.0. (Para referencia, mi algoritmo de fusión no es “fusión lineal,” por lo que esencialmente puede considerarse un nuevo modelo afinado.)

Este modelo, junto con los existentes modelos AlbedoBase, es versátil y supera todas las versiones anteriores en todos los aspectos. (El contenido NSFW, aunque no extremo, ofrece un rango de expresión más amplio en comparación con versiones anteriores como la v2.1. Se lanzará un modelo de fusión específico para NSFW en el futuro.)

Por otro lado, he notado que muchos modelos compartidos recientemente han comenzado a adoptar licencias que prohíben la fusión o la comercialización externa. Esto ha sido una decepción, ya que me ha impedido usar algunos modelos realmente excelentes para fusionar.

Quisiera expresar mi más sincero agradecimiento a los desarrolladores de modelos que han proporcionado licencias gratuitas, permitiendo que sus modelos de alta calidad—productos de considerable tiempo y esfuerzo—se usen para fusión.

Volveré pronto.

Espero con ansias tus pruebas de rendimiento en una amplia gama de áreas, incluyendo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D, y NSFW.

Como desarrolladores de modelos, solo plantamos las semillas. En última instancia, son ustedes, los usuarios y artistas de modelos, quienes las cultivan y hacen florecer los frutos.

Gracias, como siempre.

Para quienes deseen apoyar mi trabajo con una pequeña contribución financiera, por favor consideren usar los enlaces a continuación. Actualmente no puedo asegurar empleo y enfrento un futuro incierto respecto a mi sustento.

🌱 donar

La grilla de especificaciones(380.5 MB): descargar

v2.1
Re-fusionar y ajustar v0.1 a 2.0 usando el nuevo algoritmo y fórmula de fusión.

La grilla de especificaciones(424.5 MB): descargar

v2.0

Quiero agradecer a todos los que me ayudaron en el lado AlbedoBase XL Pre. Sin ustedes, la fecha de lanzamiento probablemente habría sido mucho más tarde. ¡Muchas gracias!

He escrito un script personalizado para converger los modelos existentes de AlbedoBase XL en uno solo. Alineando intrincadamente los pesos de fila y columna de todos los bloques U-NET y CLIP según una fórmula única mía.
Si encuentras un error en la generación de imagen (si no se genera nada), ¡por favor cambia a CLIP SKIP 2 o modifica ligeramente el prompt! Puede haber combinaciones de prompts que CLIP no reconozca. En ese caso, puedes cambiar el orden de las palabras, usar palabras diferentes o, más simplemente, cambiar el CLIP SKIP. Trabajaré gradualmente en resolver estos problemas en el futuro como en v1.3.

La grilla de especificaciones(403.5 MB): descargar

v1.3

Para ilustrar la calidad asociada con la aleatoriedad del modelo, estandaricé el valor seed a '9' para todas las imágenes de muestra destinadas a muestreo y procedí con su generación inmediata.
Especialmente con esta versión, debido al impacto significativo de los prompts negativos, dejar el campo de prompt negativo vacío probablemente produzca la mejor calidad.

La grilla de especificaciones(438.7 MB): descargar

Como puedes ver, a medida que aumentan los Steps, se vuelve disponible para todos los samplers, y la calidad también mejora.
Debido al efecto del LoRA que desarrollé y fusioné, como se describe más abajo, usar prompts en forma de oración en lugar de tags (lista de palabras) está directamente relacionado con la mejora de calidad.

Fusioné 45 checkpoints y 7 LoRAs. Luego, fusioné AlbedoBase v0.4 y v0.3 en orden, en menos del 0~5%, para reactivar los modelos fusionados diluidos que se habían quedado obsoletos.
Entre los 7 LoRAs, uno fue creado por mí. Consiste en analizar y anotar captions para un total de 174 fotos pictóricas de alta calidad usando GPT4-V. La fusión de este LoRA produjo imágenes sorprendentemente claras y una comprensión impresionante de los prompts.

Mis LoRAs creadas por mí están exclusivamente disponibles para compra a mis patrocinadores de Ko-fi en el nivel Creative o superior.

v1.2

Fusioné los 22 checkpoints más recientes.

La grilla de especificaciones(565.6 MB): descargar

v1.1

Estabilizado.
Más detallado.
Si crees que eres un usuario avanzado, recomiendo la versión 1.0. Si la versión 1.0 encuentra los ajustes correctos, puede producir obras mucho más vívidas.

La grilla de especificaciones(349.7 MB): descargar

v1.0

Fusioné 106 LoRAs.
Fusioné 19 Checkpoints.

El modelo puede producir resultados diferentes dependiendo de los ajustes que elijas, por lo que es importante revisar la grilla de especificaciones antes de usarlo.
- He encontrado que usar algunos negativos específicos puede ayudar a resolver problemas como ojos asimétricos o imágenes pixeladas. La grilla puede variar según tu CPU o GPU, así que úsala como referencia general. Experimenta con algunos negativos para mejorar la calidad (ej: estrabismo). Encontré que es difícil satisfacer todos los ajustes por igual conforme aumenta el número de LoRAs fusionadas. Sin embargo, me gustaría que te enfoques en esta ventaja en la versión 1.0, ya que puede producir obras de calidad asombrosa en varios aspectos con los ajustes adecuados. Volveré con una versión más estable en el futuro.
Puedes encontrar valores útiles de configuración en las muestras o buscando otros usuarios.
Como siempre, es mejor dejar el prompt negativo en blanco para mejores resultados.
Esta v1.0 requirió mucho trabajo, así que me tomaré un descanso por un tiempo. Espero que disfrutes usar el modelo, y si lo fusionas, por favor compártelo gratuitamente en Civitai. Así todos podemos seguir mejorándolo.

La grilla de especificaciones(479.4 MB): descargar

v0.4

Fusioné 132 LoRAs.
Fusioné 4 Checkpoints.

La grilla de especificaciones: descargar

v0.3

Mejorado en todos los samplers.
Logró realismo muy real.
Estabilizado.

La grilla de especificaciones: descargar

v0.2

Mejoras significativas en claridad y detalles.
Mejor implementación de manos y pies.
Mejoras estéticas importantes; composición, abstracción, flujo, luz y color, etc.

v0.1

Tras un ajuste fino adecuado sobre el modelo SDXL1.0, fusioné meticulosamente y a propósito más de 40 modelos de alta calidad
Las pruebas se han enfocado principalmente en asegurar la máxima calidad con el mínimo número de tokens en el prompt, y no se ha confirmado cuánto puede mejorar la calidad usando un gran número de tokens. (Por favor, realiza tus propias pruebas y comparte los resultados)
Generalmente, los resultados más bellos se logran en el punto medio entre realidad y animación.
No obstante, al usar un prompt adecuado, generalmente no hay nada que no pueda expresar. (Afirmo que posee un valor abundante como modelo base que supera a otros en fusión. Sin embargo, ten en cuenta que esta es actualmente la v0.1)