modelos/AlbedoBase XL - v3.1-Large

AlbedoBase XL - v3.1-Large

7/27/2025

1:17:51 AM

Palabras Clave y Etiquetas Relacionadas

2d,3d,albedobase xl,todo en uno,anime,modelo base,punto de control,cinematográfico,juego,modelo de generación de imágenes,loras combinados,fotorrealista,sdxl,sdxl 1.0,stable diffusion xl

Vista de un campo italiano soleado con colinas onduladas, granjas, un pintoresco pueblo con techos de terracota y nubes dramáticas bajo un cielo azul brillante.

Retrato en grabado de primer plano extremo estilo grunge en blanco y negro de un rostro con texturas detalladas y líneas expresivas, inspirado en Richard Hambleton.

Retrato abstracto oscuro de una figura femenina con silueta negra y vivas salpicaduras de pintura roja sobre un fondo claro, inspirado en el estilo de Richard Hambleton.

Ciudad futurista con altas torres cilíndricas de vidrio en un paisaje montañoso nevado bajo un cielo dramático al atardecer.

Hombre de dibujo animado con expresión de sorpresa, pelo salvaje y rizado, gafas y barba de pocos días, vistiendo una camisa amarilla a cuadros con corbata roja y tirantes azules sobre fondo verde texturizado.

Una figura de alpaca miniatura blanca y esponjosa con grandes ojos negros, situada junto a una pequeña casa marrón impresa en 3D.

Un arte vectorial digital vibrante al estilo William Wray que muestra un elefante relajado con forma de globo aerostático colorido y un pingüino extravagante posado encima, rodeados de globos multicolores contra un fondo de cielo.

Grabado impresionista que muestra la silueta de una mujer con vestido y sombrero de pie junto a un río, mirando a un perro pequeño, con un puente clásico de Londres y Big Ben al fondo.

Una silueta en estilo papel recortado de una mujer bailando tango, elaborada intrincadamente en arte de acero con influencia kirigami, rodeada de formas abstractas ondulantes.

Prompts Recomendados

(incredibly ultra lifelike, perfect professional precise, masterpiece, extremely beautiful, light and shadow

Prompts Negativos Recomendados

strabismus

(worst quality, normal quality, score_3, score_4

Parámetros Recomendados

samplers

Euler a, DPM++ 2M SDE Heun

steps

24 - 72

cfg

3 - 9.5

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Consejos

Si la generación de imágenes no produce resultado, intenta cambiar a CLIP SKIP 2 o modifica el prompt ligeramente cambiando el orden o las palabras.

Usar prompts en forma de oración tiende a mejorar la calidad de imagen más que listas de etiquetas.

Dejar el campo de prompt negativo vacío a menudo da mejores resultados en la imagen.

Consulta la spec grid para configuraciones óptimas antes de usar.

Experimenta con algunos prompts negativos específicos como 'estrabismo' para resolver problemas como ojos asimétricos o pixelación.

Aspectos Destacados de la Versión

• Fusionado más de 50 últimas versiones seleccionadas de modelos SDXL usando el script recursivo empleado en V3.

Patrocinadores del Creador

Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución se dedicará totalmente a avanzar la comunidad SDXL.

🙋🏼‍♂️ únete a nosotros (discord) ㅤ|ㅤ 🛒 comprar ㅤ|ㅤ 🌱 donar

Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución se dedicará totalmente a avanzar la comunidad SDXL.

🙋🏼‍♂️ únete a nosotros (discord) ㅤ|ㅤ 🛒 comprarㅤ |ㅤ 🌱 donar

AlbedoBase XL (SFW&NSFW)

El refiner no es necesario, y se incluye VAE.

OBJETIVO

Stable Diffusion XL tiene 3.5 mil millones de parámetros (excluyendo el Refiner), lo que es aproximadamente 3.6 veces más que la versión SD v1.5. Creo que esto no es solo un número, sino uno que puede conducir a una mejora significativa en el rendimiento.

Hace tiempo nos dimos cuenta de que el rendimiento general de SD v1.5 ha mejorado más allá de la imaginación gracias a las explosivas contribuciones de nuestra comunidad. Por ello, estoy trabajando para completar este modelo AlbedoBase XL con el fin de reproducir óptimamente la mejora de rendimiento que ocurrió en v1.5 también en esta versión XL.

Mi objetivo es probar directamente el rendimiento de todos los Checkpoints y LoRAs que se suben públicamente a Civitai y fusionar solo los recursos que se consideren óptimos después de pasar por varios filtros. Esto superará el rendimiento de IA generadoras de imágenes de empresas como Midjourney.

Hasta ahora, AlbedoBase XL v3.1 Large ha fusionado alrededor de 200 checkpoints seleccionados y 251 LoRAs.

REGISTRO

v3.1-Large

• Fusionado más de 50 últimas versiones seleccionadas de modelos SDXL usando el script recursivo empleado en V3.

La spec grid(370.7 MB): descargar

v3-mini

Ofrezco una sincera disculpa por hacerles esperar tanto tiempo.

He estado lidiando con algunos asuntos personales y, mientras trabajaba en la nueva versión, también tuve problemas de salud. Incluso mientras escribo esto, sigo enfrentando esos desafíos.

Sentí que no bastaba con solo brindar una actualización breve, así que amablemente pido su comprensión mientras comparto este mensaje más detallado.

Desde el lanzamiento de la versión 2.0, me he dedicado a estudiar deep learning de forma independiente. No tengo un título formal, y aparte de una modesta aptitud para programación, solo tengo formación en artes. Por ello, carezco de la base matemática y científica para lograr grandes avances, dado el tiempo y esfuerzo invertidos. A pesar de esto, la experiencia de sumergirme en este estudio y investigación autodirigida ha sido un tesoro invalorable en mi vida.

Recientemente, descubrí una idea que podría ser un avance significativo. Tras rehacer cientos de fórmulas y métodos desde la versión 2.0, logré desarrollar un algoritmo bastante intrigante y exitoso. El proceso de fusión del modelo se basó en SDXL1.0 y SD1.5, junto con otros modelos cuidadosamente seleccionados. Estos se categorizaron en cinco clasificaciones principales: "ANIME", "REALISMO", "ARTÍSTICO", "NSFW" y "BASE", y se introdujeron como conjuntos de datos en el algoritmo de fusión. Este enfoque ha dado resultados fascinantes.

Sin embargo, tan desafiante como fue el desarrollo del algoritmo, nada ha sido tan difícil como la fase de prueba de rendimiento. Mi salud física y mental se deterioró mucho durante este período, al punto de darme cuenta de que no podía continuar solo con este trabajo. Esto finalmente me llevó a decidir lanzar esta versión.

Y ahora, me emociona anunciar el lanzamiento de la tan esperada versión AlbedoBaseXL V3 Mini. Aunque este modelo es una fusión a menor escala, no está limitado a ninguna área específica y funciona de manera sobresaliente en varios dominios. Tiene el potencial de servir como un nuevo modelo base para SDXL1.0. (Para referencia, mi algoritmo de fusión no es una "fusión lineal", por lo que esencialmente puede considerarse un nuevo modelo afinado.)

Este modelo, junto con los modelos AlbedoBase existentes, es versátil y supera todas las versiones anteriores en todos los aspectos. (El contenido NSFW, aunque no es extremo, ofrece un rango más amplio de expresión comparado con versiones anteriores como la v2.1. Un modelo dedicado de fusión NSFW será lanzado en el futuro.)

Por otro lado, he notado que muchos modelos compartidos recientemente han comenzado a adoptar licencias que prohíben la fusión o la comercialización externa. Esto ha sido decepcionante, ya que me ha impedido usar algunos modelos realmente excelentes para fusionar.

Quiero expresar mi más sincero agradecimiento a los desarrolladores de modelos que han provisto licencias libres, permitiendo que sus modelos de alta calidad—productos de considerable tiempo y esfuerzo—se puedan usar para fusionar.

Volveré pronto.

Espero con entusiasmo sus pruebas de rendimiento en una amplia gama de áreas, incluyendo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D y NSFW.

Como desarrolladores de modelos, solo plantamos las semillas. En última instancia, son ustedes, los usuarios y artistas del modelo, quienes las cultivan y hacen florecer los frutos.

Gracias, como siempre.

Para quienes deseen apoyar mi trabajo con una pequeña contribución financiera, por favor consideren usar los enlaces abajo. Actualmente no puedo conseguir empleo y enfrento un futuro incierto en cuanto a mi sustento.

🌱 donar

La spec grid(380.5 MB): descargar

v2.1
Re-fusión y ajuste de v0.1 a 2.0 usando nuevo algoritmo y fórmula de fusión.

La spec grid(424.5 MB): descargar

v2.0

Quiero agradecer a todos los que me ayudaron en el lado AlbedoBase XL Pre. Sin ustedes la fecha de lanzamiento probablemente hubiera sido mucho más tardía. ¡Muchas gracias!

He escrito un script personalizado para converger los modelos AlbedoBase XL existentes en uno solo, alineando intrincadamente los pesos de fila y columna de todos los bloques U-NET y CLIP según una fórmula única mía.
Si encuentras un error en la generación de imágenes (si no se genera nada), ¡cambia a CLIP SKIP 2 o modifica un poco el prompt! Puede haber combinaciones de prompts que CLIP no reconozca. En ese caso, puedes cambiar el orden de las palabras, usar palabras diferentes o, más simple aún, cambiar el CLIP SKIP. Trabajaré gradualmente para resolver estos problemas en el futuro como en v1.3.

La spec grid(403.5 MB): descargar

v1.3

Para ilustrar la calidad asociada con la aleatoriedad del modelo, estandaricé el valor de la semilla a '9' para todas las imágenes de muestra destinadas al muestreo y procedí a generarlas inmediatamente.
Especialmente con esta versión, debido al impacto significativo de los prompts negativos, dejar el campo de prompt negativo vacío probablemente produzca buena calidad.

La spec grid(438.7 MB): descargar

Como puedes ver, al aumentar el número de Steps, se vuelve usable para todos los samplers y mejora la calidad.
Debido al efecto del LoRA que desarrollé y fusioné, como se describe abajo, usar prompts en forma de oración en vez de listas de etiquetas está directamente relacionado con mejorar la calidad.

Fusioné 45 checkpoints y 7 LoRAs. Después, fusioné AlbedoBase v0.4 y v0.3 en orden, entre 0 y 5%, para reactivar los modelos fusionados diluidos que se habían vuelto obsoletos.
De los 7 LoRAs, uno fue creado por mí. Implica analizar y anotar descripciones para un total de 174 fotos pictóricas de alta calidad usando GPT4-V. La fusión de este LoRA resultó en imágenes sorprendentemente claras y una impresionante comprensión de los prompts.

Mis LoRAs creados por mí mismo están exclusivamente disponibles para compra a mis seguidores en Ko-fi con nivel Creative o superior.

v1.2

Fusionados los 22 checkpoints más recientes.

La spec grid(565.6 MB): descargar

v1.1

Estabilizado.
Más detallado.
Si crees que eres usuario avanzado, recomiendo la versión 1.0. Si la versión 1.0 encuentra la configuración adecuada, puede generar obras mucho más vívidas.

La spec grid(349.7 MB): descargar

v1.0

Fusioné 106 LoRAs.
Fusioné 19 Checkpoints.

El modelo puede producir resultados diferentes según la configuración que elijas, por lo que es importante consultar la spec grid antes de usarlo.
- He descubierto que usar algunos prompts negativos específicos puede ayudar a resolver problemas como ojos asimétricos o imágenes pixeladas. La Spec Grid puede variar según tu CPU o GPU, así que úsala como referencia general. Experimenta con algunos prompts negativos para mejorar la calidad (ej: estrabismo). Encontré que es difícil satisfacer todas las configuraciones por igual conforme aumenta el número de LoRAs fusionados. Sin embargo, quiero que te enfoques en esta ventaja en la versión 1.0, ya que puede producir obras de calidad asombrosa en varios aspectos con la configuración correcta. Volveré con una versión más estable en el futuro.
Puedes encontrar valores útiles de configuración en la vitrina o buscando otros.
Como siempre, es mejor dejar el prompt negativo en blanco para mejores resultados.
Esta v1.0 fue mucho trabajo, así que tomaré un descanso por un tiempo. Espero que disfrutes usar el modelo, y si lo fusionas, por favor compártelo gratis en Civitai. Así todos podremos seguir mejorándolo.

La spec grid(479.4 MB): descargar

v0.4

Fusioné 132 LoRAs.
Fusioné 4 Checkpoints.

La spec grid: descargar

v0.3

Mejorado en todos los samplers.
Alcanzó un realismo natural.
Estabilizado.

La spec grid: descargar

v0.2

Mejoras significativas en claridad y detalles.
Mejorada la implementación de manos y pies.
Mejoras estéticas mayores; composición, abstracción, fluidez, luz y color, etc.

v0.1

Después de un ajuste fino apropiado del modelo SDXL1.0, fusioné meticulosamente y con propósito más de 40 modelos de alta calidad disponibles públicamente en Civitai.
Las pruebas se enfocaron principalmente en asegurar la máxima calidad con el mínimo número de tokens en el prompt, y no se ha confirmado cuánto puede mejorar la calidad usando gran cantidad de tokens. (Por favor realiza tus propias pruebas y comparte los resultados)
Típicamente, los resultados más hermosos se logran en el punto medio entre realidad y animación.
No obstante, con un prompt adecuado, generalmente no hay nada que no pueda expresar. (Afirmo que posee un valor abundante como modelo base que supera a otros en fusionar. Sin embargo, ten en cuenta que actualmente es v0.1)