Vista de un campo italiano soleado con colinas onduladas, granjas, un pintoresco pueblo con techos de terracota y nubes dramáticas bajo un cielo azul brillante.
Retrato en grabado de primer plano extremo estilo grunge en blanco y negro de un rostro con texturas detalladas y líneas expresivas, inspirado en Richard Hambleton.
Retrato abstracto oscuro de una figura femenina con silueta negra y vivas salpicaduras de pintura roja sobre un fondo claro, inspirado en el estilo de Richard Hambleton.
Ciudad futurista con altas torres cilíndricas de vidrio en un paisaje montañoso nevado bajo un cielo dramático al atardecer.
Hombre de dibujo animado con expresión de sorpresa, pelo salvaje y rizado, gafas y barba de pocos días, vistiendo una camisa amarilla a cuadros con corbata roja y tirantes azules sobre fondo verde texturizado.
Una figura de alpaca miniatura blanca y esponjosa con grandes ojos negros, situada junto a una pequeña casa marrón impresa en 3D.
Un arte vectorial digital vibrante al estilo William Wray que muestra un elefante relajado con forma de globo aerostático colorido y un pingüino extravagante posado encima, rodeados de globos multicolores contra un fondo de cielo.
Grabado impresionista que muestra la silueta de una mujer con vestido y sombrero de pie junto a un río, mirando a un perro pequeño, con un puente clásico de Londres y Big Ben al fondo.
Una silueta en estilo papel recortado de una mujer bailando tango, elaborada intrincadamente en arte de acero con influencia kirigami, rodeada de formas abstractas ondulantes.

Prompts Recomendados

(incredibly ultra lifelike, perfect professional precise, masterpiece, extremely beautiful, light and shadow

Prompts Negativos Recomendados

strabismus

(worst quality, normal quality, score_3, score_4

Parámetros Recomendados

samplers

Euler a, DPM++ 2M SDE Heun

steps

24 - 72

cfg

3 - 9.5

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Consejos

Si la generación de imágenes no produce resultado, intenta cambiar a CLIP SKIP 2 o modifica el prompt ligeramente cambiando el orden o las palabras.

Usar prompts en forma de oración tiende a mejorar la calidad de imagen más que listas de etiquetas.

Dejar el campo de prompt negativo vacío a menudo da mejores resultados en la imagen.

Consulta la spec grid para configuraciones óptimas antes de usar.

Experimenta con algunos prompts negativos específicos como 'estrabismo' para resolver problemas como ojos asimétricos o pixelación.

Aspectos Destacados de la Versión

• Fusionado más de 50 últimas versiones seleccionadas de modelos SDXL usando el script recursivo empleado en V3.

Patrocinadores del Creador

Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución se dedicará totalmente a avanzar la comunidad SDXL.

🙋🏼‍♂️ únete a nosotros (discord) ㅤ|ㅤ 🛒 comprar ㅤ|ㅤ 🌱 donar


Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución se dedicará totalmente a avanzar la comunidad SDXL.

🙋🏼‍♂️ únete a nosotros (discord)|ㅤ 🛒 comprarㅤ |ㅤ 🌱 donar


AlbedoBase XL (SFW&NSFW)

El refiner no es necesario, y se incluye VAE.


OBJETIVO

Stable Diffusion XL tiene 3.5 mil millones de parámetros (excluyendo el Refiner), lo que es aproximadamente 3.6 veces más que la versión SD v1.5. Creo que esto no es solo un número, sino uno que puede conducir a una mejora significativa en el rendimiento.

Hace tiempo nos dimos cuenta de que el rendimiento general de SD v1.5 ha mejorado más allá de la imaginación gracias a las explosivas contribuciones de nuestra comunidad. Por ello, estoy trabajando para completar este modelo AlbedoBase XL con el fin de reproducir óptimamente la mejora de rendimiento que ocurrió en v1.5 también en esta versión XL.

Mi objetivo es probar directamente el rendimiento de todos los Checkpoints y LoRAs que se suben públicamente a Civitai y fusionar solo los recursos que se consideren óptimos después de pasar por varios filtros. Esto superará el rendimiento de IA generadoras de imágenes de empresas como Midjourney.

Hasta ahora, AlbedoBase XL v3.1 Large ha fusionado alrededor de 200 checkpoints seleccionados y 251 LoRAs.


REGISTRO

v3.1-Large

• Fusionado más de 50 últimas versiones seleccionadas de modelos SDXL usando el script recursivo empleado en V3.

La spec grid(370.7 MB): descargar


v3-mini

Ofrezco una sincera disculpa por hacerles esperar tanto tiempo.

He estado lidiando con algunos asuntos personales y, mientras trabajaba en la nueva versión, también tuve problemas de salud. Incluso mientras escribo esto, sigo enfrentando esos desafíos.

Sentí que no bastaba con solo brindar una actualización breve, así que amablemente pido su comprensión mientras comparto este mensaje más detallado.

Desde el lanzamiento de la versión 2.0, me he dedicado a estudiar deep learning de forma independiente. No tengo un título formal, y aparte de una modesta aptitud para programación, solo tengo formación en artes. Por ello, carezco de la base matemática y científica para lograr grandes avances, dado el tiempo y esfuerzo invertidos. A pesar de esto, la experiencia de sumergirme en este estudio y investigación autodirigida ha sido un tesoro invalorable en mi vida.

Recientemente, descubrí una idea que podría ser un avance significativo. Tras rehacer cientos de fórmulas y métodos desde la versión 2.0, logré desarrollar un algoritmo bastante intrigante y exitoso. El proceso de fusión del modelo se basó en SDXL1.0 y SD1.5, junto con otros modelos cuidadosamente seleccionados. Estos se categorizaron en cinco clasificaciones principales: "ANIME", "REALISMO", "ARTÍSTICO", "NSFW" y "BASE", y se introdujeron como conjuntos de datos en el algoritmo de fusión. Este enfoque ha dado resultados fascinantes.

Sin embargo, tan desafiante como fue el desarrollo del algoritmo, nada ha sido tan difícil como la fase de prueba de rendimiento. Mi salud física y mental se deterioró mucho durante este período, al punto de darme cuenta de que no podía continuar solo con este trabajo. Esto finalmente me llevó a decidir lanzar esta versión.

Y ahora, me emociona anunciar el lanzamiento de la tan esperada versión AlbedoBaseXL V3 Mini. Aunque este modelo es una fusión a menor escala, no está limitado a ninguna área específica y funciona de manera sobresaliente en varios dominios. Tiene el potencial de servir como un nuevo modelo base para SDXL1.0. (Para referencia, mi algoritmo de fusión no es una "fusión lineal", por lo que esencialmente puede considerarse un nuevo modelo afinado.)

Este modelo, junto con los modelos AlbedoBase existentes, es versátil y supera todas las versiones anteriores en todos los aspectos. (El contenido NSFW, aunque no es extremo, ofrece un rango más amplio de expresión comparado con versiones anteriores como la v2.1. Un modelo dedicado de fusión NSFW será lanzado en el futuro.)

Por otro lado, he notado que muchos modelos compartidos recientemente han comenzado a adoptar licencias que prohíben la fusión o la comercialización externa. Esto ha sido decepcionante, ya que me ha impedido usar algunos modelos realmente excelentes para fusionar.

Quiero expresar mi más sincero agradecimiento a los desarrolladores de modelos que han provisto licencias libres, permitiendo que sus modelos de alta calidad—productos de considerable tiempo y esfuerzo—se puedan usar para fusionar.

Volveré pronto.

Espero con entusiasmo sus pruebas de rendimiento en una amplia gama de áreas, incluyendo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D y NSFW.

Como desarrolladores de modelos, solo plantamos las semillas. En última instancia, son ustedes, los usuarios y artistas del modelo, quienes las cultivan y hacen florecer los frutos.

Gracias, como siempre.


Para quienes deseen apoyar mi trabajo con una pequeña contribución financiera, por favor consideren usar los enlaces abajo. Actualmente no puedo conseguir empleo y enfrento un futuro incierto en cuanto a mi sustento.

🌱 donar

La spec grid(380.5 MB): descargar


v2.1
Re-fusión y ajuste de v0.1 a 2.0 usando nuevo algoritmo y fórmula de fusión.

La spec grid(424.5 MB): descargar

v2.0

Quiero agradecer a todos los que me ayudaron en el lado AlbedoBase XL Pre. Sin ustedes la fecha de lanzamiento probablemente hubiera sido mucho más tardía. ¡Muchas gracias!

  • He escrito un script personalizado para converger los modelos AlbedoBase XL existentes en uno solo, alineando intrincadamente los pesos de fila y columna de todos los bloques U-NET y CLIP según una fórmula única mía.

  • Si encuentras un error en la generación de imágenes (si no se genera nada), ¡cambia a CLIP SKIP 2 o modifica un poco el prompt! Puede haber combinaciones de prompts que CLIP no reconozca. En ese caso, puedes cambiar el orden de las palabras, usar palabras diferentes o, más simple aún, cambiar el CLIP SKIP. Trabajaré gradualmente para resolver estos problemas en el futuro como en v1.3.

La spec grid(403.5 MB): descargar

v1.3

  • Para ilustrar la calidad asociada con la aleatoriedad del modelo, estandaricé el valor de la semilla a '9' para todas las imágenes de muestra destinadas al muestreo y procedí a generarlas inmediatamente.

  • Especialmente con esta versión, debido al impacto significativo de los prompts negativos, dejar el campo de prompt negativo vacío probablemente produzca buena calidad.

La spec grid(438.7 MB): descargar

  • Como puedes ver, al aumentar el número de Steps, se vuelve usable para todos los samplers y mejora la calidad.

  • Debido al efecto del LoRA que desarrollé y fusioné, como se describe abajo, usar prompts en forma de oración en vez de listas de etiquetas está directamente relacionado con mejorar la calidad.

  • Fusioné 45 checkpoints y 7 LoRAs. Después, fusioné AlbedoBase v0.4 y v0.3 en orden, entre 0 y 5%, para reactivar los modelos fusionados diluidos que se habían vuelto obsoletos.

  • De los 7 LoRAs, uno fue creado por mí. Implica analizar y anotar descripciones para un total de 174 fotos pictóricas de alta calidad usando GPT4-V. La fusión de este LoRA resultó en imágenes sorprendentemente claras y una impresionante comprensión de los prompts.

  • Mis LoRAs creados por mí mismo están exclusivamente disponibles para compra a mis seguidores en Ko-fi con nivel Creative o superior.


v1.2

  • Fusionados los 22 checkpoints más recientes.

La spec grid(565.6 MB): descargar

v1.1

  • Estabilizado.

  • Más detallado.

  • Si crees que eres usuario avanzado, recomiendo la versión 1.0. Si la versión 1.0 encuentra la configuración adecuada, puede generar obras mucho más vívidas.

La spec grid(349.7 MB): descargar

v1.0

  • Fusioné 106 LoRAs.

  • Fusioné 19 Checkpoints.

  1. El modelo puede producir resultados diferentes según la configuración que elijas, por lo que es importante consultar la spec grid antes de usarlo.

    • He descubierto que usar algunos prompts negativos específicos puede ayudar a resolver problemas como ojos asimétricos o imágenes pixeladas. La Spec Grid puede variar según tu CPU o GPU, así que úsala como referencia general. Experimenta con algunos prompts negativos para mejorar la calidad (ej: estrabismo). Encontré que es difícil satisfacer todas las configuraciones por igual conforme aumenta el número de LoRAs fusionados. Sin embargo, quiero que te enfoques en esta ventaja en la versión 1.0, ya que puede producir obras de calidad asombrosa en varios aspectos con la configuración correcta. Volveré con una versión más estable en el futuro.

  2. Puedes encontrar valores útiles de configuración en la vitrina o buscando otros.

  3. Como siempre, es mejor dejar el prompt negativo en blanco para mejores resultados.

  4. Esta v1.0 fue mucho trabajo, así que tomaré un descanso por un tiempo. Espero que disfrutes usar el modelo, y si lo fusionas, por favor compártelo gratis en Civitai. Así todos podremos seguir mejorándolo.

La spec grid(479.4 MB): descargar

v0.4

  • Fusioné 132 LoRAs.

  • Fusioné 4 Checkpoints.

La spec grid: descargar

v0.3

  • Mejorado en todos los samplers.

  • Alcanzó un realismo natural.

  • Estabilizado.

La spec grid: descargar

v0.2

  • Mejoras significativas en claridad y detalles.

  • Mejorada la implementación de manos y pies.

  • Mejoras estéticas mayores; composición, abstracción, fluidez, luz y color, etc.

v0.1

  • Después de un ajuste fino apropiado del modelo SDXL1.0, fusioné meticulosamente y con propósito más de 40 modelos de alta calidad disponibles públicamente en Civitai.

  • Las pruebas se enfocaron principalmente en asegurar la máxima calidad con el mínimo número de tokens en el prompt, y no se ha confirmado cuánto puede mejorar la calidad usando gran cantidad de tokens. (Por favor realiza tus propias pruebas y comparte los resultados)

  • Típicamente, los resultados más hermosos se logran en el punto medio entre realidad y animación.

  • No obstante, con un prompt adecuado, generalmente no hay nada que no pueda expresar. (Afirmo que posee un valor abundante como modelo base que supera a otros en fusionar. Sin embargo, ten en cuenta que actualmente es v0.1)


Anterior
Shuttle 3 Diffusion - bf16
Siguiente
WaduStyle - V1

Detalles del Modelo

Tipo de modelo

Checkpoint

Modelo base

SDXL 1.0

Versión del modelo

v3.1-Large

Hash del modelo

c379d154eb

Creador

Discusión

Por favor log in para dejar un comentario.

Imágenes por AlbedoBase XL - v3.1-Large

Vista de un campo italiano soleado con colinas onduladas, granjas, un pintoresco pueblo con techos de terracota y nubes dramáticas bajo un cielo azul brillante.
Retrato en grabado de primer plano extremo estilo grunge en blanco y negro de un rostro con texturas detalladas y líneas expresivas, inspirado en Richard Hambleton.
Retrato abstracto oscuro de una figura femenina con silueta negra y vivas salpicaduras de pintura roja sobre un fondo claro, inspirado en el estilo de Richard Hambleton.
Ciudad futurista con altas torres cilíndricas de vidrio en un paisaje montañoso nevado bajo un cielo dramático al atardecer.
Hombre de dibujo animado con expresión de sorpresa, pelo salvaje y rizado, gafas y barba de pocos días, vistiendo una camisa amarilla a cuadros con corbata roja y tirantes azules sobre fondo verde texturizado.
Una figura de alpaca miniatura blanca y esponjosa con grandes ojos negros, situada junto a una pequeña casa marrón impresa en 3D.
Un arte vectorial digital vibrante al estilo William Wray que muestra un elefante relajado con forma de globo aerostático colorido y un pingüino extravagante posado encima, rodeados de globos multicolores contra un fondo de cielo.
Grabado impresionista que muestra la silueta de una mujer con vestido y sombrero de pie junto a un río, mirando a un perro pequeño, con un puente clásico de Londres y Big Ben al fondo.
Una silueta en estilo papel recortado de una mujer bailando tango, elaborada intrincadamente en arte de acero con influencia kirigami, rodeada de formas abstractas ondulantes.

Imágenes con 3d

Retrato fotorrealista en primer plano de una chica hipster estilosa con maquillaje oscuro, mandíbula definida y un collar atractivo.
Imagen 3D realista de Tifa Lockhart sentada con una pierna levantada, vistiendo un sujetador deportivo blanco y pantalones deportivos negros, mostrando piel brillante y sudor sobre un fondo blanco sencillo.
Una tortuga muy detallada con un jetpack, volando sobre un canal urbano vibrante rodeado de edificios coloridos bajo un cielo azul.
Un vibrante coche clásico amarillo acelerando en una calle urbana mojada con una gran explosión al fondo bajo un cielo nublado.
Loona de Helluva Boss sentada en una silla gamer con grandes ojos rojos tristes, sosteniendo un cartel en llamas que dice 'Necesito a Buzz para generar más Loona' dentro de una sala de juegos.
Dormitorio futurista compacto con diseño metálico e industrial, con una cama desordenada cerca de una gran ventana panorámica que ofrece vista a un skyline de ciudad cyberpunk iluminada con neón por la noche.
Una imagen fotorrealista de una mujer elegante con un llamativo vestido rojo y gafas de sol, de pie con confianza en una terminal de aeropuerto rodeada por una apilada y caótica montaña de maletas coloridas sobre un carrito de equipaje.
Una chica polilla 3D realista con cabello dividido en negro y blanco, ojos rojos grandes y una expresión asombrada con baba, inclinada sobre una bombilla brillante sobre una mesa de madera.
Una arbalista medieval femenina renderizada en 3D con cabello castaño trenzado, ojos marrones, vistiendo ropa medieval marrón claro y armadura de cuero, sosteniendo una ballesta con una mirada seria de lado.
Arte digital 3D de un gato amarillo pirata con ojos azules brillantes, un gran sombrero pirata azul marino adornado con un emblema de calavera, una detallada capa azul marino sujetada por cadenas doradas y un abrigo marrón que se muestra con confianza frente a un fondo de vidrieras.

Imágenes con todo en uno

Una monja de anime linda con cabello rubio trenzado, ojos grandes y azules, y una expresión alegre. Está vestida con un hábito tradicional de monja con velo negro y cintillo blanco, sosteniendo las manos en una pose de oración. Esta imagen es generada por IA usando Stable Diffusion.
Chica estilo anime con cabello largo azul en una cola de caballo, sosteniendo una katana, de pie bajo árboles de sakura en flor. Creado con IA usando Stable Diffusion.
Chica anime con largo cabello azul grisáceo, atuendo ornamentado y accesorios detallados, imagen generada por IA usando Stable Diffusion.

Imágenes con anime

Una pintura digital detallada de una chica anime con cabello rubio y llamativos ojos azules, iluminada por una luz suave y onírica en estilo CGI.
Retrato en primer plano de Dio Brando con cabello rubio y cinta verde, rodeado de efectos brillantes bajo un cielo azul brillante.
Un bar cyberpunk iluminado con luces de neón violetas, lleno de clientes futuristas que llevan cascos y equipo cibernético, con pantallas holográficas y una atmósfera de alta tecnología.
Una chica de anime detallada con cabello rubio vistiendo ropa blanca y roja caminando por un arroyo del bosque rodeada de medusas naranjas luminosas al atardecer.
Retrato de una chica elfa con largas coletas blancas, ojos azules, orejas puntiagudas, vistiendo una capa blanca con borde dorado y joyas sobre fondo negro.
Chica elfa estilo anime con largas coletas plateadas y ojos verdes, de pie en un campo de flores azules, vistiendo una capa blanca, camisa a rayas y pantimedias negras.
Una joven mujer anime con ojos azules y cabello castaño frente a un fondo de mosaico floral azul cobalto en una estética de sueño.
Ilustración digital en estilo anime que muestra una gran estructura de pirámide de piedra triangular puntiaguda en tierra árida con rocas dispersas bajo un cielo estrellado y un planeta con anillos naranjas.
Guerrera femenina detallada en estilo anime con traje de cuero negro, adoptando una pose dinámica con efectos coloridos en azul y naranja en remolino de fondo.
Un retrato detallado de un cyborg con cabello largo y blanco, ojos azules y armadura robótica intrincada de pie en un paisaje urbano ciberpunk futurista de noche.

Imágenes con modelo base

Escena fotorrealista de personajes no muertos incluyendo zombis y esqueletos caminando por un cementerio tenebroso iluminado por calabazas Jack-o'-lantern brillantes bajo un cielo oscuro y ominoso.

Imágenes con fotorrealista

Silueta de un hombre cibernético con alas y piernas largas y delgadas, rellena con collage mixto fotorrealista de paisajes urbanos y edificios bajo iluminación cinematográfica.
Imagen futurista en blanco y negro con líneas metálicas que se extienden desde arriba, con follaje teñido de rojo que enmarca la escena y un diamante azul pulsante en el centro.
Imagen fotorrealista de un robot de ama de llaves acostado en el suelo del bosque con follaje entrelazado en su cabello y partes del cuerpo robóticas, vestido con un vestido de ama de llaves blanco.
Supermodelo de fantasía con belleza etérea que lleva un vestido vanguardia vibrante y colorido, adornado con joyería intrincada, sobre un fondo multicolor vibrante en remolino.
Joven barista femenina de pie detrás de un mostrador rústico de cafetería, vistiendo una camisa negra abotonada y un delantal negro, sonriendo suavemente con maquillaje natural y cabello recogido.
Tres mujeres vistiendo suéteres y pantalones estilo náutico, juntas en la cubierta de un yate de lujo por la noche con un fondo del océano caribeño.
Escena fotorrealista de una joven japonesa con un vestido de verano colorido y fluido caminando por un sendero en el bosque rodeada de medusas luminosas flotantes bajo luz natural.
Una niña linda sentada cómodamente en una biblioteca acogedora, estudiando a la luz de una vela con iluminación ambiental cálida y un libro abierto frente a ella.
Una ilustración vectorial 2D detallada de una mujer adornada con flores de orquídea negra y patrones florales intrincados en estilo barroco.
Primer plano de un joven con barba corta rubia y gafas, medio iluminado por el sol de la mañana, con un gato atigrado descansando en su hombro.