Un núcleo bioluminiscente brillante dentro de los escombros de un planeta destruido flotando de manera inquietante sobre un paisaje rocoso y oscuro en el espacio.
Una figura fotorrealista que se asemeja a un hongo matamoscas con un gran sombrero rojo, de pie en un bosque mágico durante el atardecer azul, rodeada de hongos más pequeños y un follaje vibrante.
Una mujer con traje espacial azul está dentro de una estación espacial, con las manos levantadas expresivamente cerca de una gran ventana que muestra la Tierra al fondo, capturada con colores profundos y un grano sutil.
Robot endoesqueleto T800 con camiseta blanca rota y pantalones deportivos azules sosteniendo una cesta con piel humana en un entorno interior de lavandería con iluminación cinematográfica y gran detalle.
Bosque exótico vibrante estilo LEGO con un río cristalino fluyendo, bajo cielos azules brillantes y destello solar, detallado con vegetación frondosa de LEGO.

Prompts Negativos Recomendados

strabismus,asymmetrical eyes,pixelated images

amateur quality, vague shapes, vague texture, wrong perspective, ugly, dowdy style

Parámetros Recomendados

samplers

DPM++ 2M SDE Heun Karras

steps

24

cfg

8

clip skip

2

resolution

1024x1024, 720x1280

vae

Included VAE - default

Consejos

Si encuentras un error donde no se genera nada, cambia a CLIP SKIP 2 o modifica ligeramente el prompt.

Usar prompts en forma de oración en lugar de una lista de etiquetas mejora la calidad de la imagen.

Dejar el campo de prompt negativo vacío a menudo produce las mejores imágenes de calidad.

Revisa la grilla de especificaciones para configuraciones recomendadas antes de usarlo.

Experimenta con algunos prompts negativos para resolver problemas como ojos asimétricos o pixelación.

Aspectos Destacados de la Versión

He escrito un script personalizado para converger los modelos existentes AlbedoBase XL en uno solo. Alineando intrincadamente los pesos de fila y columna de todos los bloques U-NET y CLIP según una fórmula única mía.

Patrocinadores del Creador

Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución será dedicada íntegramente a avanzar la comunidad de SDXL.

🙋🏼‍♂️ únete a nosotros (discord)|ㅤ 🛒 comprarㅤ |ㅤ 🌱 donar


Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución será dedicada íntegramente a avanzar la comunidad de SDXL.

🙋🏼‍♂️ únete a nosotros (discord)|ㅤ 🛒 comprarㅤ |ㅤ 🌱 donar


AlbedoBase XL (SFW&NSFW)

No es necesario el refinador, y el VAE está incluido.


OBJETIVO

Stable Diffusion XL tiene 3.5 mil millones de parámetros (excluyendo el Refinador), que es alrededor de 3.6 veces más que la versión SD v1.5. Creo que esto no es solo un número, sino un número que puede conducir a una mejora significativa en el rendimiento.

Ha pasado un tiempo desde que nos dimos cuenta de que el rendimiento general de SD v1.5 mejoró más allá de la imaginación gracias a las explosivas contribuciones de nuestra comunidad. Por lo tanto, estoy trabajando para completar este modelo AlbedoBase XL para reproducir de forma óptima la mejora de rendimiento que ocurrió en v1.5 en esta versión XL también.

Mi objetivo es probar directamente el rendimiento de todos los Checkpoints y LoRAs que están públicamente subidos en Civitai, y fusionar solamente los recursos que se consideren óptimos tras pasar por varios filtros. Esto superará el rendimiento de la IA generadora de imágenes de compañías como Midjourney.

Hasta ahora, AlbedoBase XL v3.1 Large ha fusionado aproximadamente 200 checkpoints seleccionados y 251 LoRAs.


REGISTRO

v3.1-Large

• Fusionó más de 50 versiones seleccionadas recientes de modelos SDXL utilizando el script recursivo empleado en V3.

La grilla de especificaciones(370.7 MB): descargar


v3-mini

Ofrezco una sincera disculpa por haberte hecho esperar tanto tiempo.

He estado lidiando con asuntos personales, y mientras trabajaba en la nueva versión también enfrenté problemas de salud. Incluso mientras escribo esto, todavía estoy lidiando con esos desafíos.

Sentí que no sería suficiente solo proporcionar una actualización breve, por eso te pido amablemente comprensión al compartir este mensaje más detallado.

Desde el lanzamiento de la versión 2.0, me he dedicado a estudiar aprendizaje profundo de forma independiente. No tengo un título formal, y aparte de una aptitud modesta para programación, solo tengo formación en artes. Como resultado, carezco de la base matemática y científica para lograr avances significativos, dado el tiempo y esfuerzo invertidos. A pesar de ello, la experiencia de sumergirme en este estudio y investigación autodidacta ha sido un tesoro invaluable en mi vida.

Recientemente, encontré una idea que podría ser un gran avance. Tras rehacer cientos de fórmulas y métodos desde la versión 2.0, logré desarrollar un algoritmo bastante intrigante y exitoso. El proceso de fusión de modelos se basó en SDXL1.0 y SD1.5, junto con otros modelos cuidadosamente seleccionados. Estos se categorizaron en cinco clasificaciones principales: “ANIME,” “REALISMO,” “ARTÍSTICO,” “NSFW,” y “BASE,” y se alimentaron al algoritmo de fusión como conjuntos de datos. Este enfoque ha dado resultados fascinantes.

Sin embargo, tan desafiante como fue el desarrollo del algoritmo, nada fue tan complicado como la fase de pruebas de rendimiento. Mi salud física y mental se deterioró significativamente durante este período, hasta el punto de darme cuenta de que no podía continuar este trabajo solo. Esto fue lo que finalmente me llevó a decidir liberar esta versión.

Y ahora, estoy emocionado de anunciar el lanzamiento de la tan esperada versión AlbedoBaseXL V3 Mini. Aunque este modelo es una fusión a menor escala, no está limitado a un área específica y funciona notablemente bien en diversos dominios. Tiene el potencial de servir como un nuevo modelo base para SDXL1.0. (Para referencia, mi algoritmo de fusión no es “fusión lineal,” por lo que esencialmente puede considerarse un nuevo modelo afinado.)

Este modelo, junto con los existentes modelos AlbedoBase, es versátil y supera todas las versiones anteriores en todos los aspectos. (El contenido NSFW, aunque no extremo, ofrece un rango de expresión más amplio en comparación con versiones anteriores como la v2.1. Se lanzará un modelo de fusión específico para NSFW en el futuro.)

Por otro lado, he notado que muchos modelos compartidos recientemente han comenzado a adoptar licencias que prohíben la fusión o la comercialización externa. Esto ha sido una decepción, ya que me ha impedido usar algunos modelos realmente excelentes para fusionar.

Quisiera expresar mi más sincero agradecimiento a los desarrolladores de modelos que han proporcionado licencias gratuitas, permitiendo que sus modelos de alta calidad—productos de considerable tiempo y esfuerzo—se usen para fusión.

Volveré pronto.

Espero con ansias tus pruebas de rendimiento en una amplia gama de áreas, incluyendo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D, y NSFW.

Como desarrolladores de modelos, solo plantamos las semillas. En última instancia, son ustedes, los usuarios y artistas de modelos, quienes las cultivan y hacen florecer los frutos.

Gracias, como siempre.


Para quienes deseen apoyar mi trabajo con una pequeña contribución financiera, por favor consideren usar los enlaces a continuación. Actualmente no puedo asegurar empleo y enfrento un futuro incierto respecto a mi sustento.

🌱 donar

La grilla de especificaciones(380.5 MB): descargar


v2.1
Re-fusionar y ajustar v0.1 a 2.0 usando el nuevo algoritmo y fórmula de fusión.

La grilla de especificaciones(424.5 MB): descargar

v2.0

Quiero agradecer a todos los que me ayudaron en el lado AlbedoBase XL Pre. Sin ustedes, la fecha de lanzamiento probablemente habría sido mucho más tarde. ¡Muchas gracias!

  • He escrito un script personalizado para converger los modelos existentes de AlbedoBase XL en uno solo. Alineando intrincadamente los pesos de fila y columna de todos los bloques U-NET y CLIP según una fórmula única mía.

  • Si encuentras un error en la generación de imagen (si no se genera nada), ¡por favor cambia a CLIP SKIP 2 o modifica ligeramente el prompt! Puede haber combinaciones de prompts que CLIP no reconozca. En ese caso, puedes cambiar el orden de las palabras, usar palabras diferentes o, más simplemente, cambiar el CLIP SKIP. Trabajaré gradualmente en resolver estos problemas en el futuro como en v1.3.

La grilla de especificaciones(403.5 MB): descargar

v1.3

  • Para ilustrar la calidad asociada con la aleatoriedad del modelo, estandaricé el valor seed a '9' para todas las imágenes de muestra destinadas a muestreo y procedí con su generación inmediata.

  • Especialmente con esta versión, debido al impacto significativo de los prompts negativos, dejar el campo de prompt negativo vacío probablemente produzca la mejor calidad.

La grilla de especificaciones(438.7 MB): descargar

  • Como puedes ver, a medida que aumentan los Steps, se vuelve disponible para todos los samplers, y la calidad también mejora.

  • Debido al efecto del LoRA que desarrollé y fusioné, como se describe más abajo, usar prompts en forma de oración en lugar de tags (lista de palabras) está directamente relacionado con la mejora de calidad.

  • Fusioné 45 checkpoints y 7 LoRAs. Luego, fusioné AlbedoBase v0.4 y v0.3 en orden, en menos del 0~5%, para reactivar los modelos fusionados diluidos que se habían quedado obsoletos. 

  • Entre los 7 LoRAs, uno fue creado por mí. Consiste en analizar y anotar captions para un total de 174 fotos pictóricas de alta calidad usando GPT4-V. La fusión de este LoRA produjo imágenes sorprendentemente claras y una comprensión impresionante de los prompts.

  • Mis LoRAs creadas por mí están exclusivamente disponibles para compra a mis patrocinadores de Ko-fi en el nivel Creative o superior.


v1.2

  • Fusioné los 22 checkpoints más recientes.

La grilla de especificaciones(565.6 MB): descargar

v1.1

  • Estabilizado.

  • Más detallado.

  • Si crees que eres un usuario avanzado, recomiendo la versión 1.0. Si la versión 1.0 encuentra los ajustes correctos, puede producir obras mucho más vívidas.

La grilla de especificaciones(349.7 MB): descargar

v1.0

  • Fusioné 106 LoRAs.

  • Fusioné 19 Checkpoints.

  1. El modelo puede producir resultados diferentes dependiendo de los ajustes que elijas, por lo que es importante revisar la grilla de especificaciones antes de usarlo.

    • He encontrado que usar algunos negativos específicos puede ayudar a resolver problemas como ojos asimétricos o imágenes pixeladas. La grilla puede variar según tu CPU o GPU, así que úsala como referencia general. Experimenta con algunos negativos para mejorar la calidad (ej: estrabismo). Encontré que es difícil satisfacer todos los ajustes por igual conforme aumenta el número de LoRAs fusionadas. Sin embargo, me gustaría que te enfoques en esta ventaja en la versión 1.0, ya que puede producir obras de calidad asombrosa en varios aspectos con los ajustes adecuados. Volveré con una versión más estable en el futuro.

  2. Puedes encontrar valores útiles de configuración en las muestras o buscando otros usuarios.

  3. Como siempre, es mejor dejar el prompt negativo en blanco para mejores resultados.

  4. Esta v1.0 requirió mucho trabajo, así que me tomaré un descanso por un tiempo. Espero que disfrutes usar el modelo, y si lo fusionas, por favor compártelo gratuitamente en Civitai. Así todos podemos seguir mejorándolo.

La grilla de especificaciones(479.4 MB): descargar

v0.4

  • Fusioné 132 LoRAs.

  • Fusioné 4 Checkpoints.

La grilla de especificaciones: descargar

v0.3

  • Mejorado en todos los samplers.

  • Logró realismo muy real.

  • Estabilizado.

La grilla de especificaciones: descargar

v0.2

  • Mejoras significativas en claridad y detalles.

  • Mejor implementación de manos y pies.

  • Mejoras estéticas importantes; composición, abstracción, flujo, luz y color, etc.

v0.1

  • Tras un ajuste fino adecuado sobre el modelo SDXL1.0, fusioné meticulosamente y a propósito más de 40 modelos de alta calidad

  • Las pruebas se han enfocado principalmente en asegurar la máxima calidad con el mínimo número de tokens en el prompt, y no se ha confirmado cuánto puede mejorar la calidad usando un gran número de tokens. (Por favor, realiza tus propias pruebas y comparte los resultados)

  • Generalmente, los resultados más bellos se logran en el punto medio entre realidad y animación.

  • No obstante, al usar un prompt adecuado, generalmente no hay nada que no pueda expresar. (Afirmo que posee un valor abundante como modelo base que supera a otros en fusión. Sin embargo, ten en cuenta que esta es actualmente la v0.1)


Anterior
SocaRealism XL - 1.3
Siguiente
Foto de Stock Realista - v2.0

Detalles del Modelo

Tipo de modelo

Checkpoint

Modelo base

SDXL 1.0

Versión del modelo

v2.0

Hash del modelo

a928fee35b

Creador

Discusión

Por favor log in para dejar un comentario.