AlbedoBase XL - v2.1
Palabras Clave y Etiquetas Relacionadas
Imágenes destacadas
Prompts Negativos Recomendados
strabismus
lowres
Parámetros Recomendados
samplers
steps
cfg
resolution
vae
Consejos
Si la generación de imagen no produce nada, intenta cambiar a CLIP SKIP 2 o modifica ligeramente el prompt cambiando el orden de las palabras o usando otras diferentes.
Dejar el campo de prompt negativo vacío puede producir imágenes de buena calidad, especialmente en la versión 1.3.
Usar prompts en forma de oración en lugar de tags (lista de palabras) puede mejorar la calidad de la imagen debido a los efectos de la LoRA.
Consulta la tabla de especificaciones antes de usar el modelo para obtener los mejores ajustes, disponible a través de los enlaces de descarga proporcionados.
Aspectos Destacados de la Versión
Re-fusión y ajuste de v0.1 a 2.0 usando nuevo algoritmo y fórmula de fusión.
Patrocinadores del Creador
Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución será dedicada enteramente a avanzar la comunidad SDXL.
Si has encontrado valor en el modelo, por favor considera ofrecer tu apoyo. Tu contribución será dedicada enteramente a avanzar la comunidad SDXL.
🙋🏼♂️ únete a nosotros (discord) ㅤ|ㅤ 🛒 compraㅤ |ㅤ 🌱 dona
AlbedoBase XL (SFW&NSFW)
El refiner no es necesario, e incluye VAE.
OBJETIVO
Stable Diffusion XL tiene 3.5 mil millones de parámetros (excluyendo el Refiner), que es aproximadamente 3.6 veces más que la versión SD v1.5. Creo que esto no es solo un número, sino un número que puede llevar a una mejora significativa en el rendimiento.
Ha pasado tiempo desde que nos dimos cuenta que el rendimiento general de SD v1.5 ha mejorado más allá de toda imaginación gracias a las aportaciones explosivas de nuestra comunidad. Por lo tanto, estoy trabajando en completar este modelo AlbedoBase XL para reproducir óptimamente la mejora de rendimiento ocurrida en v1.5 también en esta versión XL.
Mi objetivo es probar directamente el rendimiento de todos los Checkpoints y LoRAs que se suben públicamente a Civitai, y fusionar solo los recursos que se consideren óptimos después de pasar varios filtros. Esto superará el rendimiento de la IA generadora de imágenes de empresas como Midjourney.
Hasta ahora, AlbedoBase XL v3.1 Large ha fusionado alrededor de 200 checkpoints seleccionados y 251 LoRAs.
REGISTRO
v3.1-Large
• Fusionó más de 50 últimas versiones seleccionadas de modelos SDXL usando el script recursivo empleado en la V3.
La tabla de especificaciones (370.7 MB): descargar
v3-mini
Ofrezco sinceras disculpas por hacerles esperar tanto tiempo.
He estado lidiando con algunos asuntos personales y, mientras trabajaba en la nueva versión, también enfrenté problemas de salud. Incluso mientras escribo esto, sigo enfrentando estos desafíos.
Siento que no bastaría con ofrecer una actualización breve, así que pido amablemente su comprensión mientras comparto este mensaje más detallado.
Desde el lanzamiento de la versión 2.0, me he dedicado a estudiar aprendizaje profundo de manera independiente. No tengo un título formal y, aparte de una aptitud modesta para la programación, solo tengo formación en artes. Como resultado, carezco de la base matemática y científica para lograr avances significativos, dadas el tiempo y esfuerzo invertidos. A pesar de esto, la experiencia de sumergirme en este estudio y investigación autodirigidos ha sido un tesoro invaluable en mi vida.
Recientemente, me topé con una idea que podría ser un avance importante. Después de rehacer cientos de fórmulas y métodos desde la versión 2.0, logré desarrollar un algoritmo bastante intrigante y exitoso. El proceso de fusión de modelos se basó en SDXL1.0 y SD1.5, junto con otros modelos cuidadosamente seleccionados. Estos se categorizaron en cinco clasificaciones principales: "ANIME", "REALISMO", "ARTÍSTICO", "NSFW" y "BASE", y se alimentaron al algoritmo de fusión como conjuntos de datos. Este enfoque ha dado resultados fascinantes.
Sin embargo, tan desafiante como fue el desarrollo del algoritmo, nada ha sido tan exigente como la fase de prueba de rendimiento. Mi salud física y mental se deterioró significativamente durante este período, hasta el punto de darme cuenta que no podía continuar este trabajo solo. Esto fue lo que finalmente me llevó a decidir lanzar esta versión.
Y ahora, estoy emocionado de anunciar el lanzamiento de la tan esperada versión AlbedoBaseXL V3 Mini. Aunque este modelo es una fusión a menor escala, no está limitado a ninguna área específica y funciona notablemente bien en varios dominios. Tiene el potencial de servir como un nuevo modelo base para SDXL1.0. (Para referencia, mi algoritmo de fusión no es una "fusión lineal", por lo que esencialmente puede considerarse un nuevo modelo afinado).
Este modelo, junto con los modelos AlbedoBase existentes, es versátil y supera todas las versiones previas en todos los aspectos. (El contenido NSFW, aunque no es extremo, ofrece un rango de expresión más amplio comparado con versiones anteriores como la v2.1. Un modelo de fusión NSFW dedicado será lanzado en el futuro.)
Por otro lado, he notado que muchos modelos compartidos recientemente han comenzado a adoptar licencias que prohíben la fusión o la comercialización externa. Esto ha sido decepcionante, ya que me ha impedido usar algunos modelos realmente excelentes para fusionar.
Quiero expresar mi más sincero agradecimiento a los desarrolladores de modelos que han proporcionado licencias gratuitas, permitiendo que sus modelos de alta calidad —producto de considerable tiempo y esfuerzo— sean usados para la fusión.
Volveré pronto.
Espero con ansias sus pruebas de rendimiento en una amplia gama de áreas, incluyendo ANIME, REALISMO, ARTÍSTICO, 2.5D, 3D y NSFW.
Como desarrolladores de modelos, solo plantamos las semillas. En última instancia, son ustedes, los usuarios y artistas del modelo, quienes las cultivan y hacen florecer.
Gracias, como siempre.
Para quienes deseen apoyar mi trabajo con una pequeña contribución financiera, por favor consideren usar los enlaces a continuación. Actualmente no puedo conseguir empleo y enfrento un futuro incierto respecto a mi sustento.
La tabla de especificaciones (380.5 MB): descargar
v2.1
Re-fusión y ajuste de v0.1 a 2.0 usando nuevo algoritmo y fórmula de fusión.
La tabla de especificaciones (424.5 MB): descargar
v2.0
Quiero agradecer a todos los que me ayudaron en el lado AlbedoBase XL Pre. Sin ustedes, la fecha de lanzamiento probablemente hubiera sido mucho más tarde. ¡Muchas gracias!
He escrito un script personalizado para converger los modelos existentes AlbedoBase XL en uno solo. Alineando minuciosamente los pesos de filas y columnas de todos los bloques U-NET y CLIP según una fórmula única mía.
Si encuentras un error en la generación de imágenes (si no se genera nada), ¡por favor cambia a CLIP SKIP 2 o modifica ligeramente el prompt! Puede haber combinaciones de prompts que CLIP no reconozca. En ese caso, puedes cambiar el orden de las palabras, usar palabras diferentes o, más simplemente, cambiar el CLIP SKIP. Trabajaré gradualmente en resolver estos problemas en el futuro como en v1.3.
La tabla de especificaciones (403.5 MB): descargar
v1.3
Para ilustrar la calidad relacionada con la aleatoriedad del modelo, estandaricé el valor de la semilla a '9' para todas las imágenes de muestra destinadas a muestreo y procedí con su generación inmediata.
Especialmente con esta versión, debido al impacto significativo de los prompts negativos, dejar el campo de prompt negativo vacío probablemente produzca una buena calidad.
La tabla de especificaciones (438.7 MB): descargar
Como puedes ver, al aumentar el número de Steps, se vuelve disponible para todos los samplers y la calidad mejora.
Debido al efecto de la LoRA que desarrollé y fusioné, como se describe abajo, usar prompts en forma de oración en lugar de tags (lista de palabras) está directamente relacionado con la mejora de la calidad.
Fusioné 45 checkpoints y 7 LoRAs. Después de eso, fusioné AlbedoBase v0.4 y v0.3 en orden, menos del 0~5%, para reavivar los modelos fusionados que se habían diluido y quedado obsoletos.
Entre las 7 LoRAs, una está creada por mí. Involucra analizar y anotar subtítulos para un total de 174 fotografías pictóricas de alta calidad usando GPT4-V. La fusión de esta LoRA resultó en imágenes asombrosamente claras y una impresionante comprensión de los prompts.
Mis LoRAs auto-creadas están exclusivamente disponibles para compra por mis seguidores de Ko-fi a nivel Creative o superior.
v1.2
Fusioné los 22 checkpoints más recientes.
La tabla de especificaciones (565.6 MB): descargar
v1.1
Estabilizado.
Más detallado.
Si crees que eres un usuario avanzado, recomiendo la versión 1.0. Si la versión 1.0 encuentra los ajustes correctos, puede generar obras mucho más vívidas.
La tabla de especificaciones (349.7 MB): descargar
v1.0
Fusioné 106 LoRAs.
Fusioné 19 Checkpoints.
El modelo puede producir resultados diferentes según los ajustes que elijas, por lo que es importante consultar la tabla de especificaciones antes de usarlo.
He encontrado que usar algunos prompts negativos específicos puede ayudar a resolver el problema de ojos asimétricos o imágenes pixeladas. La tabla de especificaciones puede variar según tu CPU o GPU, así que úsala como referencia general. Experimenta con algunos prompts negativos para mejorar la calidad (ej: estrabismo). Encontré que es difícil satisfacer todos los ajustes por igual al aumentar el número de LoRA fusionadas. Sin embargo, quiero que te enfoques en esta ventaja de la versión 1.0, ya que puede producir obras de calidad asombrosa en varios aspectos con los ajustes adecuados. Volveré con una versión más estable en el futuro.
Puedes encontrar valores útiles de configuración en la muestra o buscando entre otros usuarios.
Como siempre, es mejor dejar el prompt negativo en blanco para obtener los mejores resultados.
Esta v1.0 requirió mucho trabajo, así que me tomo un descanso por un tiempo. Espero que disfrutes usar el modelo y si lo fusionas, por favor compártelo en Civitai de forma gratuita. Así, todos podemos seguir mejorándolo.
La tabla de especificaciones (479.4 MB): descargar
v0.4
Fusioné 132 LoRAs.
Fusioné 4 Checkpoints.
La tabla de especificaciones: descargar
v0.3
Mejoras en todos los samplers.
Realismo logrado.
Estabilizado.
La tabla de especificaciones: descargar
v0.2
Mejoras significativas en claridad y detalles.
Mejora en la implementación de manos y pies.
Grandes mejoras estéticas; composición, abstracción, fluidez, luz y color, etc.
v0.1
Después de un afinamiento adecuado sobre el modelo SDXL1.0, fusionar meticulosamente y con propósito más de 40 modelos de alta calidad disponibles públicamente en Civitai.
Las pruebas se han centrado principalmente en asegurar la máxima calidad con el mínimo número de tokens en el prompt, y no se ha confirmado cuánto puede mejorar la calidad usando un número grande de tokens. (Por favor realiza tus propias pruebas y comparte los resultados)
Normalmente, los resultados más bellos se logran en el punto medio entre la realidad y la animación.
Sin embargo, al usar un prompt apropiado, generalmente no hay nada que no pueda expresar. (Afirmo que posee un valor abundante como modelo base que supera a otros en fusión. Sin embargo, ten en cuenta que actualmente está en v0.1)
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.