Un estornino de mejillas blancas suspendido en medio de un descenso por rapel desde un imponente rascacielos silueteado contra un cielo salmón oscuro, con cascadas de agua y un fondo con degradado teal.
Silueta de la figura de Aku Bouzu de pie frente a un vibrante fondo degradado de lima intenso a carmesí profundo, sosteniendo una sola rosa de un arbusto espinoso, rodeado de efectos de acuarela que gotea y estilo arte pop.

Prompts Recomendados

This is a nature documentary close-up photograph of the right side of the face of a tiger. The photograph is centered on it's highly detailed and speckled eye surrounded by intricately detailed fur. Overlaid at the center of the image is a title text that says "CHROMA1-HD" in a large white 3D letters. Amateur photography. Unfiltered. Real life. Natural light. Subtle shadows.

Prompts Negativos Recomendados

This low quality greyscale unfinished sketch is inaccurate and flawed. The image is very blurred and lacks detail with excessive chromatic aberrations and artifacts. The image is overly saturated with excessive bloom. It has a toony aesthetic with bold outlines and flat colors.

Parámetros Recomendados

samplers

Euler

steps

26

cfg

3.5

resolution

512x512, 1024x1024

Consejos

Usa Chroma1-Base para un ajuste fino prolongado y luego entrena en alta resolución al final para converger más rápido.

Chroma1-HD es mejor para ajustes finos rápidos o LoRA en alta resolución.

Los pesos delta de Chroma1-Flash pueden aplicarse a otras versiones de Chroma para mejorar la velocidad (ajusta la fuerza según corresponda).

Aspectos Destacados de la Versión

EDIT: Este modelo está obsoleto y solo sigue publicado para casos especiales!



Este modelo cuantizado es para ComfyUI y el nodo Load Diffusion Model debe configurarse por defecto en weight_dtype al cargarlo.

Patrocinadores del Creador

Esta es la página oficial del modelo para

Cuantificaciones Chroma1-HD GGUF

El flujo de trabajo está en el archivo .zip de datos de entrenamiento

A continuación se muestra una copia de la página original del modelo.


Hola a todos,

Hace un tiempo publiqué sobre Chroma, mi modelo base de código abierto en desarrollo. Recibí una gran cantidad de comentarios excelentes y estoy emocionado de anunciar que el entrenamiento del modelo base finalmente está completo, y toda la familia de modelos ya está lista para que la usen.

Un recordatorio rápido sobre la promesa aquí: estos son verdaderos modelos base.

No he realizado ningún ajuste estético ni usado técnicas posteriores al entrenamiento como DPO. Son crudos, potentes y están diseñados para ser el punto de partida perfecto y neutral para que tú realices un ajuste fino. Nosotros hicimos el trabajo pesado para que no tengas que hacerlo.

Y con trabajo pesado me refiero a alrededor de 105,000 horas H100 de cómputo. Todo ese tiempo en GPU se utilizó para llenar estos modelos con una enorme distribución de datos, lo que debería facilitar mucho el ajuste fino encima de ellos.

Como se prometió, todo está bajo licencia Apache 2.0—sin restricciones.

TL;DR:

Rama de lanzamiento:

  • Chroma1-Base: Este es el modelo base 512x512 principal. Es una base sólida y versátil para prácticamente cualquier proyecto creativo. Quizás quieras usar este si planeas hacer un ajuste fino prolongado y luego entrenar en alta resolución solo al final de las épocas para acelerar la convergencia.

  • Chroma1-HD: Esta es la versión afinada de alta resolución del Chroma1-Base a 1024x1024. Si buscas hacer un ajuste fino rápido o LoRA para alta resolución, este es tu punto de partida.

Rama de investigación:

  • Chroma1-Flash: Una versión afinada del Chroma1-Base que creé para encontrar la mejor manera de hacer estos modelos de flujo coincidente más rápidos. Técnicamente es un resultado experimental para entender cómo entrenar un modelo rápido sin usar entrenamiento basado en GAN. Los pesos delta pueden aplicarse a cualquier versión de Chroma para acelerar el modelo (solo asegúrate de ajustar la fuerza).

  • Chroma1-Radiance [WIP]: Una versión radicalmente afinada del Chroma1-Base donde el modelo ahora es un modelo de espacio píxel que técnicamente no debería sufrir de artefactos de compresión VAE.

Opciones de cuantización

Agradecimientos especiales

Un agradecimiento enorme a los patrocinadores que hacen posible este proyecto.

  • Donante anónimo cuya increíble generosidad financió la ejecución previa y la recolección de datos. Tu apoyo ha sido transformador para la IA de código abierto.

  • Fictional.ai por su fantástico apoyo y por ayudar a impulsar los límites de la IA de código abierto.

¡Apoya este proyecto!

https://ko-fi.com/lodestonerock/

Dirección BTC: bc1qahn97gm03csxeqs7f4avdwecahdj4mcp9dytnj
Dirección ETH: 0x679C0C419E949d8f3515a255cE675A1c4D92A3d7

mi discord: discord.gg/SQVcWVbqKx

Anterior
Jib Mix Artful - v1.0
Siguiente
Estilos Ilustres de Cubby - NIJI - V1

Detalles del Modelo

Tipo de modelo

Checkpoint

Modelo base

Chroma

Versión del modelo

fp8_scaled-rev2[DEPR]

Hash del modelo

8132f97f19

Creador

Discusión

Por favor log in para dejar un comentario.

Imágenes por Chroma1-HD-GGUF-&-FP8 - fp8_scaled-rev2[DEPR]

Imágenes con modelo base

Imágenes con croma