Chroma - v.35
Palabras Clave y Etiquetas Relacionadas
Prompts Recomendados
Extreme close-up photograph of a single tiger eye, direct frontal view. The iris is very detailed and the pupil resembling a dark void. The word "Chroma V.35 now with less steps" is across the lower portion of the image in large white stylized letters, with brush strokes resembling those made with Japanese calligraphy. Each strand of the thick fur is highly detailed and distinguishable. Natural lighting to capture authentic eye shine and depth.
Prompts Negativos Recomendados
low quality, ugly, unfinished, out of focus
Parámetros Recomendados
samplers
steps
cfg
resolution
Patrocinadores del Creador

Hola a todos,
Hace un tiempo publiqué sobre Chroma, mi modelo fundamental de código abierto en progreso. Recibí muchos comentarios excelentes y estoy emocionado de anunciar que el entrenamiento del modelo base está finalmente completo, ¡y toda la familia de modelos ya está lista para que la uses!
Un repaso rápido sobre la promesa aquí: estos son modelos base reales.
No he realizado ninguna afinación estética ni usado técnicas posteriores al entrenamiento como DPO. Son crudos, potentes y diseñados para ser el punto de partida neutral perfecto para que puedas hacer ajustes finos. Nosotros hicimos el trabajo pesado para que no tengas que hacerlo tú.
Y con trabajo pesado, me refiero a unas 105,000 horas de H100 de cómputo. Todo ese tiempo de GPU se dedicó a dotar a estos modelos con una enorme distribución de datos, lo que debería facilitar mucho el ajuste fino sobre ellos.
Como prometí, todo está completamente licenciado bajo Apache 2.0—sin restricciones.
Resumen rápido:
Rama de lanzamiento:
Chroma1-Base: Este es el modelo central 512x512. Es una base sólida y versátil para prácticamente cualquier proyecto creativo. Podrías querer usar este si planeas hacer un ajuste fino más largo y luego entrenar solo en alta resolución al final de las épocas para que converja más rápido.
Chroma1-HD: Esta es la afinación en alta resolución del Chroma1-Base a 1024x1024. Si buscas hacer un ajuste fino rápido o LoRA para alta resolución, este es tu punto de inicio.
Rama de investigación:
Chroma1-Flash: Una versión afinada del Chroma1-Base que hice para encontrar la mejor forma de acelerar estos modelos de flujo coincidente. Técnicamente, este es un resultado experimental para descubrir cómo entrenar un modelo rápido sin usar ningún entrenamiento basado en GAN. Los pesos delta pueden aplicarse a cualquier versión de Chroma para hacerla más rápida (solo asegúrate de ajustar la intensidad).
Chroma1-Radiance [En desarrollo]: Una versión radicalmente afinada del Chroma1-Base donde ahora el modelo es un modelo de espacio de píxeles que técnicamente no debería sufrir artefactos de compresión VAE.
Opciones de cuantización
Opción alternativa: Cuantización FP8 escalada (Formato usado por ComfyUI con posible aumento de velocidad de inferencia)
Opción alternativa: Cuantizado GGUF (Necesitarás instalar el nodo personalizado ComfyUI-GGUF)
Agradecimientos especiales
Un enorme gracias a los patrocinadores que hacen posible este proyecto.
Donante anónimo cuya increíble generosidad financió la ejecución del preentrenamiento y la recopilación de datos. Su apoyo ha sido transformador para la IA de código abierto.
Fictional.ai por su fantástico apoyo y por ayudar a expandir los límites de la IA de código abierto.
¡Apoya este proyecto!
https://ko-fi.com/lodestonerock/
Dirección BTC: bc1qahn97gm03csxeqs7f4avdwecahdj4mcp9dytnj
Dirección ETH: 0x679C0C419E949d8f3515a255cE675A1c4D92A3d7
mi discord: discord.gg/SQVcWVbqKx
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.


