modelos/PixelWave - FLUX.1-dev 03

PixelWave - FLUX.1-dev 03

Marta García

7/16/2025

2:25:48 AM

| Discussion|

Palabras Clave y Etiquetas Relacionadas

Una mujer con vestido negro leyendo un libro en un sofá de terciopelo rojo oscuro en una sala de biblioteca acogedora y con poca luz, con chimenea encendida, pintura floral y altas estanterías.

Foto diurna de un barrio suburbano de Los Ángeles que muestra una SUV blanca estacionada en la calle frente a casas y palmeras.

Joven con jeans cortos y camiseta blanca apoyada en un coche rojo de los años 50 en una calle cubana colorida en La Habana con edificios de vecindad en tonos pastel.

Una vista aérea escénica de una ciudad romana situada en un paisaje italiano montañoso con caminos de tierra secos en primer plano, montañas al fondo y el océano a la izquierda bajo un cielo azul claro.

Parámetros Recomendados

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, euler, DPM++ SDE, 2M SDE Karras, DPM++ SDE Karras, DPM++ 2M

steps

4 - 40

cfg

2.5 - 7

resolution

1024x1024, 1536x1536

vae

ae.safetensors - unknown

Parámetros Recomendados de Alta Resolución

upscale

1.5 - null

Consejos

Puedes usar más pasos para mejorar detalles finos, pero la salida no cambia mucho después de 8 pasos.

Si quieres una salida más limpia, prueba aumentar la escala de guía (CFG).

Mencionar un estilo en el prompt puede ayudar al modelo a generar mejores resultados.

Prueba añadir upscale latent por nodo y escalar el latent por 1.5 para generar imágenes de mayor resolución.

Evita usar términos de 'calidad' como 4K, 8K, obra maestra, alta definición, alta calidad a menos que sea necesario; puede hacer que las imágenes parezcan sobreprocesadas.

Para estilos fotográficos, evita términos como 'vibrante, intenso, brillante, alto contraste, neón, dramático' si quieres un aspecto natural.

El entrenamiento se hizo con kohya_ss/sd-scripts usando el optimizador pagedlion8bit.

Congelar 'time_in', 'vector_in' y parámetros de modulación detiene la 'desdestilación'.

Evita entrenar bloques individuales por encima de 15; configura los bloques de entrenamiento en la sección FLUX.

La tasa de aprendizaje de 5e-6 entrena rápido pero detente después de unos pocos miles de pasos para evitar corrupción de bloques.

Aspectos Destacados de la Versión

Afinado durante 5 semanas en mi 4090.

Patrocinadores del Creador

Modelo también disponible en: RunDiffusion y Runware.ai

Un enorme agradecimiento a RunDiffusion por patrocinar la computación que hizo posible el entrenamiento de este modelo!

Para acceso API, asóciate con Runware.ai

PixelWave FLUX.1-schnell 04 - ¡Apache 2.0!

Archivos Safetensor: 💾BF16 💾FP8 💾bnb FP4

Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Enlaces a 🤗VAE 🤗T5xxl 🤗CLIP L

Modelo también disponible en: RunDiffusion y Runware.ai

PixelWave FLUX.1 schnell versión 04 es un afinado estético de FLUX.1-schnell. Las imágenes del entrenamiento fueron seleccionadas a mano para asegurar que el modelo tenga una inclinación hacia imágenes llamativas, con colores, texturas e iluminación hermosos.

Entrenado sobre el modelo schnell original, por lo que tiene licencia Apache 2.0.
No requiere condiciones especiales para funcionar. Soporta LoRAs FLUX.
Euler Normal, 8 pasos.

Puedes usar más pasos para mejorar los detalles finos, pero la salida no cambia mucho después de 8 pasos.

Agradecimientos a RunDiffusion

Un enorme agradecimiento a RunDiffusion (co-creadores de Juggernaut) por patrocinar la computación que hizo posible el entrenamiento de este modelo. Descubrir cómo entrenar schnell sin desdestilar el modelo requirió mucha experimentación, y poder usar la computación en nube de RunDiffusion lo hizo mucho más fácil.

Para quienes necesiten acceso API para este modelo, estamos en asociación con Runware.ai

He hecho que la versión FLUX.1-dev 04 sea exclusiva para RunDiffusion y Runware por ahora. Cuando lance la versión 05 en el futuro, planeo liberar los pesos abiertos de la dev 04.

Agradezco su apoyo para sacar este modelo, ¡por favor échales un vistazo!

Entrenamiento

El entrenamiento se realizó con kohya_ss/sd-scripts. Puedes encontrar mi fork de Kohya aquí, que también contiene cambios al submódulo sd-scripts, asegúrate de clonar ambos.

Usa la pestaña de afinación fina. Encontré los mejores resultados con el optimizador pagedlion8bit que también pudo correr en mi GPU 4090 de 24GB. Encontré que otros optimizadores tienen dificultades para aprender algo.

He congelado los parámetros time_in, vector_in y mod/modulación. Esto detiene la 'desdestilación'.

Evito entrenar bloques individuales por encima del 15. Puedes seleccionar qué bloques entrenar en la sección FLUX.

Una tasa de aprendizaje de 5e-6 entrena rápido, pero debes detener después de unos pocos miles de pasos porque empieza a corromper bloques y a ralentizar el aprendizaje.

Puedes luego hacer una fusión de bloques con un checkpoint anterior, reemplazando los bloques corruptos, y continuar entrenando más allá.

Signos de bloques corruptos: textura de papel en la mayoría de imágenes, pérdida de detalles en el fondo.

Contacto

Para consultas comerciales o de negocio por favor contáctanos en pixelwave@rundiffusion.com. Licenciamiento de afinaciones flux. Proyectos de entrenamiento personalizados. Desarrollo comercial de IA. ¡El equipo puede hacer todo!

PixelWave Flux.1-dev 03 afinado finamente!

Archivos Safetensor: 💾BF16 💾FP8 💾NF4

Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Enlaces a 🤗VAE 🤗T5xxl 🤗CLIP L

Los archivos 'diffusers' son en realidad las versiones GGUF Q8_0 y Q4_K_M. Archivos GGUF también disponibles en huggingface.

He afinado la versión 03 desde la base FLUX.1-dev durante más de 5 semanas en mi 4090. Es capaz de hacer distintos estilos artísticos, fotografía y anime. Truco que descubrí para ayudar con LoRAs.

Usé dpmpp 2m sgm uniform 30 pasos para las imágenes de muestra. Si quieres una salida más limpia, prueba subir la escala de la guía. También mencionar un estilo ayuda para que el modelo no tenga que adivinar.

También recomiendo probar añadiendo upscale latent por nodo y escalar el latent por 1.5, por ejemplo, generando una imagen de 1536x1536 en lugar de 1024x1024.

PixelWave Flux.1-schnell 03

Archivos Safetensor: 💾FP8 💾NF4

Archivos GGUF: ir a huggingface

Usé dpmpp 2m sgm uniform 8 pasos para las imágenes de muestra.

Puedes empezar con 4 pasos, pero hay menos errores anatómicos si usas más pasos.

PixelWave Flux.1-dev 02

Archivos Safetensor: 💾BF16 💾FP8

Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

La versión 02 tiene una gran mejora en imágenes negras y oscuras, y salidas más confiables con menos problemas con las manos.

Recomiendo usar dpmpp_2s_ancestral, beta, 14 pasos. O euler, simple, 20 pasos.

Nodos Comfyui-GGUF

PixelWave *11 SDXL**. Un modelo afinado de propósito general. Ideal para estilos artísticos y fotográficos.*

Uso 20 pasos, DPM++ SDE, CFG 4 a 6 o 40 pasos, 2M SDE Karras

Versión acelerada - 5+ pasos, DPM++ SDE Karras, 2.5 CFG

Recomendado PAG⚡ Recomendado escala 1.5, con CFG 3. Enlace al flujo de trabajo

🔗Enlace a Galería Expandida 🖼️

⭐Guía de prompts.⭐ No es necesario usar términos de 'calidad' como 4K, 8K, obra maestra, alta definición, alta calidad, etc. A menos que lo desees, recomiendo no usar palabras como 'vibrante, intenso, brillante, alto contraste, neón, dramático' para estilos fotográficos si buscas un look más natural. Esto puede hacer que las imágenes parezcan 'sobre-procesadas', pero es sólo el CLIP siguiendo tu prompt. 🙂 Si quieres fotos vibrantes y neón, ¡PixelWave lo proporcionará!

El enfoque para la versión 10 fue entrenar los modelos CLIP, lo que mejora la confiabilidad, asegura que puedas producir una amplia variedad de estilos y que sigan mejor los prompts.

Gracias a mis amigos que ayudaron a probar: masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Guía: Ampliar prompts con LM Studio y Mikey Nodes

Guía: Añadir más detalles a tu imagen usando el método skip step

No es necesario el modelo refiner.

Este modelo no es una mezcla de otros modelos.

También creé Mikey Nodes que contiene muchos nodos útiles. Puedes instalarlo mediante comfy manager.