modelos/PixelWave - FLUX.1-schnell 04

PixelWave - FLUX.1-schnell 04

Marta García

12/27/2025

12:53:39 PM

| Discussion|

Palabras Clave y Etiquetas Relacionadas

Un astronauta con un traje espacial desgastado está en un desierto blanco ante una enorme nave espacial con forma de tiburón con una abertura similar a una boca y grandes motores.

Parámetros Recomendados

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, Euler, DPM++ SDE, 2M SDE Karras

steps

4 - 40

cfg

2.5 - 7

resolution

1536x1536, 1024x1024

vae

ae.safetensors

Parámetros Recomendados de Alta Resolución

upscale

1.5 - null

Consejos

Usa más de 8 pasos para mejorar los detalles finos, pero la salida no cambia mucho después de 8 pasos.

Agregar prompts de estilo puede ayudar al modelo a generar una salida más ordenada y limpia.

Intenta aumentar la escala de guía para obtener imágenes más limpias.

Evita usar términos de 'calidad' como 4K, 8K, obra maestra, alta definición si quieres una apariencia natural en fotografía.

Para la ampliación, intenta el latent upscale por nodo y escala el latent por 1.5 para imágenes de mayor resolución.

Usa el optimizador pagedlion8bit para entrenar en GPU de 24GB, con los parámetros time_in, vector_in y modulación congelados para evitar la des-destilación.

Detén el entrenamiento tras unos pocos miles de pasos con LR 5e-6 para evitar bloques corruptos y combina bloques con checkpoints anteriores para corregir la corrupción.

Aspectos Destacados de la Versión

Afinación fina del modelo schnell, sin usar el modelo dev en absoluto. ¡Licencia Apache 2.0!

Entrenado con kohya usando un programa sigma personalizado y congelando los parámetros de tiempo y modulación para prevenir degradación de la destilación del tiempo.

➤ Pasos combinados de entrenamiento : 1,360,641

➤ Tiempo activo de entrenamiento: 1192.61 horas (49.7 días)

Patrocinadores del Creador

Modelo también disponible en: RunDiffusion y Runware.ai

Gran agradecimiento a RunDiffusion por patrocinar el cómputo para entrenar este modelo!

Para acceso a la API, consulta Runware.ai.

PixelWave FLUX.1-schnell 04 - ¡Apache 2.0!

Archivos Safetensor: 💾BF16 💾FP8 💾bnb FP4

Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Enlaces a 🤗VAE 🤗T5xxl 🤗CLIP L

Modelo también disponible en: RunDiffusion y Runware.ai

PixelWave FLUX.1 schnell versión 04 es un ajuste estético del FLUX.1-schnell. Las imágenes para entrenamiento fueron seleccionadas cuidadosamente para asegurar que el modelo tenga una inclinación hacia imágenes llamativas, con colores, texturas e iluminación hermosos.

Entrenado con el modelo schnell original, ¡bajo licencia Apache 2.0!
No requiere condiciones especiales para ejecutarse. Soporta LoRAs FLUX
Euler Normal, 8 pasos.

Puedes usar más pasos para mejorar los detalles finos, pero la salida no cambia mucho después de 8 pasos.

Agradecimientos a RunDiffusion

Gran agradecimiento a RunDiffusion (co-creadores de Juggernaut) por patrocinar el cómputo que hizo posible el entrenamiento de este modelo. Descubrir cómo entrenar schnell sin des-destilar el modelo requirió muchos experimentos, y poder usar el cómputo en la nube de RunDiffusion facilitó mucho el proceso.

Para quienes necesiten acceso a la API de este modelo, estamos en alianza con Runware.ai

He hecho la versión FLUX.1-dev 04 exclusiva para RunDiffusion y Runware por ahora. Cuando lance la versión 05 en el futuro, planeo liberar los pesos abiertos de dev 04.

Agradecido por su apoyo para sacar este modelo, ¡por favor échales un vistazo!

Entrenamiento

El entrenamiento se realizó con kohya_ss/sd-scripts. Puedes encontrar mi fork de Kohya aquí, que también contiene cambios en el submódulo sd-scripts, asegúrate de clonar ambos.

Usa la pestaña de fine tuning. Encontré los mejores resultados con el optimizador pagedlion8bit, que también podía correr en mi GPU 4090 de 24GB. Otros optimizadores tenían dificultades para aprender algo.

He congelado los parámetros time_in, vector_in y mod/modulación. Esto detiene la 'des-destilación'.

Evito entrenar bloques individuales con más de 15. Puedes establecer qué bloques entrenar en la sección FLUX.

LR 5e-6 entrena rápido, pero debes parar después de unos pocos miles de pasos porque comienza a corromper bloques y ralentiza el aprendizaje.

Luego puedes combinar bloques con un checkpoint anterior, reemplazando los bloques corruptos, y continuar entrenando.

Señales de bloques corruptos: textura de papel sobre la mayoría de las imágenes, pérdida de detalles de fondo.

Contacto

Para consultas comerciales o de negocios, por favor contáctanos en pixelwave@rundiffusion.com. Licenciamiento de fine tunes de flux. Proyectos de entrenamiento para clientes. Desarrollo comercial de IA. ¡El equipo puede hacer todo!

PixelWave Flux.1-dev 03 afinado!

Archivos Safetensor: 💾BF16 💾FP8 💾NF4

Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Enlaces a 🤗VAE 🤗T5xxl 🤗CLIP L

Los archivos 'diffusers' son en realidad las versiones GGUF Q8_0 y Q4_K_M. Archivos GGUF también disponibles en huggingface.

Afiné la versión 03 desde la base FLUX.1-dev durante más de 5 semanas en mi 4090. Puede hacer diferentes estilos de arte, fotografía y anime. Truco que descubrí para ayudar con LoRAs.

Usé dpmpp 2m sgm uniforme 30 pasos para las imágenes de muestra. Si quieres una salida más ordenada/limpia, intenta aumentar la guía. También mencionar un estilo ayuda, así el modelo no tiene que adivinar.

También recomiendo intentar añadir el latent upscale por nodo, y escalar el latent por 1.5, por ejemplo, generando una imagen de 1536x1536 en lugar de 1024x1024.

PixelWave Flux.1-schnell 03

Archivos Safetensor: 💾FP8 💾NF4

Archivos GGUF: ir a huggingface

Usé dpmpp 2m sgm uniforme 8 pasos para las imágenes de muestra.

Puedes empezar con 4 pasos, pero hay menos errores anatómicos si usas más pasos.

PixelWave Flux.1-dev 02

Archivos Safetensor: 💾BF16 💾FP8

Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

La versión 02 ha mejorado mucho las imágenes negras y oscuras, y ofrece salidas más confiables con menos problemas con las manos.

Recomiendo usar dpmpp_2s_ancestral, beta, 14 pasos. O euler, simple, 20 pasos.

Nodos Comfyui-GGUF

PixelWave *11 SDXL**. Un modelo afinado de propósito general. Ideal para estilos de arte y fotografía.*

Uso 20 pasos, DPM++ SDE, CFG de 4 a 6 o 40 pasos, 2M SDE Karras

Versión acelerada - 5+ pasos, DPM++ SDE Karras, 2.5 CFG

PAG recomendado⚡Recomendado escala 1.5, con CFG 3. Enlace al flujo de trabajo

🔗Enlace a galería ampliada 🖼️

⭐Guía para prompts.⭐ No necesitas usar términos de 'calidad' como 4K, 8K, obra maestra, alta definición, alta calidad, etc. A menos que lo desees, recomiendo no usar palabras como 'vibrante, intenso, brillante, alto contraste, neón, dramático' para estilos fotográficos si buscas un aspecto más natural. Esto puede hacer que las imágenes se vean 'sobreprocesadas', pero es sólo el CLIP siguiendo tu prompt. 🙂 ¡Si quieres fotos vibrantes y de neón PixelWave las proporcionará!

El enfoque para la versión 10 fue entrenar los modelos CLIP, lo que mejora la fiabilidad, garantiza que puedas producir una amplia variedad de estilos, y sigue mejor los prompts.

Gracias a mis amigos que ayudaron a probar: masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Guía: Escalar prompts con LM Studio y Mikey Nodes

Guía: Añade más detalles a tu imagen usando el método skip step

No es necesario el modelo refiner.

Este modelo no es una mezcla de otros modelos.

También creé Mikey Nodes que contiene muchos nodos útiles. Puedes instalarlo a través del gestor comfy.