PixelWave - FLUX.1-schnell 04
Palabras Clave y Etiquetas Relacionadas
Parámetros Recomendados
samplers
steps
cfg
resolution
vae
Parámetros Recomendados de Alta Resolución
upscale
Consejos
Usa más de 8 pasos para mejorar los detalles finos, pero la salida no cambia mucho después de 8 pasos.
Agregar prompts de estilo puede ayudar al modelo a generar una salida más ordenada y limpia.
Intenta aumentar la escala de guía para obtener imágenes más limpias.
Evita usar términos de 'calidad' como 4K, 8K, obra maestra, alta definición si quieres una apariencia natural en fotografía.
Para la ampliación, intenta el latent upscale por nodo y escala el latent por 1.5 para imágenes de mayor resolución.
Usa el optimizador pagedlion8bit para entrenar en GPU de 24GB, con los parámetros time_in, vector_in y modulación congelados para evitar la des-destilación.
Detén el entrenamiento tras unos pocos miles de pasos con LR 5e-6 para evitar bloques corruptos y combina bloques con checkpoints anteriores para corregir la corrupción.
Aspectos Destacados de la Versión
Afinación fina del modelo schnell, sin usar el modelo dev en absoluto. ¡Licencia Apache 2.0!
Entrenado con kohya usando un programa sigma personalizado y congelando los parámetros de tiempo y modulación para prevenir degradación de la destilación del tiempo.
➤ Pasos combinados de entrenamiento : 1,360,641
➤ Tiempo activo de entrenamiento: 1192.61 horas (49.7 días)
Patrocinadores del Creador
Modelo también disponible en: RunDiffusion y Runware.ai
Gran agradecimiento a RunDiffusion por patrocinar el cómputo para entrenar este modelo!
Para acceso a la API, consulta Runware.ai.
PixelWave FLUX.1-schnell 04 - ¡Apache 2.0!
Archivos Safetensor: 💾BF16 💾FP8 💾bnb FP4
Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
Modelo también disponible en: RunDiffusion y Runware.ai
PixelWave FLUX.1 schnell versión 04 es un ajuste estético del FLUX.1-schnell. Las imágenes para entrenamiento fueron seleccionadas cuidadosamente para asegurar que el modelo tenga una inclinación hacia imágenes llamativas, con colores, texturas e iluminación hermosos.
Entrenado con el modelo schnell original, ¡bajo licencia Apache 2.0!
No requiere condiciones especiales para ejecutarse. Soporta LoRAs FLUX
Euler Normal, 8 pasos.
Puedes usar más pasos para mejorar los detalles finos, pero la salida no cambia mucho después de 8 pasos.
Agradecimientos a RunDiffusion
Gran agradecimiento a RunDiffusion (co-creadores de Juggernaut) por patrocinar el cómputo que hizo posible el entrenamiento de este modelo. Descubrir cómo entrenar schnell sin des-destilar el modelo requirió muchos experimentos, y poder usar el cómputo en la nube de RunDiffusion facilitó mucho el proceso.
Para quienes necesiten acceso a la API de este modelo, estamos en alianza con Runware.ai
He hecho la versión FLUX.1-dev 04 exclusiva para RunDiffusion y Runware por ahora. Cuando lance la versión 05 en el futuro, planeo liberar los pesos abiertos de dev 04.
Agradecido por su apoyo para sacar este modelo, ¡por favor échales un vistazo!
Entrenamiento
El entrenamiento se realizó con kohya_ss/sd-scripts. Puedes encontrar mi fork de Kohya aquí, que también contiene cambios en el submódulo sd-scripts, asegúrate de clonar ambos.
Usa la pestaña de fine tuning. Encontré los mejores resultados con el optimizador pagedlion8bit, que también podía correr en mi GPU 4090 de 24GB. Otros optimizadores tenían dificultades para aprender algo.
He congelado los parámetros time_in, vector_in y mod/modulación. Esto detiene la 'des-destilación'.
Evito entrenar bloques individuales con más de 15. Puedes establecer qué bloques entrenar en la sección FLUX.
LR 5e-6 entrena rápido, pero debes parar después de unos pocos miles de pasos porque comienza a corromper bloques y ralentiza el aprendizaje.
Luego puedes combinar bloques con un checkpoint anterior, reemplazando los bloques corruptos, y continuar entrenando.
Señales de bloques corruptos: textura de papel sobre la mayoría de las imágenes, pérdida de detalles de fondo.
Contacto
Para consultas comerciales o de negocios, por favor contáctanos en pixelwave@rundiffusion.com. Licenciamiento de fine tunes de flux. Proyectos de entrenamiento para clientes. Desarrollo comercial de IA. ¡El equipo puede hacer todo!
PixelWave Flux.1-dev 03 afinado!
Archivos Safetensor: 💾BF16 💾FP8 💾NF4
Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
Los archivos 'diffusers' son en realidad las versiones GGUF Q8_0 y Q4_K_M. Archivos GGUF también disponibles en huggingface.
Afiné la versión 03 desde la base FLUX.1-dev durante más de 5 semanas en mi 4090. Puede hacer diferentes estilos de arte, fotografía y anime. Truco que descubrí para ayudar con LoRAs.
Usé dpmpp 2m sgm uniforme 30 pasos para las imágenes de muestra. Si quieres una salida más ordenada/limpia, intenta aumentar la guía. También mencionar un estilo ayuda, así el modelo no tiene que adivinar.
También recomiendo intentar añadir el latent upscale por nodo, y escalar el latent por 1.5, por ejemplo, generando una imagen de 1536x1536 en lugar de 1024x1024.
PixelWave Flux.1-schnell 03
Archivos Safetensor: 💾FP8 💾NF4
Archivos GGUF: ir a huggingface
Usé dpmpp 2m sgm uniforme 8 pasos para las imágenes de muestra.
Puedes empezar con 4 pasos, pero hay menos errores anatómicos si usas más pasos.
PixelWave Flux.1-dev 02
Archivos Safetensor: 💾BF16 💾FP8
Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
La versión 02 ha mejorado mucho las imágenes negras y oscuras, y ofrece salidas más confiables con menos problemas con las manos.
Recomiendo usar dpmpp_2s_ancestral, beta, 14 pasos. O euler, simple, 20 pasos.
PixelWave 11 SDXL. Un modelo afinado de propósito general. Ideal para estilos de arte y fotografía.
Uso 20 pasos, DPM++ SDE, CFG de 4 a 6 o 40 pasos, 2M SDE Karras
Versión acelerada - 5+ pasos, DPM++ SDE Karras, 2.5 CFG
PAG recomendado⚡Recomendado escala 1.5, con CFG 3. Enlace al flujo de trabajo
⭐Guía para prompts.⭐ No necesitas usar términos de 'calidad' como 4K, 8K, obra maestra, alta definición, alta calidad, etc. A menos que lo desees, recomiendo no usar palabras como 'vibrante, intenso, brillante, alto contraste, neón, dramático' para estilos fotográficos si buscas un aspecto más natural. Esto puede hacer que las imágenes se vean 'sobreprocesadas', pero es sólo el CLIP siguiendo tu prompt. 🙂 ¡Si quieres fotos vibrantes y de neón PixelWave las proporcionará!
El enfoque para la versión 10 fue entrenar los modelos CLIP, lo que mejora la fiabilidad, garantiza que puedas producir una amplia variedad de estilos, y sigue mejor los prompts.
Gracias a mis amigos que ayudaron a probar: masslevel, blink, socalguitarist, klinter, wizard whitebeard.
Guía: Escalar prompts con LM Studio y Mikey Nodes
Guía: Añade más detalles a tu imagen usando el método skip step
No es necesario el modelo refiner.
Este modelo no es una mezcla de otros modelos.
También creé Mikey Nodes que contiene muchos nodos útiles. Puedes instalarlo a través del gestor comfy.
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.





