PixelWave - FLUX.1-dev 03
Palabras Clave y Etiquetas Relacionadas
Parámetros Recomendados
samplers
steps
cfg
resolution
vae
Parámetros Recomendados de Alta Resolución
upscale
Consejos
Puedes usar más pasos para mejorar detalles finos, pero la salida no cambia mucho después de 8 pasos.
Si quieres una salida más limpia, prueba aumentar la escala de guía (CFG).
Mencionar un estilo en el prompt puede ayudar al modelo a generar mejores resultados.
Prueba añadir upscale latent por nodo y escalar el latent por 1.5 para generar imágenes de mayor resolución.
Evita usar términos de 'calidad' como 4K, 8K, obra maestra, alta definición, alta calidad a menos que sea necesario; puede hacer que las imágenes parezcan sobreprocesadas.
Para estilos fotográficos, evita términos como 'vibrante, intenso, brillante, alto contraste, neón, dramático' si quieres un aspecto natural.
El entrenamiento se hizo con kohya_ss/sd-scripts usando el optimizador pagedlion8bit.
Congelar 'time_in', 'vector_in' y parámetros de modulación detiene la 'desdestilación'.
Evita entrenar bloques individuales por encima de 15; configura los bloques de entrenamiento en la sección FLUX.
La tasa de aprendizaje de 5e-6 entrena rápido pero detente después de unos pocos miles de pasos para evitar corrupción de bloques.
Aspectos Destacados de la Versión
Afinado durante 5 semanas en mi 4090.
Patrocinadores del Creador
Modelo también disponible en: RunDiffusion y Runware.ai
Un enorme agradecimiento a RunDiffusion por patrocinar la computación que hizo posible el entrenamiento de este modelo!
Para acceso API, asóciate con Runware.ai
PixelWave FLUX.1-schnell 04 - ¡Apache 2.0!
Archivos Safetensor: 💾BF16 💾FP8 💾bnb FP4
Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
Modelo también disponible en: RunDiffusion y Runware.ai
PixelWave FLUX.1 schnell versión 04 es un afinado estético de FLUX.1-schnell. Las imágenes del entrenamiento fueron seleccionadas a mano para asegurar que el modelo tenga una inclinación hacia imágenes llamativas, con colores, texturas e iluminación hermosos.
Entrenado sobre el modelo schnell original, por lo que tiene licencia Apache 2.0.
No requiere condiciones especiales para funcionar. Soporta LoRAs FLUX.
Euler Normal, 8 pasos.
Puedes usar más pasos para mejorar los detalles finos, pero la salida no cambia mucho después de 8 pasos.
Agradecimientos a RunDiffusion
Un enorme agradecimiento a RunDiffusion (co-creadores de Juggernaut) por patrocinar la computación que hizo posible el entrenamiento de este modelo. Descubrir cómo entrenar schnell sin desdestilar el modelo requirió mucha experimentación, y poder usar la computación en nube de RunDiffusion lo hizo mucho más fácil.
Para quienes necesiten acceso API para este modelo, estamos en asociación con Runware.ai
He hecho que la versión FLUX.1-dev 04 sea exclusiva para RunDiffusion y Runware por ahora. Cuando lance la versión 05 en el futuro, planeo liberar los pesos abiertos de la dev 04.
Agradezco su apoyo para sacar este modelo, ¡por favor échales un vistazo!
Entrenamiento
El entrenamiento se realizó con kohya_ss/sd-scripts. Puedes encontrar mi fork de Kohya aquí, que también contiene cambios al submódulo sd-scripts, asegúrate de clonar ambos.
Usa la pestaña de afinación fina. Encontré los mejores resultados con el optimizador pagedlion8bit que también pudo correr en mi GPU 4090 de 24GB. Encontré que otros optimizadores tienen dificultades para aprender algo.
He congelado los parámetros time_in, vector_in y mod/modulación. Esto detiene la 'desdestilación'.
Evito entrenar bloques individuales por encima del 15. Puedes seleccionar qué bloques entrenar en la sección FLUX.
Una tasa de aprendizaje de 5e-6 entrena rápido, pero debes detener después de unos pocos miles de pasos porque empieza a corromper bloques y a ralentizar el aprendizaje.
Puedes luego hacer una fusión de bloques con un checkpoint anterior, reemplazando los bloques corruptos, y continuar entrenando más allá.
Signos de bloques corruptos: textura de papel en la mayoría de imágenes, pérdida de detalles en el fondo.
Contacto
Para consultas comerciales o de negocio por favor contáctanos en pixelwave@rundiffusion.com. Licenciamiento de afinaciones flux. Proyectos de entrenamiento personalizados. Desarrollo comercial de IA. ¡El equipo puede hacer todo!
PixelWave Flux.1-dev 03 afinado finamente!
Archivos Safetensor: 💾BF16 💾FP8 💾NF4
Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
Los archivos 'diffusers' son en realidad las versiones GGUF Q8_0 y Q4_K_M. Archivos GGUF también disponibles en huggingface.
He afinado la versión 03 desde la base FLUX.1-dev durante más de 5 semanas en mi 4090. Es capaz de hacer distintos estilos artísticos, fotografía y anime. Truco que descubrí para ayudar con LoRAs.
Usé dpmpp 2m sgm uniform 30 pasos para las imágenes de muestra. Si quieres una salida más limpia, prueba subir la escala de la guía. También mencionar un estilo ayuda para que el modelo no tenga que adivinar.
También recomiendo probar añadiendo upscale latent por nodo y escalar el latent por 1.5, por ejemplo, generando una imagen de 1536x1536 en lugar de 1024x1024.
PixelWave Flux.1-schnell 03
Archivos Safetensor: 💾FP8 💾NF4
Archivos GGUF: ir a huggingface
Usé dpmpp 2m sgm uniform 8 pasos para las imágenes de muestra.
Puedes empezar con 4 pasos, pero hay menos errores anatómicos si usas más pasos.
PixelWave Flux.1-dev 02
Archivos Safetensor: 💾BF16 💾FP8
Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M
La versión 02 tiene una gran mejora en imágenes negras y oscuras, y salidas más confiables con menos problemas con las manos.
Recomiendo usar dpmpp_2s_ancestral, beta, 14 pasos. O euler, simple, 20 pasos.
PixelWave 11 SDXL. Un modelo afinado de propósito general. Ideal para estilos artísticos y fotográficos.
Uso 20 pasos, DPM++ SDE, CFG 4 a 6 o 40 pasos, 2M SDE Karras
Versión acelerada - 5+ pasos, DPM++ SDE Karras, 2.5 CFG
Recomendado PAG⚡ Recomendado escala 1.5, con CFG 3. Enlace al flujo de trabajo
🔗Enlace a Galería Expandida 🖼️
⭐Guía de prompts.⭐ No es necesario usar términos de 'calidad' como 4K, 8K, obra maestra, alta definición, alta calidad, etc. A menos que lo desees, recomiendo no usar palabras como 'vibrante, intenso, brillante, alto contraste, neón, dramático' para estilos fotográficos si buscas un look más natural. Esto puede hacer que las imágenes parezcan 'sobre-procesadas', pero es sólo el CLIP siguiendo tu prompt. 🙂 Si quieres fotos vibrantes y neón, ¡PixelWave lo proporcionará!
El enfoque para la versión 10 fue entrenar los modelos CLIP, lo que mejora la confiabilidad, asegura que puedas producir una amplia variedad de estilos y que sigan mejor los prompts.
Gracias a mis amigos que ayudaron a probar: masslevel, blink, socalguitarist, klinter, wizard whitebeard.
Guía: Ampliar prompts con LM Studio y Mikey Nodes
Guía: Añadir más detalles a tu imagen usando el método skip step
No es necesario el modelo refiner.
Este modelo no es una mezcla de otros modelos.
También creé Mikey Nodes que contiene muchos nodos útiles. Puedes instalarlo mediante comfy manager.
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.





