Una mujer con vestido negro leyendo un libro en un sofá de terciopelo rojo oscuro en una sala de biblioteca acogedora y con poca luz, con chimenea encendida, pintura floral y altas estanterías.
Foto diurna de un barrio suburbano de Los Ángeles que muestra una SUV blanca estacionada en la calle frente a casas y palmeras.
Joven con jeans cortos y camiseta blanca apoyada en un coche rojo de los años 50 en una calle cubana colorida en La Habana con edificios de vecindad en tonos pastel.
Una vista aérea escénica de una ciudad romana situada en un paisaje italiano montañoso con caminos de tierra secos en primer plano, montañas al fondo y el océano a la izquierda bajo un cielo azul claro.

Parámetros Recomendados

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, euler, DPM++ SDE, 2M SDE Karras, DPM++ SDE Karras, DPM++ 2M

steps

4 - 40

cfg

2.5 - 7

resolution

1024x1024, 1536x1536

vae

ae.safetensors - unknown

Parámetros Recomendados de Alta Resolución

upscale

1.5 - null

Consejos

Puedes usar más pasos para mejorar detalles finos, pero la salida no cambia mucho después de 8 pasos.

Si quieres una salida más limpia, prueba aumentar la escala de guía (CFG).

Mencionar un estilo en el prompt puede ayudar al modelo a generar mejores resultados.

Prueba añadir upscale latent por nodo y escalar el latent por 1.5 para generar imágenes de mayor resolución.

Evita usar términos de 'calidad' como 4K, 8K, obra maestra, alta definición, alta calidad a menos que sea necesario; puede hacer que las imágenes parezcan sobreprocesadas.

Para estilos fotográficos, evita términos como 'vibrante, intenso, brillante, alto contraste, neón, dramático' si quieres un aspecto natural.

El entrenamiento se hizo con kohya_ss/sd-scripts usando el optimizador pagedlion8bit.

Congelar 'time_in', 'vector_in' y parámetros de modulación detiene la 'desdestilación'.

Evita entrenar bloques individuales por encima de 15; configura los bloques de entrenamiento en la sección FLUX.

La tasa de aprendizaje de 5e-6 entrena rápido pero detente después de unos pocos miles de pasos para evitar corrupción de bloques.

Aspectos Destacados de la Versión

Afinado durante 5 semanas en mi 4090.

Patrocinadores del Creador

Modelo también disponible en: RunDiffusion y Runware.ai

Un enorme agradecimiento a RunDiffusion por patrocinar la computación que hizo posible el entrenamiento de este modelo!

Para acceso API, asóciate con Runware.ai

PixelWave FLUX.1-schnell 04 - ¡Apache 2.0!

Archivos Safetensor: 💾BF16 💾FP8 💾bnb FP4

Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Enlaces a 🤗VAE 🤗T5xxl 🤗CLIP L

Modelo también disponible en: RunDiffusion y Runware.ai

PixelWave FLUX.1 schnell versión 04 es un afinado estético de FLUX.1-schnell. Las imágenes del entrenamiento fueron seleccionadas a mano para asegurar que el modelo tenga una inclinación hacia imágenes llamativas, con colores, texturas e iluminación hermosos.

  • Entrenado sobre el modelo schnell original, por lo que tiene licencia Apache 2.0.

  • No requiere condiciones especiales para funcionar. Soporta LoRAs FLUX.

  • Euler Normal, 8 pasos.

Puedes usar más pasos para mejorar los detalles finos, pero la salida no cambia mucho después de 8 pasos.

Agradecimientos a RunDiffusion

Un enorme agradecimiento a RunDiffusion (co-creadores de Juggernaut) por patrocinar la computación que hizo posible el entrenamiento de este modelo. Descubrir cómo entrenar schnell sin desdestilar el modelo requirió mucha experimentación, y poder usar la computación en nube de RunDiffusion lo hizo mucho más fácil.

Para quienes necesiten acceso API para este modelo, estamos en asociación con Runware.ai

He hecho que la versión FLUX.1-dev 04 sea exclusiva para RunDiffusion y Runware por ahora. Cuando lance la versión 05 en el futuro, planeo liberar los pesos abiertos de la dev 04.

Agradezco su apoyo para sacar este modelo, ¡por favor échales un vistazo!

Entrenamiento

El entrenamiento se realizó con kohya_ss/sd-scripts. Puedes encontrar mi fork de Kohya aquí, que también contiene cambios al submódulo sd-scripts, asegúrate de clonar ambos.

Usa la pestaña de afinación fina. Encontré los mejores resultados con el optimizador pagedlion8bit que también pudo correr en mi GPU 4090 de 24GB. Encontré que otros optimizadores tienen dificultades para aprender algo.

He congelado los parámetros time_in, vector_in y mod/modulación. Esto detiene la 'desdestilación'.

Evito entrenar bloques individuales por encima del 15. Puedes seleccionar qué bloques entrenar en la sección FLUX.

Una tasa de aprendizaje de 5e-6 entrena rápido, pero debes detener después de unos pocos miles de pasos porque empieza a corromper bloques y a ralentizar el aprendizaje.

Puedes luego hacer una fusión de bloques con un checkpoint anterior, reemplazando los bloques corruptos, y continuar entrenando más allá.

Signos de bloques corruptos: textura de papel en la mayoría de imágenes, pérdida de detalles en el fondo.

Contacto

Para consultas comerciales o de negocio por favor contáctanos en pixelwave@rundiffusion.com. Licenciamiento de afinaciones flux. Proyectos de entrenamiento personalizados. Desarrollo comercial de IA. ¡El equipo puede hacer todo!

PixelWave Flux.1-dev 03 afinado finamente!

Archivos Safetensor: 💾BF16 💾FP8 💾NF4

Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

Enlaces a 🤗VAE 🤗T5xxl 🤗CLIP L

Los archivos 'diffusers' son en realidad las versiones GGUF Q8_0 y Q4_K_M. Archivos GGUF también disponibles en huggingface.

He afinado la versión 03 desde la base FLUX.1-dev durante más de 5 semanas en mi 4090. Es capaz de hacer distintos estilos artísticos, fotografía y anime. Truco que descubrí para ayudar con LoRAs.

Usé dpmpp 2m sgm uniform 30 pasos para las imágenes de muestra. Si quieres una salida más limpia, prueba subir la escala de la guía. También mencionar un estilo ayuda para que el modelo no tenga que adivinar.

También recomiendo probar añadiendo upscale latent por nodo y escalar el latent por 1.5, por ejemplo, generando una imagen de 1536x1536 en lugar de 1024x1024.

PixelWave Flux.1-schnell 03

Archivos Safetensor: 💾FP8 💾NF4

Archivos GGUF: ir a huggingface

Usé dpmpp 2m sgm uniform 8 pasos para las imágenes de muestra.

Puedes empezar con 4 pasos, pero hay menos errores anatómicos si usas más pasos.

PixelWave Flux.1-dev 02

Archivos Safetensor: 💾BF16 💾FP8

Archivos GGUF: 💾Q8_0 🤗Q6_K 💾Q4_K_M

La versión 02 tiene una gran mejora en imágenes negras y oscuras, y salidas más confiables con menos problemas con las manos.

Recomiendo usar dpmpp_2s_ancestral, beta, 14 pasos. O euler, simple, 20 pasos.

Nodos Comfyui-GGUF

PixelWave 11 SDXL. Un modelo afinado de propósito general. Ideal para estilos artísticos y fotográficos.

Uso 20 pasos, DPM++ SDE, CFG 4 a 6 o 40 pasos, 2M SDE Karras

Versión acelerada - 5+ pasos, DPM++ SDE Karras, 2.5 CFG

Recomendado PAG⚡ Recomendado escala 1.5, con CFG 3. Enlace al flujo de trabajo

🔗Enlace a Galería Expandida 🖼️

Guía de prompts.⭐ No es necesario usar términos de 'calidad' como 4K, 8K, obra maestra, alta definición, alta calidad, etc. A menos que lo desees, recomiendo no usar palabras como 'vibrante, intenso, brillante, alto contraste, neón, dramático' para estilos fotográficos si buscas un look más natural. Esto puede hacer que las imágenes parezcan 'sobre-procesadas', pero es sólo el CLIP siguiendo tu prompt. 🙂 Si quieres fotos vibrantes y neón, ¡PixelWave lo proporcionará!

El enfoque para la versión 10 fue entrenar los modelos CLIP, lo que mejora la confiabilidad, asegura que puedas producir una amplia variedad de estilos y que sigan mejor los prompts.

Gracias a mis amigos que ayudaron a probar: masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Guía: Ampliar prompts con LM Studio y Mikey Nodes

Guía: Añadir más detalles a tu imagen usando el método skip step

No es necesario el modelo refiner.

Este modelo no es una mezcla de otros modelos.

También creé Mikey Nodes que contiene muchos nodos útiles. Puedes instalarlo mediante comfy manager.

Anterior
Artify´s Fantastic Flux Landscape Lora - artilands_v1.0
Siguiente
Project0* - v4.0 Art_Realism_FP8

Detalles del Modelo

Tipo de modelo

Checkpoint

Modelo base

Flux.1 D

Versión del modelo

FLUX.1-dev 03

Hash del modelo

49b429b788

Discusión

Por favor log in para dejar un comentario.

Imágenes por PixelWave - FLUX.1-dev 03

Una mujer con vestido negro leyendo un libro en un sofá de terciopelo rojo oscuro en una sala de biblioteca acogedora y con poca luz, con chimenea encendida, pintura floral y altas estanterías.
Foto diurna de un barrio suburbano de Los Ángeles que muestra una SUV blanca estacionada en la calle frente a casas y palmeras.
Joven con jeans cortos y camiseta blanca apoyada en un coche rojo de los años 50 en una calle cubana colorida en La Habana con edificios de vecindad en tonos pastel.
Una vista aérea escénica de una ciudad romana situada en un paisaje italiano montañoso con caminos de tierra secos en primer plano, montañas al fondo y el océano a la izquierda bajo un cielo azul claro.

Imágenes con anime

Femenina egipcia estilo anime arrodillada en el desierto, con piel bronceada, cabello blanco, ojos rojos, vistiendo una túnica blanca y collar egipcio, rayo de sol al fondo.
Chica anime con cabello corto de pie en un campo de flores azules por la noche, con una luz azul brillante y una galaxia en el cielo, luces de la ciudad a lo lejos.
Una chica anime estilizada con cabello negro largo y llamativos ojos verdes, vestida con un atuendo negro y medias altas adornadas con tatuajes de flores rojas, sosteniendo una katana contra un fondo rojo.
Una escena dramática de batalla steampunk con dirigibles dominando el horizonte de la ciudad, robots y exotrajes a vapor luchando en la calle mientras una explosión ilumina el centro bajo cielos tormentosos.
Una chica zorro sonriente con cabello rubio, ojos amarillos, orejas y cola de zorro, que lleva un kimono colorido con borde de piel y adornos tradicionales en el cabello, parada frente a una puerta torii.
Chica anime con cabello púrpura-azul en un vestido chino rosa sentada en un sofá verde azulado sosteniendo bandejas con bebidas en un ambiente de café.
Chica de estilo anime rubia con vestido blanco de verano y sombrero grande con decoración de girasol, parada felizmente en un campo de girasoles al atardecer con los brazos levantados.
Una mujer segura con cabello blanco corto y ojos azules penetrantes, vistiendo un suéter sin mangas tipo cuello alto negro, pantalones negros y guantes sin dedos, de pie en un callejón urbano tenuemente iluminado bajo un cielo estrellado.
Mujer rubia con armadura Helldiver negra y dorada con escote, botas sobre muslo y sujetando un casco, con ojos azules y una ligera sonrisa
Chica anime con cabello rojo en trenza, vistiendo uniforme escolar azul marino con detalles dorados, sentada con las piernas abiertas, mirando al espectador con ojos rojos y usando lazos rojos y pendientes.

Imágenes con modelo base

Escena fotorrealista de personajes no muertos incluyendo zombis y esqueletos caminando por un cementerio tenebroso iluminado por calabazas Jack-o'-lantern brillantes bajo un cielo oscuro y ominoso.

Imágenes con arte digital

Un modelo de nave holográfica translúcida exhibida dentro de un cubo transparente en medio de una bulliciosa plaza futurista con edificios altos y carteles digitales.
Ilustración digital fotorrealista de un dormitorio futurista que presenta una proyección holográfica de un personaje con temática espacial en tonos azules sobre la cama ornamentada, con una mujer vestida con un atuendo futurista elegante sentada en la cama de una habitación lujosa con paredes azules y vista de la ciudad.
Una personaje femenina de ciencia ficción con una larga ponytail negra y flequillo, vistiendo un traje ajustado blanco y esmeralda, vista desde atrás con énfasis en su figura en estilo cómic.
Una taza de café Starbucks brillante que emite chispas violetas y cian y vapor en un entorno oscuro.
Pintura digital de un ave grande y oscura con plumas dentadas y alas extendidas, sobre un fondo texturizado rojo intenso con una luz brillante y luminosa a la derecha.
Retrato digital de una chica pelirroja con ojos verdes y pecas en la cara y hombros, vistiendo una camiseta sin mangas oscura contra un fondo oscuro.
Gato negro antropomórfico vestido con un elegante traje a cuadros sentado en un escritorio de madera, sosteniendo un vaso de gin marrón, con ojos amarillos brillantes y detalles intrincados en un ambiente de salón surrealista.
Retrato digital de un joven hombre blanco con cabello blanco y ojos azules, portada dinámica y detallada de álbum de música new wave titulada Contando los Días por MUSAIC.

Imágenes con fotografía

Abuelo con cabello gris y mujer con coleta alta de cabello gris de pie en una piscina turquesa con un perro blanco y un canguro cerca de paredes rosas
Arquitectura moderna oscura y atmosférica con estructuras de concreto escalonadas iluminadas por un resplandor naranja cálido durante la noche.
Un paisaje nocturno místico con ruinas de piedra antiguas con escalones, una luna llena brillante detrás de montañas distantes, un valle fluvial serpenteante, estrellas brillantes y un cielo cálido y mágico iluminado por una iluminación cinematográfica.
Lincoln Continental negro fotorrealista con ventanas tintadas oscuras en una calle mojada de Nueva York durante la puesta de sol en la hora dorada, con pavimento brillante y ambiente lluvioso en estilo de grano de película.
Un retrato de fotografía de moda de una mujer con cabello corto platino, asomándose desde detrás de un marco de puerta oscuro, iluminada por una iluminación cinematográfica azul fría en un estilo minimalista.
Primer plano de un retrato en doble exposición de una mujer con niebla y olas del océano fusionándose con su perfil en colores apagados y cinematográficos
Primer plano de una joven con ojos verdes y pecas parcialmente oculta detrás de un arbusto de flores moradas vibrantes y hojas verdes, una flor cubriendo un ojo.
Una ilustración fotorrealista en estilo acuarela de una mujer africana con túnica y pantalones blancos usando gafas de sol, bajando escaleras dentro de una enorme nave espacial negra futurista con elementos de diseño cyberpunk y post-apocalíptico bajo iluminación dramática.
Render 3D fotorealista de una figura dentro de un gran túnel cilíndrico oscuro con elementos tecnológicos futuristas y luces naranjas brillantes, iluminado por efectos de iluminación cinematográfica y volumétrica.
Foto hiperrealista frontal de un android distópico con un casco cyberpunk de metal esculpido, cables y alambres, cubierto con túnicas negras.

Imágenes con arte tradicional

Una confiada guardia romana femenina vistiendo una armadura de batalla de bronce detalladamente elaborada, de pie en una calle histórica durante el día.
Pintura en tinta oriental que muestra cascadas dramáticas descendiendo por acantilados montañosos escarpados con atmósfera brumosa y caligrafía tenue
Un gato calicó sentado serenamente entre vibrantes flores al estilo acuarela japonés bajo un gran sol rojo con elegantes efectos de tinta.
Primer plano de una chica con cabello brillante y piel clara, ojos cerrados.
Chica anime con cabello rubio largo en uniforme escolar tradicional japonés con un lazo azul
Un tigre blanco y una chica con ropa tradicional sobre un fondo de montaña neblinosa. Imagen generada por IA usando stable diffusion.
Una escena dramática con un samurái solitario de pie sobre el agua, frente a una pagoda japonesa tradicional a lo lejos bajo un cielo tormentoso con nubes giratorias y niebla, generado usando Stable Diffusion.
Imagen generada por IA usando Stable Diffusion de una mujer hermosa vestida con atuendo chino tradicional con cabello suelto, ropa antigua detallada y un fondo oriental sereno con una pagoda y follaje.