PixelWave - FLUX.1-schnell 04
Mots-clés et tags associés
Paramètres recommandés
samplers
steps
cfg
resolution
vae
Paramètres haute résolution recommandés
upscale
Conseils
Utilisez plus de 8 étapes pour améliorer les détails fins, mais la sortie ne change pas beaucoup après 8 étapes.
Ajouter des prompts de style peut aider le modèle à générer une sortie plus nette et propre.
Essayez d'augmenter l'échelle de guidage pour obtenir des images plus nettes.
Évitez d'utiliser des termes « qualité » comme 4K, 8K, chef-d'œuvre, haute définition si vous souhaitez un rendu naturel en photographie.
Pour la montée en résolution, essayez upscale latent par node et scale latent par 1,5 pour des images de plus haute résolution.
Utilisez l'optimiseur pagedlion8bit pour l'entraînement sur GPU 24GB, avec les paramètres time_in, vector_in et modulation gelés pour éviter la dé-distillation.
Arrêtez l'entraînement après quelques milliers d'étapes avec LR 5e-6 pour éviter la corruption des blocs, et réalisez une fusion de blocs avec d'anciens checkpoints pour corriger la corruption.
Points forts de la version
Affinage du modèle schnell, sans utiliser le modèle dev de quelque manière que ce soit. Licence Apache 2.0 !
Entraîné avec kohya en utilisant un planning sigma personnalisé et en gelant les paramètres time et modulation pour éviter la dégradation de la distillation temporelle.
➤ Étapes d'entraînement combinées : 1 360 641
➤ Durée d'entraînement active : 1192,61 heures (49,7 jours)
Sponsors du créateur
Modèle également disponible sur : RunDiffusion et Runware.ai
Un immense merci à RunDiffusion pour avoir financé la puissance de calcul nécessaire à l'entraînement de ce modèle !
Pour l'accès API, consultez Runware.ai.
PixelWave FLUX.1-schnell 04 - Apache 2.0 !
Fichiers Safetensor : 💾BF16 💾FP8 💾bnb FP4
Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M
Liens vers 🤗VAE 🤗T5xxl 🤗CLIP L
Modèle également disponible sur : RunDiffusion et Runware.ai
PixelWave FLUX.1 schnell version 04 est un affinage esthétique de FLUX.1-schnell. Les images d'entraînement ont été sélectionnées à la main pour garantir que le modèle ait une préférence pour des images captivantes, avec de belles couleurs, textures et éclairage.
Entraîné sur le modèle schnell original, donc licence Apache 2.0 !
Aucune exigence spéciale pour l'exécution. Supporte les LoRAs FLUX
Euler Normal, 8 étapes.
Vous pouvez utiliser plus d'étapes pour améliorer les détails fins, mais la sortie ne change pas beaucoup après 8 étapes.
Remerciements à RunDiffusion
Un grand merci à RunDiffusion (co-créateurs de Juggernaut) pour avoir financé la puissance de calcul qui a rendu possible l'entraînement de ce modèle ! Trouver comment entraîner schnell sans dé-distiller le modèle a nécessité beaucoup d'expérimentations, et pouvoir utiliser le cloud compute de RunDiffusion l'a grandement facilité.
Pour ceux qui ont besoin d'un accès API pour ce modèle, nous nous associons avec Runware.ai
J'ai réservé la version FLUX.1-dev 04 exclusivement à RunDiffusion et Runware pour le moment. Lorsque je publierai la version 05 à l'avenir, je prévois de rendre public le poids dev 04.
Reconnaissant pour leur soutien à la diffusion de ce modèle, veuillez les découvrir !
Entraînement
L'entraînement a été réalisé avec kohya_ss/sd-scripts. Vous pouvez trouver mon fork de Kohya ici, qui contient également des modifications du sous-module sd-scripts, assurez-vous de cloner les deux.
Utilisez l'onglet de fine tuning. J'ai obtenu les meilleurs résultats avec l'optimiseur pagedlion8bit qui pouvait aussi fonctionner sur mon GPU 4090 24GB. J'ai constaté que d'autres optimiseurs avaient du mal à apprendre quoi que ce soit.
J'ai gelé les paramètres time_in, vector_in et mod/modulation. Cela empêche la 'dé-distillation'.
J'évite d'entraîner des blocs uniques de plus de 15. Vous pouvez définir quels blocs entraîner dans la section FLUX.
LR 5e-6 entraîne rapidement, mais vous devez arrêter après quelques milliers d'étapes car cela commence à corrompre des blocs et ralentir l'apprentissage.
Vous pouvez ensuite fusionner des blocs avec un checkpoint antérieur, remplaçant les blocs corrompus, puis continuer l'entraînement.
Signes de blocs corrompus : texture papier sur la plupart des images, perte des détails d'arrière-plan.
Contact
Pour toute demande commerciale ou professionnelle, veuillez nous contacter à pixelwave@rundiffusion.com. Licence des fine tunes flux. Projets de formation client. Développement commercial IA. L'équipe peut tout faire !
PixelWave Flux.1-dev 03 affiné !
Fichiers Safetensor : 💾BF16 💾FP8 💾NF4
Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M
Liens vers 🤗VAE 🤗T5xxl 🤗CLIP L
Les fichiers 'diffusers' sont en fait les versions GGUF Q8_0 et Q4_K_M. Les fichiers GGUF sont également disponibles sur huggingface.
J'ai affiné la version 03 à partir de la base FLUX.1-dev pendant plus de 5 semaines sur ma 4090. Il est capable de gérer différents styles artistiques, photographie, et anime. Astuce que j'ai découverte pour aider avec les LoRAs.
J'ai utilisé dpmpp 2m sgm uniform 30 étapes pour les images de démonstration. Si vous souhaitez une sortie plus nette/plus propre, essayez d'augmenter la guidance. Mentionner un style peut aussi aider, ainsi le modèle ne doit pas deviner.
Je recommande aussi d'essayer d'ajouter la montée en résolution latente par node, et de scaler la latente par 1,5, par exemple générer une image de 1536x1536 au lieu de 1024x1024.
PixelWave Flux.1-schnell 03
Fichiers Safetensor : 💾FP8 💾NF4
Fichiers GGUF : aller sur huggingface
J'ai utilisé dpmpp 2m sgm uniform 8 étapes pour les images de démonstration.
Vous pouvez commencer avec 4 étapes, mais il y a moins d'erreurs d'anatomie si vous exécutez plus d'étapes.
PixelWave Flux.1-dev 02
Fichiers Safetensor : 💾BF16 💾FP8
Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M
La version 02 a grandement amélioré les images noires et sombres, et offre des résultats plus fiables avec moins de problèmes sur les mains.
Je recommande d'utiliser dpmpp_2s_ancestral, beta, 14 étapes. Ou euler, simple, 20 étapes.
PixelWave 11 SDXL. Un modèle affiné polyvalent. Parfait pour les styles artistiques et photographiques.
J'utilise 20 étapes, DPM++ SDE, CFG 4 à 6 ou 40 étapes, 2M SDE Karras
Version accélérée - 5+ étapes, DPM++ SDE Karras, 2.5 CFG
PAG recommandé⚡Recommandé échelle 1.5, avec CFG 3. Lien vers le workflow
🔗Lien vers la galerie étendue 🖼️
⭐Guide pour la génération d'images.⭐ Vous n'avez pas besoin d'utiliser des termes 'qualité' tels que 4K, 8K, chef-d'œuvre, haute définition, haute qualité, etc. Sauf si vous le souhaitez, je recommande de ne pas utiliser des mots tels que 'vibrant, intense, lumineux, haut contraste, néon, dramatique' pour des styles photographiques si vous voulez un rendu plus naturel. Cela peut donner un aspect 'trop cuisiné' aux images, mais c'est simplement le CLIP qui suit votre prompt. 🙂 Si vous souhaitez des photos vibrantes et néon, PixelWave les fournira !
L'objectif de la version 10 était d'entraîner les modèles CLIP, ce qui améliore la fiabilité, assure la production d'un large éventail de styles, et une meilleure conformité aux prompts.
Merci à mes amis qui ont aidé à tester : masslevel, blink, socalguitarist, klinter, wizard whitebeard.
Guide : Améliorer la résolution avec LM Studio et Mikey Nodes
Guide : Ajouter plus de détails à votre image avec la méthode skip step
Pas besoin du modèle affiner.
Ce modèle n'est pas un mélange d'autres modèles.
J'ai aussi créé Mikey Nodes qui contient beaucoup de nœuds utiles. Vous pouvez l'installer via comfy manager.
Détails du modèle
Type de modèle
Modèle de base
Version du modèle
Hash du modèle
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.





