Une femme en robe noire lisant un livre sur un canapé en velours rouge foncé dans une salle de bibliothèque confortable faiblement éclairée avec une cheminée allumée, une peinture florale et de grandes étagères.
Photo de jour d'un quartier résidentiel en banlieue de Los Angeles montrant un SUV blanc garé dans la rue devant des maisons et des palmiers.
Jeune femme en jean court et débardeur blanc appuyée contre une voiture rouge des années 1950 dans une rue cubaine colorée à La Havane avec des immeubles pastel.
Une vue aérienne pittoresque d'une ville romaine située dans un paysage italien vallonné avec des chemins de terre secs au premier plan, des montagnes en arrière-plan et l'océan à gauche sous un ciel bleu clair.

Paramètres recommandés

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, euler, DPM++ SDE, 2M SDE Karras, DPM++ SDE Karras, DPM++ 2M

steps

4 - 40

cfg

2.5 - 7

resolution

1024x1024, 1536x1536

vae

ae.safetensors - unknown

Paramètres haute résolution recommandés

upscale

1.5 - null

Conseils

Vous pouvez utiliser plus d'étapes pour améliorer les détails fins, mais la sortie ne change pas beaucoup après 8 étapes.

Si vous voulez un rendu plus net/propre, essayez d'augmenter l'échelle de guidage (CFG).

Mentionner un style dans le prompt peut aider le modèle à générer de meilleurs résultats.

Essayez d'ajouter l'upscale latent par node, et d’échelle le latent par 1,5 pour générer des images en plus haute résolution.

Évitez d'utiliser des termes de 'qualité' comme 4K, 8K, chef-d'œuvre, haute définition, haute qualité sauf si nécessaire ; cela peut donner un aspect surcuit aux images.

Pour les styles photographiques, évitez les termes comme 'vibrant, intense, lumineux, haut contraste, néon, dramatique' si vous souhaitez un rendu naturel.

L'entraînement a été réalisé avec kohya_ss/sd-scripts utilisant l'optimiseur pagedlion8bit.

Geler 'time_in', 'vector_in' et les paramètres de modulation arrête la 'dé-distillation'.

Évitez d'entraîner des blocs uniques au-delà de 15 ; définissez les blocs d'entraînement dans la section FLUX.

Le taux d'apprentissage 5e-6 entraîne rapidement mais arrêtez après quelques milliers d'étapes pour éviter la corruption des blocs.

Points forts de la version

Affiné pendant 5 semaines sur mon 4090.

Sponsors du créateur

Modèle également disponible sur : RunDiffusion et Runware.ai

Un grand merci à RunDiffusion pour avoir sponsorisé les ressources de calcul qui ont rendu cet entraînement possible !

Pour l'accès API, partenariat avec Runware.ai

PixelWave FLUX.1-schnell 04 - Apache 2.0 !

Fichiers Safetensor : 💾BF16 💾FP8 💾bnb FP4

Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M

Liens vers 🤗VAE 🤗T5xxl 🤗CLIP L

Modèle également disponible sur : RunDiffusion et Runware.ai

PixelWave FLUX.1 schnell version 04 est un affinage esthétique du FLUX.1-schnell. Les images d'entraînement ont été triées à la main pour garantir que le modèle favorise des images captivantes, avec de belles couleurs, textures et éclairages.

  • Entraîné sur le modèle schnell original, donc licence Apache 2.0 !

  • Aucune exigence spéciale pour le fonctionnement. Prend en charge les LoRA FLUX

  • Euler Normal, 8 étapes.

Vous pouvez utiliser plus d'étapes pour améliorer les détails fins, mais la sortie ne change pas beaucoup après 8 étapes.

Merci à RunDiffusion

Un grand merci à RunDiffusion (co-créateurs de Juggernaut) pour avoir sponsorisé les ressources de calcul qui ont rendu cet entraînement possible ! Trouver comment entraîner schnell sans déconstruire le modèle a demandé beaucoup d'expérimentations, et pouvoir utiliser le cloud de RunDiffusion a grandement facilité la tâche.

Pour ceux qui ont besoin d’un accès API pour ce modèle, nous collaborons avec Runware.ai

J'ai rendu la version FLUX.1-dev 04 exclusive à RunDiffusion et Runware pour le moment. Lorsque je publierai la version 05 à l'avenir, je prévois de rendre open les poids du dev 04.

Reconnaissant pour leur soutien à la diffusion de ce modèle, veuillez les découvrir !

Entraînement

L'entraînement a été réalisé avec kohya_ss/sd-scripts. Vous pouvez trouver mon fork de Kohya ici, qui contient également des modifications du sous-module sd-scripts, assurez-vous de cloner les deux.

Utilisez l'onglet fine tuning. J'ai obtenu les meilleurs résultats avec l'optimiseur pagedlion8bit qui pouvait aussi fonctionner sur mon GPU 4090 24GB. D'autres optimisateurs avaient du mal à apprendre quoi que ce soit.

J'ai figé les paramètres time_in, vector_in et mod/modulation. Cela arrête la 'dé-distillation'.

J'évite d'entraîner des blocs uniques au-delà de 15. Vous pouvez définir quels blocs entraîner dans la section FLUX.

Le taux d'apprentissage 5e-6 entraîne rapidement, mais vous devez arrêter après quelques milliers d'étapes car cela commence à corrompre les blocs et ralentir l'apprentissage.

Vous pouvez alors fusionner les blocs avec un checkpoint antérieur, remplaçant les blocs corrompus, puis continuer l'entraînement.

Signes de blocs corrompus : texture papier sur la plupart des images, perte des détails en arrière-plan.

Contact

Pour les demandes commerciales ou professionnelles, veuillez nous contacter à pixelwave@rundiffusion.com. Licences pour flux fine tunes. Projets de formation client. Développement commercial d'IA. L'équipe peut tout gérer !

PixelWave Flux.1-dev 03 affiné !

Fichiers Safetensor : 💾BF16 💾FP8 💾NF4

Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M

Liens vers 🤗VAE 🤗T5xxl 🤗CLIP L

Les fichiers 'diffusers' sont en réalité les versions GGUF Q8_0 et Q4_K_M. Fichiers GGUF également disponibles sur huggingface.

J'ai affiné la version 03 à partir du FLUX.1-dev de base pendant plus de 5 semaines sur mon 4090. Il est capable de gérer différents styles artistiques, photographiques et d'anime. Astuce que j'ai découverte pour aider avec les LoRAs.

J'ai utilisé dpmpp 2m sgm uniform 30 étapes pour les images de démonstration. Si vous voulez un rendu plus net/propre, essayez d'augmenter le guidage. Mentionner un style peut aussi aider, ainsi le modèle ne doit pas deviner.

Je recommande aussi d'ajouter l'upscale latent par node, et d'échelle le latent par 1,5, par exemple générer une image de 1536x1536 au lieu de 1024x1024.

PixelWave Flux.1-schnell 03

Fichiers Safetensor : 💾FP8 💾NF4

Fichiers GGUF : aller sur huggingface

J'ai utilisé dpmpp 2m sgm uniform 8 étapes pour les images de démonstration.

Vous pouvez commencer avec 4 étapes, mais il y a moins d'erreurs anatomiques avec plus d'étapes.

PixelWave Flux.1-dev 02

Fichiers Safetensor : 💾BF16 💾FP8

Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M

La version 02 a grandement amélioré les images noires et sombres, avec des sorties plus fiables et moins de problèmes avec les mains.

Je recommande d'utiliser dpmpp_2s_ancestral, beta, 14 étapes. Ou euler, simple, 20 étapes.

Comfyui-GGUF Nodes

PixelWave 11 SDXL. Un modèle affiné à usage général. Parfait pour styles artistiques et photographiques.

J'utilise 20 étapes, DPM++ SDE, CFG 4 à 6 ou 40 étapes, 2M SDE Karras

Version accélérée - 5+ étapes, DPM++ SDE Karras, 2.5 CFG

PAG Recommandé⚡Recommandé échelle 1.5, avec CFG 3. Lien vers workflow

🔗Lien vers galerie étendue 🖼️

Guide de prompting.⭐ Vous n'avez pas besoin d'utiliser des termes de 'qualité' comme 4K, 8K, chef-d'œuvre, haute définition, haute qualité, etc. À moins que vous ne le souhaitiez, je recommande de ne pas utiliser des mots comme 'vibrant, intense, lumineux, haut contraste, néon, dramatique' pour les styles photographiques si vous souhaitez un rendu plus naturel. Cela peut donner un aspect 'surcuit', mais c'est simplement le CLIP qui suit votre prompt. 🙂 Si vous voulez des photos vibrantes et néon, PixelWave le fournit !

Le focus de la version 10 était d'entraîner les modèles CLIP, ce qui améliore la fiabilité, assure une grande variété de styles, et une meilleure compréhension des prompts.

Merci à mes amis qui ont aidé à tester : masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Guide : Améliorer les prompts avec LM Studio et Mikey Nodes

Guide : Ajouter plus de détails à votre image avec la méthode skip step

Pas besoin du modèle raffineur.

Ce modèle n’est pas un mélange d’autres modèles.

J'ai aussi créé Mikey Nodes qui contient beaucoup de nœuds utiles. Vous pouvez l'installer via comfy manager.

Précédent
Artify´s Fantastic Flux Landscape Lora - artilands_v1.0
Suivant
Project0* - v4.0 Art_Realism_FP8

Détails du modèle

Type de modèle

Checkpoint

Modèle de base

Flux.1 D

Version du modèle

FLUX.1-dev 03

Hash du modèle

49b429b788

Créateur

Discussion

Veuillez vous log in pour laisser un commentaire.

Images par PixelWave - FLUX.1-dev 03

Images avec anime

Images avec modèle de base

Images avec art numérique

Images avec photographie

Images avec art traditionnel