Une femme en robe noire lisant un livre sur un canapé en velours rouge foncé dans une salle de bibliothèque confortable faiblement éclairée avec une cheminée allumée, une peinture florale et de grandes étagères.
Photo de jour d'un quartier résidentiel en banlieue de Los Angeles montrant un SUV blanc garé dans la rue devant des maisons et des palmiers.
Jeune femme en jean court et débardeur blanc appuyée contre une voiture rouge des années 1950 dans une rue cubaine colorée à La Havane avec des immeubles pastel.
Une vue aérienne pittoresque d'une ville romaine située dans un paysage italien vallonné avec des chemins de terre secs au premier plan, des montagnes en arrière-plan et l'océan à gauche sous un ciel bleu clair.

Paramètres recommandés

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, euler, DPM++ SDE, 2M SDE Karras, DPM++ SDE Karras, DPM++ 2M

steps

4 - 40

cfg

2.5 - 7

resolution

1024x1024, 1536x1536

vae

ae.safetensors - unknown

Paramètres haute résolution recommandés

upscale

1.5 - null

Conseils

Vous pouvez utiliser plus d'étapes pour améliorer les détails fins, mais la sortie ne change pas beaucoup après 8 étapes.

Si vous voulez un rendu plus net/propre, essayez d'augmenter l'échelle de guidage (CFG).

Mentionner un style dans le prompt peut aider le modèle à générer de meilleurs résultats.

Essayez d'ajouter l'upscale latent par node, et d’échelle le latent par 1,5 pour générer des images en plus haute résolution.

Évitez d'utiliser des termes de 'qualité' comme 4K, 8K, chef-d'œuvre, haute définition, haute qualité sauf si nécessaire ; cela peut donner un aspect surcuit aux images.

Pour les styles photographiques, évitez les termes comme 'vibrant, intense, lumineux, haut contraste, néon, dramatique' si vous souhaitez un rendu naturel.

L'entraînement a été réalisé avec kohya_ss/sd-scripts utilisant l'optimiseur pagedlion8bit.

Geler 'time_in', 'vector_in' et les paramètres de modulation arrête la 'dé-distillation'.

Évitez d'entraîner des blocs uniques au-delà de 15 ; définissez les blocs d'entraînement dans la section FLUX.

Le taux d'apprentissage 5e-6 entraîne rapidement mais arrêtez après quelques milliers d'étapes pour éviter la corruption des blocs.

Points forts de la version

Affiné pendant 5 semaines sur mon 4090.

Sponsors du créateur

Modèle également disponible sur : RunDiffusion et Runware.ai

Un grand merci à RunDiffusion pour avoir sponsorisé les ressources de calcul qui ont rendu cet entraînement possible !

Pour l'accès API, partenariat avec Runware.ai

PixelWave FLUX.1-schnell 04 - Apache 2.0 !

Fichiers Safetensor : 💾BF16 💾FP8 💾bnb FP4

Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M

Liens vers 🤗VAE 🤗T5xxl 🤗CLIP L

Modèle également disponible sur : RunDiffusion et Runware.ai

PixelWave FLUX.1 schnell version 04 est un affinage esthétique du FLUX.1-schnell. Les images d'entraînement ont été triées à la main pour garantir que le modèle favorise des images captivantes, avec de belles couleurs, textures et éclairages.

  • Entraîné sur le modèle schnell original, donc licence Apache 2.0 !

  • Aucune exigence spéciale pour le fonctionnement. Prend en charge les LoRA FLUX

  • Euler Normal, 8 étapes.

Vous pouvez utiliser plus d'étapes pour améliorer les détails fins, mais la sortie ne change pas beaucoup après 8 étapes.

Merci à RunDiffusion

Un grand merci à RunDiffusion (co-créateurs de Juggernaut) pour avoir sponsorisé les ressources de calcul qui ont rendu cet entraînement possible ! Trouver comment entraîner schnell sans déconstruire le modèle a demandé beaucoup d'expérimentations, et pouvoir utiliser le cloud de RunDiffusion a grandement facilité la tâche.

Pour ceux qui ont besoin d’un accès API pour ce modèle, nous collaborons avec Runware.ai

J'ai rendu la version FLUX.1-dev 04 exclusive à RunDiffusion et Runware pour le moment. Lorsque je publierai la version 05 à l'avenir, je prévois de rendre open les poids du dev 04.

Reconnaissant pour leur soutien à la diffusion de ce modèle, veuillez les découvrir !

Entraînement

L'entraînement a été réalisé avec kohya_ss/sd-scripts. Vous pouvez trouver mon fork de Kohya ici, qui contient également des modifications du sous-module sd-scripts, assurez-vous de cloner les deux.

Utilisez l'onglet fine tuning. J'ai obtenu les meilleurs résultats avec l'optimiseur pagedlion8bit qui pouvait aussi fonctionner sur mon GPU 4090 24GB. D'autres optimisateurs avaient du mal à apprendre quoi que ce soit.

J'ai figé les paramètres time_in, vector_in et mod/modulation. Cela arrête la 'dé-distillation'.

J'évite d'entraîner des blocs uniques au-delà de 15. Vous pouvez définir quels blocs entraîner dans la section FLUX.

Le taux d'apprentissage 5e-6 entraîne rapidement, mais vous devez arrêter après quelques milliers d'étapes car cela commence à corrompre les blocs et ralentir l'apprentissage.

Vous pouvez alors fusionner les blocs avec un checkpoint antérieur, remplaçant les blocs corrompus, puis continuer l'entraînement.

Signes de blocs corrompus : texture papier sur la plupart des images, perte des détails en arrière-plan.

Contact

Pour les demandes commerciales ou professionnelles, veuillez nous contacter à pixelwave@rundiffusion.com. Licences pour flux fine tunes. Projets de formation client. Développement commercial d'IA. L'équipe peut tout gérer !

PixelWave Flux.1-dev 03 affiné !

Fichiers Safetensor : 💾BF16 💾FP8 💾NF4

Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M

Liens vers 🤗VAE 🤗T5xxl 🤗CLIP L

Les fichiers 'diffusers' sont en réalité les versions GGUF Q8_0 et Q4_K_M. Fichiers GGUF également disponibles sur huggingface.

J'ai affiné la version 03 à partir du FLUX.1-dev de base pendant plus de 5 semaines sur mon 4090. Il est capable de gérer différents styles artistiques, photographiques et d'anime. Astuce que j'ai découverte pour aider avec les LoRAs.

J'ai utilisé dpmpp 2m sgm uniform 30 étapes pour les images de démonstration. Si vous voulez un rendu plus net/propre, essayez d'augmenter le guidage. Mentionner un style peut aussi aider, ainsi le modèle ne doit pas deviner.

Je recommande aussi d'ajouter l'upscale latent par node, et d'échelle le latent par 1,5, par exemple générer une image de 1536x1536 au lieu de 1024x1024.

PixelWave Flux.1-schnell 03

Fichiers Safetensor : 💾FP8 💾NF4

Fichiers GGUF : aller sur huggingface

J'ai utilisé dpmpp 2m sgm uniform 8 étapes pour les images de démonstration.

Vous pouvez commencer avec 4 étapes, mais il y a moins d'erreurs anatomiques avec plus d'étapes.

PixelWave Flux.1-dev 02

Fichiers Safetensor : 💾BF16 💾FP8

Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M

La version 02 a grandement amélioré les images noires et sombres, avec des sorties plus fiables et moins de problèmes avec les mains.

Je recommande d'utiliser dpmpp_2s_ancestral, beta, 14 étapes. Ou euler, simple, 20 étapes.

Comfyui-GGUF Nodes

PixelWave 11 SDXL. Un modèle affiné à usage général. Parfait pour styles artistiques et photographiques.

J'utilise 20 étapes, DPM++ SDE, CFG 4 à 6 ou 40 étapes, 2M SDE Karras

Version accélérée - 5+ étapes, DPM++ SDE Karras, 2.5 CFG

PAG Recommandé⚡Recommandé échelle 1.5, avec CFG 3. Lien vers workflow

🔗Lien vers galerie étendue 🖼️

Guide de prompting.⭐ Vous n'avez pas besoin d'utiliser des termes de 'qualité' comme 4K, 8K, chef-d'œuvre, haute définition, haute qualité, etc. À moins que vous ne le souhaitiez, je recommande de ne pas utiliser des mots comme 'vibrant, intense, lumineux, haut contraste, néon, dramatique' pour les styles photographiques si vous souhaitez un rendu plus naturel. Cela peut donner un aspect 'surcuit', mais c'est simplement le CLIP qui suit votre prompt. 🙂 Si vous voulez des photos vibrantes et néon, PixelWave le fournit !

Le focus de la version 10 était d'entraîner les modèles CLIP, ce qui améliore la fiabilité, assure une grande variété de styles, et une meilleure compréhension des prompts.

Merci à mes amis qui ont aidé à tester : masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Guide : Améliorer les prompts avec LM Studio et Mikey Nodes

Guide : Ajouter plus de détails à votre image avec la méthode skip step

Pas besoin du modèle raffineur.

Ce modèle n’est pas un mélange d’autres modèles.

J'ai aussi créé Mikey Nodes qui contient beaucoup de nœuds utiles. Vous pouvez l'installer via comfy manager.

Précédent
Artify´s Fantastic Flux Landscape Lora - artilands_v1.0
Suivant
Project0* - v4.0 Art_Realism_FP8

Détails du modèle

Type de modèle

Checkpoint

Modèle de base

Flux.1 D

Version du modèle

FLUX.1-dev 03

Hash du modèle

49b429b788

Créateur

Discussion

Veuillez vous log in pour laisser un commentaire.

Images par PixelWave - FLUX.1-dev 03

Une femme en robe noire lisant un livre sur un canapé en velours rouge foncé dans une salle de bibliothèque confortable faiblement éclairée avec une cheminée allumée, une peinture florale et de grandes étagères.
Photo de jour d'un quartier résidentiel en banlieue de Los Angeles montrant un SUV blanc garé dans la rue devant des maisons et des palmiers.
Jeune femme en jean court et débardeur blanc appuyée contre une voiture rouge des années 1950 dans une rue cubaine colorée à La Havane avec des immeubles pastel.
Une vue aérienne pittoresque d'une ville romaine située dans un paysage italien vallonné avec des chemins de terre secs au premier plan, des montagnes en arrière-plan et l'océan à gauche sous un ciel bleu clair.

Images avec anime

Femme égyptienne style anime agenouillée dans le désert, peau bronzée, cheveux blancs, yeux rouges, portant une robe blanche et un collier égyptien, rayon de soleil en arrière-plan.
Fille d'anime aux cheveux courts debout dans un champ de fleurs bleues la nuit, avec une lumière bleue brillante et une galaxie dans le ciel, lumières de la ville au loin.
Une fille d'anime stylisée aux longs cheveux noirs et aux yeux verts saisissants, vêtue d'une tenue noire et de bas noirs ornés de tatouages rouges de fleurs, tenant un katana sur un fond rouge.
Une scène de bataille steampunk dramatique avec des dirigeables dominant la ligne d'horizon de la ville, des robots et des exosquelettes à vapeur se battant dans la rue tandis qu'une explosion éclaire le centre sous un ciel orageux.
Une fille renard souriante aux cheveux blonds, yeux jaunes, oreilles de renard et queue de renard, portant un kimono coloré avec bordure en fourrure et ornements capillaires traditionnels, debout devant une porte torii.
Fille anime aux cheveux violet-bleu en robe chinoise rose assise sur un canapé sarcelle tenant des plateaux de boissons dans un cadre de café.
Fille blonde de style anime portant une robe d'été blanche et un grand chapeau de soleil décoré d'un tournesol, se tenant joyeusement dans un champ de tournesols au coucher du soleil avec les bras levés.
Une femme confiante aux cheveux blancs courts et aux yeux bleus perçants portant un pull noir sans manches à col roulé, un pantalon noir et des gants sans doigts, se tenant dans une ruelle urbaine faiblement éclairée sous un ciel étoilé.
Femme blonde portant une armure Helldiver noire et or avec découpe décolleté, cuissardes, tenant un casque, avec des yeux bleus et un léger sourire
Fille d'anime aux cheveux rouges en tresse, portant un uniforme scolaire bleu marine avec bordure dorée, assise les jambes écartées, regardant le spectateur avec des yeux rouges, et portant des rubans rouges et des boucles d'oreilles.

Images avec modèle de base

Scène photoréaliste de personnages morts-vivants comprenant des zombies et des squelettes marchant à travers un cimetière hanté éclairé par des citrouilles-lanternes lumineuses sous un ciel sombre et menaçant.

Images avec art numérique

Un modèle de vaisseau holographique translucide exposé à l'intérieur d'un cube transparent au milieu d'une place animée d'une ville futuriste avec de grands bâtiments et des panneaux d'affichage numériques.
Illustration numérique photoréaliste d'une chambre futuriste présentant une projection holographique d'un personnage à thème spatial aux tons bleus au-dessus du lit orné, avec une femme en tenue futuriste élégante assise sur le lit dans une pièce luxueuse aux murs bleus et vue sur la ville.
Un personnage féminin sci-fi avec une longue queue de cheval noire et une frange, portant une combinaison moulante blanche et émeraude, vue de dos avec un accent sur sa silhouette dans un style bande dessinée.
Une tasse de café Starbucks lumineuse émettant des étincelles violettes et cyan ainsi que de la vapeur dans un cadre sombre.
Peinture numérique d'un grand oiseau sombre aux plumes déchiquetées et ailes déployées, sur un fond texturé rouge intense avec une lumière brillante à droite.
Portrait numérique d'une fille rousse aux yeux verts avec taches de rousseur sur le visage et les épaules, vêtue d'un débardeur sombre sur un fond sombre.
Chat noir anthro portant un élégant costume à carreaux assis à un bureau en bois, tenant un verre de gin brun, avec des yeux jaune vif et des détails complexes dans un cadre lounge surréaliste.
Portrait numérique d'un jeune homme blanc aux cheveux blancs et aux yeux bleus, couverture d'album de musique new wave dynamique et détaillée intitulée Counting Down The Days par MUSAIC.

Images avec photographie

Grand-père aux cheveux gris et femme avec queue de cheval haute aux cheveux gris debout dans une piscine turquoise avec un chien blanc et un kangourou près de murs roses
Architecture moderne sombre et atmosphérique avec structures en béton étagées illuminées par une lueur orange chaude la nuit.
Un paysage nocturne mystique présentant des ruines de pierre anciennes avec des marches, une pleine lune lumineuse se couchant derrière des montagnes lointaines, une vallée fluviale sinueuse, des étoiles scintillantes et un ciel chaud et magique illuminé par un éclairage cinématographique.
Lincoln Continental noire photoréaliste avec vitres teintées foncées dans une rue humide de New York City durant le coucher du soleil à l'heure dorée, avec un pavé brillant et une atmosphère pluvieuse en style grain de film.
Un portrait de photographie de mode d'une femme aux cheveux courts platine, regardant par-dessus un encadrement de porte sombre, illuminée par un éclairage cinématographique bleu froid dans un style minimaliste.
Portrait en gros plan double exposition d'une femme avec brume et vagues océaniques se fondant avec son profil dans des couleurs cinématographiques atténuées
Gros plan d'une jeune femme aux yeux verts et taches de rousseur partiellement cachée derrière un buisson de fleurs violettes vibrantes et de feuilles vertes, une fleur couvrant un œil.
Une illustration photoréaliste de style aquarelle d'une femme africaine en tunique blanche et pantalon portant des lunettes de soleil, descendant des escaliers à l'intérieur d'un immense vaisseau spatial noir futuriste avec des éléments de design cyberpunk et post-apocalyptique sous un éclairage dramatique.
Rendu 3D photoréaliste d'une silhouette debout à l'intérieur d'un grand tunnel cylindrique sombre avec des éléments technologiques futuristes et des lumières orange brillantes, illuminé par des effets d'éclairage cinématographique et volumétrique.
Photo hyperréaliste de face d'un android dystopique portant un casque cyberpunk en métal sculpté avec fils et câbles, enveloppé dans des robes noires.

Images avec art traditionnel

Une femme garde romaine confiante portant une armure de combat en bronze finement détaillée, debout dans une rue historique en plein jour.
Peinture en lavis oriental représentant des cascades dramatiques dévalant des falaises montagneuses escarpées avec une atmosphère brumeuse et une calligraphie discrète
Un chat calico assis sereinement parmi des fleurs vives dans le style aquarelle japonais sous un grand soleil rouge avec des effets élégants à l'encre.
Gros plan d'une fille avec cheveux brillants et peau claire, les yeux fermés.
Fille anime aux longs cheveux blonds portant un uniforme scolaire japonais traditionnel avec un nœud bleu
Un tigre blanc et une fille en vêtements traditionnels sur un fond de montagne brumeuse. Image générée par IA utilisant stable diffusion.
Une scène dramatique avec un samouraï solitaire debout sur l'eau, faisant face à une pagode japonaise traditionnelle au loin sous un ciel orageux avec des nuages tourbillonnants et de la brume, générée avec Stable Diffusion.
Image générée par IA utilisant Stable Diffusion d'une belle femme vêtue d'une tenue traditionnelle chinoise avec des cheveux flottants, un vêtement ancien détaillé, et un arrière-plan oriental serein avec une pagode et un feuillage.