Un astronaute en combinaison spatiale usée se tient dans un désert blanc devant un énorme vaisseau spatial en forme de requin avec une ouverture béante semblable à une bouche et de grands moteurs.

Paramètres recommandés

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, Euler, DPM++ SDE, 2M SDE Karras

steps

4 - 40

cfg

2.5 - 7

resolution

1536x1536, 1024x1024

vae

ae.safetensors

Paramètres haute résolution recommandés

upscale

1.5 - null

Conseils

Utilisez plus de 8 étapes pour améliorer les détails fins, mais la sortie ne change pas beaucoup après 8 étapes.

Ajouter des prompts de style peut aider le modèle à générer une sortie plus nette et propre.

Essayez d'augmenter l'échelle de guidage pour obtenir des images plus nettes.

Évitez d'utiliser des termes « qualité » comme 4K, 8K, chef-d'œuvre, haute définition si vous souhaitez un rendu naturel en photographie.

Pour la montée en résolution, essayez upscale latent par node et scale latent par 1,5 pour des images de plus haute résolution.

Utilisez l'optimiseur pagedlion8bit pour l'entraînement sur GPU 24GB, avec les paramètres time_in, vector_in et modulation gelés pour éviter la dé-distillation.

Arrêtez l'entraînement après quelques milliers d'étapes avec LR 5e-6 pour éviter la corruption des blocs, et réalisez une fusion de blocs avec d'anciens checkpoints pour corriger la corruption.

Points forts de la version

Affinage du modèle schnell, sans utiliser le modèle dev de quelque manière que ce soit. Licence Apache 2.0 !

Entraîné avec kohya en utilisant un planning sigma personnalisé et en gelant les paramètres time et modulation pour éviter la dégradation de la distillation temporelle.

➤ Étapes d'entraînement combinées : 1 360 641

➤ Durée d'entraînement active : 1192,61 heures (49,7 jours)

Sponsors du créateur

Modèle également disponible sur : RunDiffusion et Runware.ai

Un immense merci à RunDiffusion pour avoir financé la puissance de calcul nécessaire à l'entraînement de ce modèle !

Pour l'accès API, consultez Runware.ai.

PixelWave FLUX.1-schnell 04 - Apache 2.0 !

Fichiers Safetensor : 💾BF16 💾FP8 💾bnb FP4

Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M

Liens vers 🤗VAE 🤗T5xxl 🤗CLIP L

Modèle également disponible sur : RunDiffusion et Runware.ai

PixelWave FLUX.1 schnell version 04 est un affinage esthétique de FLUX.1-schnell. Les images d'entraînement ont été sélectionnées à la main pour garantir que le modèle ait une préférence pour des images captivantes, avec de belles couleurs, textures et éclairage.

  • Entraîné sur le modèle schnell original, donc licence Apache 2.0 !

  • Aucune exigence spéciale pour l'exécution. Supporte les LoRAs FLUX

  • Euler Normal, 8 étapes.

Vous pouvez utiliser plus d'étapes pour améliorer les détails fins, mais la sortie ne change pas beaucoup après 8 étapes.

Remerciements à RunDiffusion

Un grand merci à RunDiffusion (co-créateurs de Juggernaut) pour avoir financé la puissance de calcul qui a rendu possible l'entraînement de ce modèle ! Trouver comment entraîner schnell sans dé-distiller le modèle a nécessité beaucoup d'expérimentations, et pouvoir utiliser le cloud compute de RunDiffusion l'a grandement facilité.

Pour ceux qui ont besoin d'un accès API pour ce modèle, nous nous associons avec Runware.ai

J'ai réservé la version FLUX.1-dev 04 exclusivement à RunDiffusion et Runware pour le moment. Lorsque je publierai la version 05 à l'avenir, je prévois de rendre public le poids dev 04.

Reconnaissant pour leur soutien à la diffusion de ce modèle, veuillez les découvrir !

Entraînement

L'entraînement a été réalisé avec kohya_ss/sd-scripts. Vous pouvez trouver mon fork de Kohya ici, qui contient également des modifications du sous-module sd-scripts, assurez-vous de cloner les deux.

Utilisez l'onglet de fine tuning. J'ai obtenu les meilleurs résultats avec l'optimiseur pagedlion8bit qui pouvait aussi fonctionner sur mon GPU 4090 24GB. J'ai constaté que d'autres optimiseurs avaient du mal à apprendre quoi que ce soit.

J'ai gelé les paramètres time_in, vector_in et mod/modulation. Cela empêche la 'dé-distillation'.

J'évite d'entraîner des blocs uniques de plus de 15. Vous pouvez définir quels blocs entraîner dans la section FLUX.

LR 5e-6 entraîne rapidement, mais vous devez arrêter après quelques milliers d'étapes car cela commence à corrompre des blocs et ralentir l'apprentissage.

Vous pouvez ensuite fusionner des blocs avec un checkpoint antérieur, remplaçant les blocs corrompus, puis continuer l'entraînement.

Signes de blocs corrompus : texture papier sur la plupart des images, perte des détails d'arrière-plan.

Contact

Pour toute demande commerciale ou professionnelle, veuillez nous contacter à pixelwave@rundiffusion.com. Licence des fine tunes flux. Projets de formation client. Développement commercial IA. L'équipe peut tout faire !

PixelWave Flux.1-dev 03 affiné !

Fichiers Safetensor : 💾BF16 💾FP8 💾NF4

Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M

Liens vers 🤗VAE 🤗T5xxl 🤗CLIP L

Les fichiers 'diffusers' sont en fait les versions GGUF Q8_0 et Q4_K_M. Les fichiers GGUF sont également disponibles sur huggingface.

J'ai affiné la version 03 à partir de la base FLUX.1-dev pendant plus de 5 semaines sur ma 4090. Il est capable de gérer différents styles artistiques, photographie, et anime. Astuce que j'ai découverte pour aider avec les LoRAs.

J'ai utilisé dpmpp 2m sgm uniform 30 étapes pour les images de démonstration. Si vous souhaitez une sortie plus nette/plus propre, essayez d'augmenter la guidance. Mentionner un style peut aussi aider, ainsi le modèle ne doit pas deviner.

Je recommande aussi d'essayer d'ajouter la montée en résolution latente par node, et de scaler la latente par 1,5, par exemple générer une image de 1536x1536 au lieu de 1024x1024.

PixelWave Flux.1-schnell 03

Fichiers Safetensor : 💾FP8 💾NF4

Fichiers GGUF : aller sur huggingface

J'ai utilisé dpmpp 2m sgm uniform 8 étapes pour les images de démonstration.

Vous pouvez commencer avec 4 étapes, mais il y a moins d'erreurs d'anatomie si vous exécutez plus d'étapes.

PixelWave Flux.1-dev 02

Fichiers Safetensor : 💾BF16 💾FP8

Fichiers GGUF : 💾Q8_0 🤗Q6_K 💾Q4_K_M

La version 02 a grandement amélioré les images noires et sombres, et offre des résultats plus fiables avec moins de problèmes sur les mains.

Je recommande d'utiliser dpmpp_2s_ancestral, beta, 14 étapes. Ou euler, simple, 20 étapes.

Nœuds Comfyui-GGUF

PixelWave 11 SDXL. Un modèle affiné polyvalent. Parfait pour les styles artistiques et photographiques.

J'utilise 20 étapes, DPM++ SDE, CFG 4 à 6 ou 40 étapes, 2M SDE Karras

Version accélérée - 5+ étapes, DPM++ SDE Karras, 2.5 CFG

PAG recommandé⚡Recommandé échelle 1.5, avec CFG 3. Lien vers le workflow

🔗Lien vers la galerie étendue 🖼️

Guide pour la génération d'images.⭐ Vous n'avez pas besoin d'utiliser des termes 'qualité' tels que 4K, 8K, chef-d'œuvre, haute définition, haute qualité, etc. Sauf si vous le souhaitez, je recommande de ne pas utiliser des mots tels que 'vibrant, intense, lumineux, haut contraste, néon, dramatique' pour des styles photographiques si vous voulez un rendu plus naturel. Cela peut donner un aspect 'trop cuisiné' aux images, mais c'est simplement le CLIP qui suit votre prompt. 🙂 Si vous souhaitez des photos vibrantes et néon, PixelWave les fournira !

L'objectif de la version 10 était d'entraîner les modèles CLIP, ce qui améliore la fiabilité, assure la production d'un large éventail de styles, et une meilleure conformité aux prompts.

Merci à mes amis qui ont aidé à tester : masslevel, blink, socalguitarist, klinter, wizard whitebeard.

Guide : Améliorer la résolution avec LM Studio et Mikey Nodes

Guide : Ajouter plus de détails à votre image avec la méthode skip step

Pas besoin du modèle affiner.

Ce modèle n'est pas un mélange d'autres modèles.

J'ai aussi créé Mikey Nodes qui contient beaucoup de nœuds utiles. Vous pouvez l'installer via comfy manager.

Précédent
Smol Dragons [LoRA 1.5+SDXL] - SDXL
Suivant
ICBINP - « Je n'arrive pas à croire que ce n'est pas de la photographie » - LCM

Détails du modèle

Type de modèle

Checkpoint

Modèle de base

Flux.1 S

Version du modèle

FLUX.1-schnell 04

Hash du modèle

565b846820

Créateur

Discussion

Veuillez vous log in pour laisser un commentaire.

Images par PixelWave - FLUX.1-schnell 04

Un astronaute en combinaison spatiale usée se tient dans un désert blanc devant un énorme vaisseau spatial en forme de requin avec une ouverture béante semblable à une bouche et de grands moteurs.

Images avec anime

Illustration numérique de style anime montrant une grande structure pyramidale triangulaire en pierre pointue sur une terre aride avec des rochers épars sous un ciel étoilé et une planète aux anneaux orange.
Guerrière féminine de style anime détaillée en tenue de cuir noir, adoptant une pose dynamique avec des effets colorés tourbillonnants bleus et oranges en arrière-plan.
Personnage anime Frieren aux oreilles pointues et yeux verts, cheveux gris en couettes, portant une chemise de nuit blanche transparente, assise sur un lit dans une chambre doucement éclairée.
Un portrait détaillé d'un cyborg aux longs cheveux blancs, aux yeux bleus, portant une armure robotique complexe, debout dans un paysage urbain cyberpunk futuriste la nuit.
Portrait en gros plan d'une petite fille elfe aux longues couettes argentées, aux yeux bleu sarcelle et aux traits délicats du visage, portant un petit capelet blanc avec des bordures dorées et des boucles d'oreilles rouges, debout dans une forêt.
Une fée délicate ressemblant à Fée Clochette avec des ailes translucides complexes, dormant paisiblement sur des fleurs vibrantes, vêtue d'une tenue verte détaillée.
Y'shtola Rhul de Final Fantasy XIV portant une robe chinoise noire sans manches avec des oreilles de chat et une queue, sur fond de nuit avec des lanternes suspendues.
Un monastère et une ville de science-fiction futuristes intégrés aux falaises abruptes d'une gorge luxuriante avec une rivière en contrebas, comprenant une machine volante et une femme solitaire traversant un pont étroit.
Un perroquet ara vibrant perché sur une branche dans une forêt tropicale avec des tons pastel doux et un style anime à fort contraste.
Une fille aux beaux yeux et à la frange assise sur l'herbe, la lumière du soleil et les ombres des feuilles s'entrelacent sur elle et le sol.

Images avec modèle de base

Scène photoréaliste de personnages morts-vivants comprenant des zombies et des squelettes marchant à travers un cimetière hanté éclairé par des citrouilles-lanternes lumineuses sous un ciel sombre et menaçant.

Images avec art numérique

Abstract digital artwork depicting a fragmented figure dancing under a large glowing moon, composed of glitch art style shards with stark contrasts and foggy ambiance.
Gros plan en noir et blanc d'une femme aux cheveux mouillés baignés de pluie se désintégrant partiellement en particules arc-en-ciel colorées dérivant vers la gauche.
Portrait d'une femme noire à la peau foncée stylisée en déesse portant des bijoux en or et une tenue dorée avec des cheveux courts et foncés.
Ville futuriste avec de hautes tours cylindriques en verre situées dans un paysage montagneux enneigé sous un ciel dramatique au coucher du soleil.
Art numérique d'un chat gris foncé mignon aux yeux bleus brillants assis sur une branche d'arbre entouré de feuilles d'automne orange. Le chat a un halo lumineux au-dessus de sa tête et porte un collier avec un pendentif.
Une femme féroce en exosquelette high-tech lumineux tire des rafales d'énergie au milieu d'une explosion massive dans un paysage urbain dystopique éclairé au néon.
Peinture numérique en gros plan d'une petite fille aux cheveux bruns tenant un lapin blanc devant un village enneigé en hiver, rendu dans un style artistique classique.
Vue depuis l'arrière d'un long chemin fissuré menant à travers une ville dystopique dévastée par une explosion atomique avec un énorme champignon nucléaire et des ruines en feu.
Une licorne blanche avec une corne rose lumineuse et une crinière rose flottante, des yeux rouges avec une sclérotique colorée, sur un fond sombre dans un style art numérique.

Images avec photographie

Portrait en gros plan d'un extraordinaire oiseau Geai bleu à l'aube avec plumes détaillées, crête bleue vibrante et œil vif avec un subtil flou de mouvement.
Femme blonde avec des taches de rousseur et un sourire assise en plein air portant un t-shirt col en V bordeaux et une microskirt fleurie sous un éclairage naturel
Grand-père aux cheveux gris et femme avec queue de cheval haute aux cheveux gris debout dans une piscine turquoise avec un chien blanc et un kangourou près de murs roses
Architecture moderne sombre et atmosphérique avec structures en béton étagées illuminées par une lueur orange chaude la nuit.
Un paysage nocturne mystique présentant des ruines de pierre anciennes avec des marches, une pleine lune lumineuse se couchant derrière des montagnes lointaines, une vallée fluviale sinueuse, des étoiles scintillantes et un ciel chaud et magique illuminé par un éclairage cinématographique.
Lincoln Continental noire photoréaliste avec vitres teintées foncées dans une rue humide de New York City durant le coucher du soleil à l'heure dorée, avec un pavé brillant et une atmosphère pluvieuse en style grain de film.
Un portrait de photographie de mode d'une femme aux cheveux courts platine, regardant par-dessus un encadrement de porte sombre, illuminée par un éclairage cinématographique bleu froid dans un style minimaliste.
Portrait en gros plan double exposition d'une femme avec brume et vagues océaniques se fondant avec son profil dans des couleurs cinématographiques atténuées
Gros plan d'une jeune femme aux yeux verts et taches de rousseur partiellement cachée derrière un buisson de fleurs violettes vibrantes et de feuilles vertes, une fleur couvrant un œil.
Une illustration photoréaliste de style aquarelle d'une femme africaine en tunique blanche et pantalon portant des lunettes de soleil, descendant des escaliers à l'intérieur d'un immense vaisseau spatial noir futuriste avec des éléments de design cyberpunk et post-apocalyptique sous un éclairage dramatique.

Images avec art traditionnel

Une femme garde romaine confiante portant une armure de combat en bronze finement détaillée, debout dans une rue historique en plein jour.
Peinture en lavis oriental représentant des cascades dramatiques dévalant des falaises montagneuses escarpées avec une atmosphère brumeuse et une calligraphie discrète
Un chat calico assis sereinement parmi des fleurs vives dans le style aquarelle japonais sous un grand soleil rouge avec des effets élégants à l'encre.
Gros plan d'une fille avec cheveux brillants et peau claire, les yeux fermés.
Fille anime aux longs cheveux blonds portant un uniforme scolaire japonais traditionnel avec un nœud bleu
Un tigre blanc et une fille en vêtements traditionnels sur un fond de montagne brumeuse. Image générée par IA utilisant stable diffusion.
Une scène dramatique avec un samouraï solitaire debout sur l'eau, faisant face à une pagode japonaise traditionnelle au loin sous un ciel orageux avec des nuages tourbillonnants et de la brume, générée avec Stable Diffusion.
Image générée par IA utilisant Stable Diffusion d'une belle femme vêtue d'une tenue traditionnelle chinoise avec des cheveux flottants, un vêtement ancien détaillé, et un arrière-plan oriental serein avec une pagode et un feuillage.