Colossus Project Flux - v10_Behemoth_AIO_FP16
Mots-clés et tags associés
Prompts recommandés
photography of a young woman as an (goth) with (razor cut haircut), a sports car, soft lighting, spray painted with a intricate comic style robot theme and "COLOSSUS X" cyberpunk theme, projection lighting, its night and its raining, biopunk, the road is reflecting shot on Pentax K-1 Mark II with Pentax FA 43mm f-1.9 Limited, Neutral color palette heterochromia (blue and brown) Mixed race, shot on Pentax K-1 Mark II with Pentax FA 43mm f-1.9 Limited, photo by Tami Bone
Prompts négatifs recommandés
blurry
blurry, low res
ParamÚtres recommandés
samplers
steps
cfg
resolution
vae
Conseils
Utilisez le terme négatif 'blurry' pour améliorer la qualité de l'image.
Pour un réalisme optimal, utilisez un guidance cfg entre 1.5 et 3, avec 1.8 comme bon équilibre pour les images réalistes.
Les sampleurs préférés incluent Euler, Heun, DPM++ 2M, deis et DDIM, avec le scheduler Simple qui fonctionne bien.
Pour certains checkpoints, il est nécessaire de désactiver le scale Flux guidance et de se fier uniquement au scale cfg.
Utilisez les modÚles tout-en-un pour faciliter l'utilisation car ils ont Clip_L, T5xxl et VAE intégrés.
Pour l'installation et le workflow, reportez-vous aux guides officiels sur civitai.com dont les liens sont dans la description.
Deux versions quantifiées existent : FP4 pour les GPU Nvidia 50xx, int4 pour les GPU 40xx et inférieurs (au minimum un GPU série 20xx requis).
La quantification SVDQ Nunchaku réduit drastiquement la taille du modÚle tout en accélérant la génération avec un léger compromis sur la qualité.
Points forts de la version
Cette version est encore expĂ©rimentale. Lâobjectif principal Ă©tait dâobtenir des rĂ©sultats plus rĂ©alistes. Jâai aussi rĂ©ussi Ă rĂ©duire quelques "Lignes Flux". Cette version est basĂ©e sur Colossus Project V5.0_Behemoth, V9.0 et un autre projet que jâappelle "Ouroborus Project"
La version FP16 est trĂšs stable. Je publierai bientĂŽt une version FP8. Cette version est aussi trĂšs bonne mais moins stable...
Je vous laisse lâexpĂ©rimenter... Dites-moi ce que vous pensez de cette version.
Amusez-vous bien à créer :-)
Sponsors du créateur
Si vous aimez ce modÚle et souhaitez soutenir le travail du créateur, pensez à faire un don via Ko-fi.
Découvrez la quantification réalisée par Muyang Li de Nunchakutech pour les versions FP4/int4.
Les guides d'installation et workflow sont disponibles sur civitai.com/articles/17313 et civitai.com/articles/17358.
Visitez le dépÎt de conversion et quantification : GitHub ComfyUI-nunchaku.
Au plus profond d'une montagne dort un géant endormi, capable soit d'aider l'humanité soit de créer la destruction...
Un Colosse se réveille...
AprÚs ma série SDXL, c'est le temps de la série FLUX de ce projet... Cette fois, j'ai entraßné cette chose de zéro. Pour l'entraßnement, j'ai utilisé mes propres images. Je les ai créées avec mon modÚle schnell Flux DemonFlux/Colossus Project schnell + mon SDXL Colossus Project 12 comme affineur.
Ce checkpoint SD Flux est capable de produire presque tout... Colossus est trĂšs performant pour crĂ©er des images extrĂȘmement rĂ©alistes, anime et artistiques.
Si vous aimez, n'hésitez pas à me donner un retour. Aussi, si vous souhaitez me soutenir, vous pouvez le faire ici. J'ai dépensé pas mal d'argent pour construire un ordinateur capable de réellement entraßner des modÚles Flux... L'entraßnement et les tests demandent aussi beaucoup de temps et d'électricité...
https://ko-fi.com/afroman4peace
Version V12 "Hephaistos"
Publier ce checkpoint me rend Ă la fois heureux et triste... V12 sera le dernier checkpoint de cette sĂ©rie... La principale raison est la lĂ©gislation europĂ©enne Ă venir sur l'IA... Une autre raison est la licence de Flux .1 DEV lui-mĂȘme. Merci Ă tous pour votre soutien ! J'ai investi beaucoup de temps dans ce projet durant l'annĂ©e derniĂšre. Il est maintenant temps de passer Ă un autre projet.
Quoi qu'il en soit... je terminerai cette série en beauté...
V12 est construit sur V10B "BOB" mais intÚgre essentiellement les meilleures parties de cette série fusionnées dans ce seul checkpoint. (C'est le résultat d'une nouvelle méthode de fusion qui a pris environ 1h30 et utilisé toute ma RAM de 128 Go). J'ai également amélioré les textures du visage et de la peau par rapport à V10. Les yeux sont beaucoup plus réalistes et plus "vivants" qu'avant.
Testez-le vous-mĂȘme et donnez-moi votre avis sur V12. GrĂące Ă ma connexion internet lente, je vais d'abord mettre en ligne le FP8_UNET. Ensuite, la version FP8 "tout en un" puis les versions FP16_unet et FP16_BEHEMOTH. Je vais aussi essayer de le convertir en int4 et fp4 (souhaitez-moi bonne chance Ă ce sujet).
Comme toujours, donnez-moi du feedback sur V12...
Version V12 "Behemoth" (AIO)
Ce modÚle "tout en un" est le meilleur de ma série V12... et évidemment le plus volumineux :-)
Le Behemoth intÚgre un T5xxl et Clip_l personnalisés intégrés dans le modÚle. Si vous privilégiez la qualité à la quantité, c'est le checkpoint qu'il vous faut !
Version V12 FP4/int4
Merci à Muyang Li de Nunchakutech qui a réalisé la quantification de V12. https://huggingface.co/nunchaku-tech et leur incroyable nunchaku !
Cette version est vraiment époustouflante. Allier qualité et rapidité comme jamais auparavant.
ATTENTION !
Il existe deux versions FP4 et int4. FP4 est uniquement pour les cartes graphiques Nvidia 50xx ! Tandis que int4 fonctionne avec les 40xx et inférieures. (vous devez avoir au minimum une carte graphique série 20xx)
Vous pouvez aussi télécharger les deux versions directement ici : https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus
GUIDE D'INSTALLATION et WORKFLOW
Voici un guide d'installation rapide et un workflow en cours.
https://civitai.com/articles/17313
GUIDE DĂTAILLĂ pour le workflow
https://civitai.com/articles/17358
Je travaille encore sur mes nouveaux workflows pour Nunchaku... donc le workflow suivant est encore trÚs WIP (travail en cours) J'ajouterai un article détaillé ce weekend.
Version V12 FP16_B_variant
GrĂące Ă une petite erreur que j'ai faite tard dans la nuit (2h00 du matin), j'ai renommĂ© et uploadĂ© le mauvais checkpoint. C'est un checkpoint trĂšs expĂ©rimental jamais destinĂ© Ă ĂȘtre publiĂ©. Il n'est pas beaucoup testĂ© mais a trĂšs bien fonctionnĂ© lors de la prĂ©sentation. Il pourrait ĂȘtre mieux que la version standard.
Il tend à privilégier les visages asiatiques... C'est parce que je voulais tester quelque chose à mélanger dans un projet annexe sur lequel je travaille encore. Dites-moi votre expérience avec ce checkpoint :-)
Version V12 AIO FP8
Cette version est une version tout en un de V12. Cela signifie que tous les clips sont intĂ©grĂ©s dedans. Elle donnera la mĂȘme sortie que le FP8_unet avec mon clip_l personnalisĂ©.
Version V12 GGUF Q5_1
Cette version était une demande. La qualité est correcte...
Version V10B "BOB"
C'est une version alternative de V10. Je l'ai créée pour améliorer la version FP8 de V10. En général, la version FP8 est plus précise et les couleurs sont meilleures. Malheureusement je n'ai pas beaucoup de temps derniÚrement... (la vie réelle passe avant). C'est pour cela que cela a pris du temps... Dites-moi si vous préférez cette version. J'ai aussi une version FP16 "BOB". Selon les retours, je pourrais envisager de publier une version int4.
WORKFLOW :
Voici le workflow pour V12 et V10 : https://civitai.com/articles/17163
Version V10_int4_SVDQ "Nunchaku"
Tout d'abord, je tiens Ă remercier theunlikely https://huggingface.co/theunlikely qui a converti le FP16_Unet en int4_SVDQ. Visitez sa page et laissez un like.
Cette version est plus ou moins Ă©quivalente Ă la version FP8. MĂȘme en mode normal dans mon workflow, cette version est environ 2X-3X plus rapide que le modĂšle standard. Avec le "mode rapide" du workflow, je peux gĂ©nĂ©rer une image de 2MP en environ 19 secondes avec ma 3090ti.
Qu'est-ce que SVDQ "Nunchaku" ?
Cette nouvelle mĂ©thode de quantification permet de rĂ©duire les modĂšles Flux (dans ce cas un modĂšle FP16 natif) de 24 Go Ă environ 6,7 Go. Mais ce nâest pas tout : vous pouvez gĂ©nĂ©rer des images plus rapidement que jamais sans perdre trop en qualitĂ©. Bien sĂ»r, vous verrez une petite diffĂ©rence avec mon 32GB_Behemoth, mais pour celui-ci il vous faudrait beaucoup plus de VRAM/RAM pour mĂȘme le faire fonctionner.
Pour plus dâinformations, visitez : https://github.com/mit-han-lab/ComfyUI-nunchaku?tab=readme-ov-file
Installation : veuillez consulter mon guide workflow/installation : https://civitai.com/articles/15610
Version V10 "Behemoth" (FP16_AIO)
Cette version est encore expĂ©rimentale. Lâobjectif principal Ă©tait dâobtenir des rĂ©sultats plus rĂ©alistes. Jâai aussi rĂ©ussi Ă rĂ©duire quelques "Lignes Flux". Cette base est prise de Colossus Project V5.0_Behemoth, V9.0 et dâun autre projet que jâappelle "Ouroborus Project"
La version FP16 est trĂšs stable. Je publierai bientĂŽt une version FP8. Celle-ci est aussi trĂšs bonne mais moins stable...
Je vous laisse lâexpĂ©rimenter... Dites-moi ce que vous pensez de cette version.
Amusez-vous bien à créer :-)
Version V9.0 :
Je dois beaucoup expliquer⊠Pourquoi ce numéro V9.0 ?
Jâai rĂ©cemment dĂ©mĂ©nagĂ© dans un nouvel appartement et Ă cause d'erreurs de mon fournisseur internet, je nâavais pas de connexion rĂ©elle... Donc pendant le dĂ©mĂ©nagement, jâai laissĂ© mon ordinateur allumĂ©. Le rĂ©sultat est que jâai créé beaucoup de checkpoints (la plupart corrompus). Jâai toutefois de trĂšs bonnes versions V8 que je pourrais aussi publierâŠ
Quâest-ce qui a changĂ© ?
Jâai entraĂźnĂ© de nouveaux visages et textures de peau dans le modĂšle en prenant essentiellement les meilleurs rĂ©sultats de V5.0. Le modĂšle a aussi Ă©tĂ© entraĂźnĂ© pour les pieds/jambes pour une meilleure anatomie. Les versions V5.0 avaient parfois des tĂȘtes ou pieds coupĂ©s... je pense avoir rĂ©ussi Ă rĂ©soudre certains de ces problĂšmes...
En plus, je lâai entraĂźnĂ© avec plus de mes propres images de paysages... Et oui, tout ça pendant le dĂ©mĂ©nagement... Le temps total dâentraĂźnement fut dâenviron 2 semaines de calcul, ce qui nâest pas donnĂ©... (chaque heure me coĂ»te environ 0,25 ⏠en Ă©lectricitĂ©)
JâespĂšre que cette version vous plaira... Si vous voulez me soutenir : postez des belles images ou laissez un pourboire via Buzz ou Ko-fi...
Dites-moi ce que vous en pensez :-)
Version 5.0 :
V5.0 est basĂ©e sur V4.2 et V4.4 (qui sera bientĂŽt publiĂ©e). Elle bĂ©nĂ©ficie dâun entraĂźnement supplĂ©mentaire sur les dĂ©tails de la peau et sur lâanatomie en gĂ©nĂ©ral, ce qui a surtout corrigĂ© des parties comme les mains et les tĂ©tons. Les dĂ©tails du visage sont beaucoup meilleurs. Jâai aussi essayĂ© de corriger des petites lignes de flux...
En gĂ©nĂ©ral, cette version est plus rĂ©aliste que V4.2 et offre de meilleurs petits dĂ©tails... Comme la version 4.2, câest un modĂšle hybride dĂ©-distillĂ©. Vous pouvez lâutiliser avec les mĂȘmes rĂ©glages que V4.2.
Voici aussi un nouveau workflow Ă essayer : https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50
Dites-moi ce que vous pensez de cette version comparée à 4.2 ou V2.1...
Version 4.4 "Research" :
Jâai ajoutĂ© cette version pour complĂ©tude... Elle est lĂ©gĂšrement plus rĂ©aliste que V4.2 et la base de la version 5.0. Vous pouvez lâessayer si vous voulez. Elle est compatible avec le workflow pour V5.0 et V4.2...
Version 4.2 :
Cette version est essentiellement un dĂ©veloppement du Demoncore Flux et du Colossus Project Flux. Lâobjectif Ă©tait dâobtenir un rĂ©sultat plus stable avec de meilleures textures de peau, de meilleures mains et plus de variĂ©tĂ© dans les visages. Je lâai donc entraĂźnĂ©e Ă partir dâun modĂšle hybride incluant partiellement Demoncore Flux. Jâai aussi amĂ©liorĂ© les tĂ©tons et un peu la partie NSFW. Dites-moi si vous prĂ©fĂ©rez V4.2 Ă la version 2.1 :-)
Pour les images de dĂ©monstration : jâai utilisĂ© uniquement des images natives avec rĂ©solution SDXL ou 2MP (par exemple 1216x1632). Ce modĂšle peut gĂ©rer des rĂ©solutions encore plus Ă©levĂ©es... Jâai testĂ© ce checkpoint jusquâĂ 2500x2500 mais recommande environ 2000x2000 max.
Pour les rĂ©glages, je conseille environ 30 Ă©tapes et un cfg de 2 Ă 2,5. Jâutilise majoritairement 2,2 Ă 2,3 dans mon workflow. Pour la dĂ©monstration, jâai utilisĂ© DPM++ 2M avec Simple scheduler.
Je publierai bientĂŽt d'autres versions mais je nâai pas beaucoup de temps avant NoĂ«l...
Réglages
Je vais bientĂŽt ajouter un workflow Comfy dĂ©diĂ©. Pour lâinstant, vous pouvez toujours tĂ©lĂ©charger et ouvrir les images de dĂ©monstration...
La version "tout en un" fonctionne aussi bien avec Forge...
En gĂ©nĂ©ral, les rĂ©glages sont les mĂȘmes que pour la version 2.1 (voir ci-dessous)
Optez pour 20-30 étapes avec environ 2,2 cfg...
Version 2.1_de-distilled_experimental (MERGE)
Cette version est totalement diffĂ©rente et fonctionne en rĂ©alitĂ© diffĂ©remment dâun modĂšle Flux normal !
Câest une fusion expĂ©rimentale entre ma version 2.0 et une version dĂ©-distillĂ©e https://huggingface.co/nyanko7/flux-dev-de-distill. Câest arrivĂ© un peu par accident mais les rĂ©sultats sont Ă©poustouflants. Vous obtiendrez des dĂ©tails surprenants. Elle suit aussi trĂšs bien les prompts... Donc la prochaine Ă©tape sera dâentraĂźner directement sur ce modĂšle dĂ©-distillĂ©. Jâai dĂ©jĂ fait quelques tests Lora avec. Câest trĂšs expĂ©rimental, merci de me signaler toute erreur non rĂ©pertoriĂ©e ci-dessous. Si vous avez de belles images, postez-les... et aussi les mauvaises, cela aidera Ă amĂ©liorer les choses :-). Essayez aussi la version 2.0 et dites-moi quel type de checkpoint vous convient le mieux.
!Attention !
Le workflow Flux normal ne fonctionne pas avec cette version. VOUS DEVEZ télécharger mon workflow pour cela !
Vous pouvez aussi trouver une autre solution vous-mĂȘme mais ne me blĂąmez pas pour les images mĂ©diocres. Câest un modĂšle trĂšs expĂ©rimental... voyez les inconvĂ©nients ci-dessous...
Avantages et inconvénients de ce checkpoint :
Ce checkpoint produit des dĂ©tails extrĂȘmes... Mais cela a un prix... Il est lent comparĂ© aux checkpoints Flux normaux. Lâavantage est que souvent vous nâaurez plus besoin de upscaling supplĂ©mentaire. Au lieu dâutiliser Flux Guidance, ce modĂšle utilise le scale cfg, ce qui signifie quâil ne fonctionnera pas avec les workflows standards.
Vous pouvez utiliser des prompts nĂ©gatifs ! Cela aide Ă retirer ce que vous ne voulez pas dans lâimage.
Parfois des artefacts peuvent apparaĂźtre... Vous pouvez rĂ©soudre cela par un lĂ©ger upscaling simple (je travaille sur ça). Voici un exemple... ce problĂšme nâarrive pas avec toutes les graines... MISE Ă JOUR : Ce nâest pas un problĂšme du modĂšle lui-mĂȘme, mais plutĂŽt du workflow... Je travaille Ă corriger cela. Si cela arrive, essayez de mettre le premier upscaling Ă 1.14 au lieu de 1.2.


Réglages et Workflow V2.1 :
Voici le workflow : https://civitai.com/articles/8419
RĂ©glages : contrairement au Flux normal, il nâa pas besoin de Flux Guidance scale. Utilisez le cfg Ă la place. Jâutilise majoritairement 3 cfg. Certaines images peuvent nĂ©cessiter un cfg plus faible.
Le plus important est dâĂ©teindre le flux guidance scale...
Sans ce workflow, jâai testĂ© Ă 30 Ă©tapes et 2-3 cfg. Cela peut aussi ĂȘtre utilisĂ© pour Forge. ExpĂ©rimentez.
Je recommande dâutiliser le mot "blurry" dans les nĂ©gatifs.
Sampleur et scheduler :
Vous pouvez choisir parmi plusieurs sampleurs fonctionnels :
Euler, Heun, DPM++2m, deis, DDIM fonctionnent trĂšs bien.
Jâutilise principalement "simple" comme scheduler.
Si vous trouvez de meilleurs réglages, dites-le-moi... :-)
Pour Forge, je recommande le modÚle AIO... voici un exemple de réglage pour Forge :

Version 2.0_dev_experimental
Voici une version expĂ©rimentale. Lâobjectif Ă©tait de crĂ©er un modĂšle plus cohĂ©rent et rapide. Jâai entraĂźnĂ© quelques Loras supplĂ©mentaires que jâai fusionnĂ©s dans les modĂšles rĂ©sultants dâune maniĂšre spĂ©ciale (fusion tensorielle). Il intĂšgre un T5xxl personnalisĂ© modifiĂ© avec "Attention Seeker". Pour gagner en rapiditĂ© et qualitĂ© supplĂ©mentaire, jâai fusionnĂ© le Hyper Flux lora de ByteDance. Cela a dĂ©calĂ© la zone de travail... Voici lâimage principale du titre...
16 étapes V 2.0
30 étapes V 1.0
Inconvénients :
PremiÚrement, cette version est un peu plus grosse que la précédente. DeuxiÚmement, je dois encore créer une version Unet seule. Je mettrai à jour quand ce sera fait...
Réglages et Workflow V2.0 :
Vous pouvez maintenant faire tourner le modĂšle avec moins dâĂ©tapes... 16 Ă©tapes Ă©quivalent Ă 30 Ă©tapes de lâancien modĂšle.
Je recommande tout de mĂȘme entre 20 et 30 Ă©tapes pour obtenir une meilleure qualitĂ© dans la majoritĂ© des cas.
Sampleur : je prĂ©fĂšre Euler avec Simple comme scheduler. Le guidance peut ĂȘtre rĂ©glĂ© entre 1.5 et 3 (nâhĂ©sitez pas Ă tester en dehors de cette plage). Le guidance Ă 1.8 fonctionne bien pour les images rĂ©alistes. Vous pouvez aussi essayer dâautres sampleurs. DPM++2M et Heun fonctionnent bien aussi.
Workflow 2.0 :
Jâai créé un nouveau workflow pour V2.0 et V1.0. Il inclut le nouveau Flux Prompt Generator. Jâai aussi activĂ© la deuxiĂšme Ă©tape dâupscaling. https://civitai.com/articles/7946
Forge :
Jâai testĂ© ce modĂšle avec Forge et cela a trĂšs bien fonctionnĂ©. Les images peuvent toutefois diffĂ©rer entre Comfy UI et Forge...
Version 1.0_dev_beta :
Câest ma premiĂšre version de la sĂ©rie. Merci de me donner du feedback et de poster des images. Cela mâaide Ă amĂ©liorer ce projet. Plusieurs versions sont disponibles. La meilleure en termes de qualitĂ© est la version FP16. Cependant, cette version est trĂšs lourde et nĂ©cessite une carte graphique puissante avec beaucoup de RAM. La version FP8 est un bon compromis entre qualitĂ© et performance. Si vous souhaitez une version GGUF, tĂ©lĂ©chargez la Q8_0. La version GGUF Q4_0/4.1 a Ă©tĂ© créée sur demande. Elle est lĂ©gĂšre mais avec une perte de qualitĂ©.
Il y a essentiellement deux types de mes modÚles : les modÚles "tout en un" qui nécessitent un seul fichier à télécharger. Ils contiennent Clip_l, T5xxl fp8 et VAE intégrés. (voir ci-dessous). Placez-les dans votre dossier checkpoints.
Les autres versions sont les UNET-ONLY. Vous devez charger chaque fichier séparément.
Dans tous les cas, vous devez télécharger mon Clip_L pour que cela fonctionne correctement.
Il est aussi important de choisir le bon clip T5xxl. Pour la version FP8, câest le clip fp8_e4m3fn t5xxl. Pour FP16, câest le clip FP16. Assurez-vous de sĂ©lectionner le type de poids par dĂ©faut. (ci-dessous une image dâexemple pour la version fp8)
Pour la version GGUF, il faut le chargeur GGUF !
Quelques informations connues pour lâinstant concernant V1.0 :
Câest juste la premiĂšre version de la sĂ©rie donc elle peut avoir du mal avec certains prompts ou styles comme lâart. La prochaine version recevra plus dâentraĂźnement. Dites-moi ce que le modĂšle ne peut pas faire...
Réglages et Workflow :
Jâai testĂ© avec environ 30 Ă©tapes, Euler et Simple comme scheduler. Le guidance peut ĂȘtre rĂ©glĂ© entre 1.5 et 3 (nâhĂ©sitez pas Ă tester en dehors de cette plage bien sĂ»r).
Le guidance à 1.8 fonctionne bien pour les images réalistes.
NâhĂ©sitez pas Ă expĂ©rimenter avec ces rĂ©glages... Si vous obtenez de bons rĂ©sultats, merci de les poster.
Jâai ajoutĂ© les images de dĂ©monstration comme donnĂ©es dâentraĂźnement... Le workflow est prĂ©vu pour Comfy. Voici le workflow Ă tĂ©lĂ©charger : https://civitai.com/articles/7946
ModĂšle "Tout en un" :

UNET_only :
Vous devez aussi télécharger le clip_L. C'est un fichier de 240 Mo.
GGUF : J'ai ajouté le workflow pour GGUF ici : https://civitai.com/articles/7946
Important :
Le modĂšle dev nâest pas destinĂ© Ă un usage commercial. Pour cela, je publierai le modĂšle "schnell" ailleurs. Il est plus destinĂ© Ă un usage personnel ou scientifique.
LICENCE :
https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md
Crédits :
theunlikely https://huggingface.co/theunlikel (merci encore)
Version 2.1/V4.2/5.0 : Flux_dev_de-distill from nyanko7
https://huggingface.co/nyanko7/flux-dev-de-distill
Depuis V2.0 : Hyper Lora de ByteDance https://huggingface.co/ByteDance/Hyper-SD
Black Forrest pour leur incroyable modĂšle Flux https://huggingface.co/black-forest-labs
Détails du modÚle
Type de modĂšle
ModĂšle de base
Version du modĂšle
Hash du modĂšle
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.












