The Araminta Experiment (SDXL+Flux) - Fv5
Prompts négatifs recommandés
big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb
Paramètres recommandés
samplers
steps
cfg
Conseils
Utilisez DPM++ 2/3M SDE avec les samplers Karras ou Exponential et 25+ étapes avec un CFG autour de 5-7 pour de meilleurs résultats SDXL.
Essayez DPM++ SDE Karras avec moins d'étapes (ex. 12) et un CFG plus élevé (8-11) pour des styles alternatifs.
Les samplers Euler Ancestral / Normal produisent des résultats moins détaillés qui peuvent être désirables avec le modèle Fv6 pour réduire le bruit.
Le CLIP Skip par défaut est 2, mais essayer 1 peut renforcer l’adhérence au prompt, et 3-4 peut améliorer la focalisation sur les concepts.
Pour les modèles Flux, les samplers comme DPM++ 2M beta ou sgm_uniform sont préférés.
Les réglages CFG influencent grandement la qualité de l’image ; un CFG plus faible (1.5-2.5) évite l'effet peau plastique sur les photos, tandis que les styles d’illustration peuvent nécessiter un CFG plus élevé (3-6+).
Un CFG ou un nombre d’étapes inapproprié provoque souvent des images floues ou déformées, et des ajustements peuvent être nécessaires selon le style.
Points forts de la version
Basé sur Fv4 avec une fusion avec certaines versions précédentes de mes modèles ainsi que BigLove_XL2 afin de pousser davantage le réalisme.
Le résultat est que Fv5 est ma version la plus photoréaliste à ce jour avec des images plus précises et subtiles par rapport à F4, mais à mesure que le réalisme est poussé plus loin, le modèle est de moins en moins capable de produire des images stylisées, notamment des illustrations : une nouvelle version de la série G arrive bientôt pour ces cas d'usage :)
Pour les réglages, DPM++ 2/3M SDE / Karras ou Exponential sont toujours un bon choix avec plus de 25 étapes et un CFG autour de 5-7. Mais DPM++ SDE / Karras avec moins d'étapes (ex. 12) et CFG plus élevé (8-11) mérite d'être essayé. Le CLIP SKIP par défaut de 2 est aussi un bon choix, mais utiliser 1 ou 3-4 vaut aussi la peine d'être essayé.
Sponsors du créateur
Si vous appréciez ma contribution à cette communauté, n'hésitez pas à m'offrir un café : plus je bois de caféine, plus je peux créer de modèles 😅
Si vous appréciez ma contribution à cette communauté, n'hésitez pas à m'offrir un café : plus je bois de caféine, plus je peux créer de modèles 😅
Galerie de comparaison ici : Fv6-Fv5 et comparaison d'illustrations NSFW entre Gv1-Cv6-Fv2.

Modèle SOTA actuel dans mon expérience :
Modèle de base SDXL : Gv4 est le modèle le plus équilibré permettant des images réalistes et stylisées NSFW et SFW. Meilleure esthétique que Fv6 mais moins photoréaliste.
Modèle photoréaliste SDXL (SFW et NSFW) : Fv6 est idéal pour l'hyper-réalisme incluant des images NSFW réalistes mais manque surtout des capacités de stylisation de Gv4.
Illustration SDXL : Gv4 (SFW et NSFW). Cv6 vaut toutefois toujours la peine d'être essayé si vous n'êtes pas intéressé par les images NSFW.
Modèle Flux : Flux1-A1
Paramètres de génération d'image pour les modèles SDXL
DPM++ 2/3M SDE / Karras ou Exponential sont toujours un bon choix avec plus de 25 étapes et un CFG autour de 5-7. Mais DPM++ SDE / Karras avec moins d'étapes (ex. 12) et un CFG plus élevé (8-11) mérite d'être essayé, tout comme Euler Ancestral / Normal pour un résultat moins détaillé qui peut aussi être intéressant avec un modèle comme Fv6 pour obtenir quelque chose de moins "bruyant".
Le CLIP Skip par défaut de 2 est aussi une bonne option, mais utiliser 1 ou 3-4 vaut aussi la peine d'être essayé : 1 pousse davantage vers le respect du prompt et 3-4 donnent parfois un meilleur résultat que le défaut, en se concentrant plus sur les "concepts".
Paramètres de génération d'image pour les modèles Flux
Mes réglages préférés sont DPM++ 2M / beta ou sgm_uniform ou DDEIS / normal pour le sampler / scheduler, beta donnant une image plus marquée et forte. Pour une image plus subtile, Euler / simple ou beta semble un bon choix.
Le CFG semble avoir un impact énorme sur l'image finale et être très sensible même à de petites variations.
Pour les photos, le CFG doit rester bas (1.5-2.5) pour éviter l'effet peau plastique.
Pour les arts plastiques et les illustrations, c'est plus compliqué car cela dépend du médium. Pour les styles "rugueux" (peinture, aquarelles, etc.), le CFG doit rester assez bas dans la plage 1.5-2.5, mais pour le style anime ou bande dessinée, le CFG doit souvent être poussé plus loin pour atteindre le style désiré (3-6 ou plus).
Si l'image est brouillonne/déformée ou floue, c'est souvent parce que le CFG/les étapes sont inappropriés pour cette image, mais il n'est pas toujours facile de savoir s'il faut augmenter ou diminuer le CFG/les étapes (du moins pour moi 😊).
Il y a sûrement beaucoup à apprendre concernant le comportement de Flux, qui est assez différent de SDXL, et il nous faudra nous adapter.
Flux de travail
Toutes mes images sont téléchargées avec des workflows ComfyUI intégrés, qui sont hélas incompatibles avec le traitement CivitAI et le prompt ne peut le plus souvent pas être récupéré. Vous pouvez cependant télécharger l'image PNG originale avec le workflow inclus en cliquant sur l'icône "DOWNLOAD" dans le visualiseur d'images.
Pourquoi j'essaie de publier principalement des images directement à partir de mon modèle avec peut-être un peu de Lora (le mien ou un amplificateur de détails), j'utilise également parfois Controlnet pour obtenir plus facilement des compositions plus détaillées : dans ce cas, l'image source n'est évidemment pas dans le workflow, mais je suppose que vous pouvez toujours utiliser l'image que je publie comme source si vous voulez faire une variation :)
Passé
À partir de la série E, les modèles évoluent parfois par fusion avec d'autres modèles (merci aux autres contributeurs !), mais surtout via l'entraînement sur mon propre jeu de données : un jeu de données modeste (~2000 images actuellement), mais j'essaie de compenser d'une certaine façon avec la qualité et l'originalité.
À partir de Fv1, j'ai inclus de nombreuses images synthétiques que j'ai créées en utilisant des versions précédentes : en jouant dur avec le prompt et en retouchant lorsque nécessaire le résultat dans Photoshop afin d'avoir un jeu de données contenant beaucoup d'images originales.
L'idée principale derrière ce modèle était de créer un outil polyvalent en fusionnant certains des meilleurs modèles existants qui correspondent à mes goûts personnels (photographie et art fantastique pour simplifier). Mes objectifs principaux étaient :
Photoréalisme : La capacité à produire des images remarquablement réalistes de personnes et de objets/nature.
Flexibilité : La capacité à créer des images très stylisées, permettant l'expression artistique à travers divers styles et combinaisons d'artistes. Je viens d'une génération plus ancienne et d'Europe, donc "style" ne signifie pas pour moi "kawaii japonais mignon avec des seins" ou "dessin animé DC Comics avec plein de super-héros et des blondes voluptueuses", mais plutôt un univers à la Frank Frazetta, Milo Manara, Boris Vallejo, H.R.Giger, Wojtek Siudmak et autres maîtres de l'art fantastique : il y a des seins bien sûr, mais le style est un peu différent :P
Comme je n'aime pas être limité dans mon exploration du corps humain, l'idée est aussi d'avoir un modèle NSFW assez compétent. Cependant, en raison de la nature des images d'entraînement disponibles dans les jeux de données, le NSFW comporte souvent un fort biais vers les photos porno ou les animes porno japonais et impacte la flexibilité (typiquement dès que vous utilisez le mot "sexy" dans votre prompt, vous devez pondérer le style). Ce point n'est donc PAS la priorité pour le modèle de base, mais est poussé en avant dans le modèle NSFW.
Détails du modèle
Type de modèle
Modèle de base
Version du modèle
Hash du modèle
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.
