The Araminta Experiment (SDXL+Flux) - Fv3
Prompts recommandés
(photography by Jimmy Nelson and Sally Mann:1.0), (anus gaping), eye contact, (petite-bodied African) girl with her ass spread apart, hairy asshole, rear view, beautiful out of focus background
Prompts négatifs recommandés
child, big boobs, ((watermark)), ((make-up)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb
Paramètres recommandés
samplers
steps
cfg
Conseils
Pour les modèles SDXL, utilisez 25+ étapes et un CFG autour de 5-7 avec des samplers comme DPM++ 2/3M SDE Karras ou Exponential.
Essayez DPM++ SDE Karras avec moins d'étapes (par ex. 12) et un CFG plus élevé (8-11) pour différents résultats.
Le sampler Euler Ancestral / Normal peut donner des résultats moins détaillés, utile avec Fv6 pour des images moins bruyantes.
Le CLIP Skip par défaut est 2 ; 1 augmente le respect du prompt, 3-4 améliore parfois la focalisation sur les concepts.
Le CFG du modèle Flux est sensible ; pour les photos, gardez le CFG bas (1.5-2.5) pour éviter l'effet peau plastique.
Pour les styles bruts dans Flux, gardez un CFG bas (1.5-2.5) ; pour le style anime/bande dessinée, un CFG plus élevé (3-6+) est recommandé.
Points forts de la version
Version F améliorée avec une représentation NSFW plus réaliste : meilleure compréhension des concepts et meilleure texture de la peau (voir images de comparaison)
Basé sur Fv2 avec la fusion de batchXLPHOTOREAL_v1 ainsi que quelques Loras entraînées personnellement.
Sponsors du créateur
Si vous appréciez ma contribution à cette communauté, n'hésitez pas à m'offrir un café : plus je bois de caféine, plus je peux créer de modèles 😅
Si vous appréciez ma contribution à cette communauté, n'hésitez pas à m'offrir un café : plus je bois de caféine, plus je peux créer de modèles 😅
Galerie de comparaison ici : Fv6-Fv5 et comparaison d'illustrations NSFW entre Gv1-Cv6-Fv2.

Modèle SOTA actuel dans mon expérience :
Modèle de base SDXL : Gv4 est le modèle le plus équilibré permettant des images réalistes et stylisées NSFW et SFW. Esthétique meilleure que Fv6 mais moins photoréaliste.
Modèle photoréaliste SDXL (SFW et NSFW) : Fv6 est le choix pour l'hyper-réalisme incluant des images réalistes NSFW mais il manque principalement les capacités de style de Gv4.
Illustration SDXL : Gv4 (SFW et NSFW). Cv6 vaut cependant toujours le coup d'essayer si vous n'êtes pas intéressé par les images NSFW.
Modèle Flux : Flux1-A1
Paramètres de génération d'image pour les modèles SDXL
DPM++ 2/3M SDE / Karras ou Exponential sont toujours un bon choix avec 25+ étapes et un CFG autour de 5-7. Mais DPM++ SDE / Karras avec moins d'étapes (par ex. 12) et un CFG plus élevé (8-11) vaut la peine d'être essayé, tout comme Euler Ancestral / Normal pour un résultat moins détaillé qui peut aussi être intéressant avec un modèle comme Fv6 pour obtenir quelque chose de moins "bruyant".
Le CLIP Skip par défaut de 2 est également un bon choix, mais utiliser 1 ou 3-4 vaut aussi la peine d'être essayé : 1 pousse plus vers le respect du prompt и 3-4 donnent parfois un meilleur résultat que le défaut en se concentrant davantage sur les "concepts".
Paramètres de génération d'image pour les modèles Flux
Mes paramètres préférés sont DPM++ 2M / beta ou sgm_uniform ou DDEIS / normal pour le sampler / scheduler, beta donnant une image plus audacieuse et forte. Pour une image plus subtile, Euler / simple ou beta semble un bon choix.
Le CFG semble avoir un impact énorme sur l'image finale et être très sensible même aux petites variations.
Pour les photos, le CFG doit rester bas (1.5-2.5) pour éviter un effet de peau plastique.
Pour les beaux-arts et illustrations, c'est plus compliqué car cela dépend du médium. Pour les styles "bruts" (peinture, aquarelle, etc.), le CFG doit rester assez bas dans la plage de 1.5-2.5, mais pour le style anime ou bande dessinée, le CFG doit souvent être poussé plus loin pour atteindre le style désiré (3-6 ou plus).
Si l'image est désordonnée/malfabriquée ou floue, c'est souvent parce que les CFG/étapes sont inappropriées pour cette image, mais il n'est pas toujours facile de savoir si le CFG/étapes doivent être augmentés ou diminués (du moins pour moi 😊).
Il y a certainement beaucoup à apprendre concernant le comportement de Flux qui est assez différent de SDXL et nous devrons nous adapter.
Flux de travail
Toutes mes images sont téléchargées avec le flux de travail ComfyUI intégré qui est malheureusement incompatible avec le traitement CivitAI et la plupart du temps le prompt ne peut pas être récupéré. Vous pouvez cependant télécharger l'image PNG originale avec le flux de travail inclus en cliquant sur l'icône "DOWNLOAD" dans le visionneur d'images.
Pourquoi j'essaie de publier principalement des images directement depuis mon modèle avec peut-être un peu de Lora (le mien ou un amplificateur de détails), j'utilise également parfois Controlnet pour obtenir plus facilement des compositions mieux détaillées : dans ce cas, l'image source n'est évidemment pas dans le flux de travail, mais je suppose que vous pouvez toujours utiliser l'image que je publie comme source si vous souhaitez faire une variation :)
Passé
À partir de la série E, les modèles évoluent parfois en fusionnant avec d'autres modèles (merci aux autres contributeurs !), mais principalement via un entraînement sur mon propre jeu de données : un jeu de données modeste (~2000 images actuellement), mais j'essaie de compenser par la qualité et l'originalité.
À partir de Fv1, j'ai inclus de nombreuses images synthétiques que j'ai créées en utilisant des versions précédentes : jouant dur avec le prompt et retouchant si nécessaire le résultat dans Photoshop afin d'avoir un jeu de données contenant beaucoup d'images originales.
L'idée centrale derrière ce modèle était de créer un outil polyvalent en fusionnant certains des meilleurs modèles existants qui correspondent à mon goût personnel (photographie et art fantastique pour faire simple). Mes objectifs principaux étaient :
Photoréalisme : La capacité à produire des images étonnamment réalistes de personnes et de objets/nature.
Flexibilité : La capacité à créer des images fortement stylisées, permettant une expression artistique à travers divers styles et combinaisons d’artistes. Je viens d'une génération plus ancienne et d'Europe, donc "style" ne signifie pas pour moi "kawaii japonais mignon avec des boobs" ou "dessin animé DC Comics avec plein de super-héros et de blondes voluptueuses" mais plutôt un univers à la Frank Frazetta, Milo Manara, Boris Vallejo, H.R.Giger, Wojtek Siudmak et autres maîtres de l'art fantastique : il y a bien sûr des boobs impliqués, mais le style est un peu différent :P
Comme je n'aime pas être limité dans mon exploration du corps humain, l'idée est aussi d'avoir un modèle NSFW assez capable. Cependant, en raison de la nature des images d'entraînement disponibles dans les jeux de données, le NSFW vient souvent avec un fort biais vers soit des photos pornographiques soit de l'anime pornographique japonais ce qui impacte la flexibilité (typiquement dès que vous utilisez le mot "sexy" dans votre prompt vous devez pondérer dans le style). Ce point n'est donc PAS la priorité pour le modèle de base mais est mis en avant dans le modèle NSFW.
Détails du modèle
Type de modèle
Modèle de base
Version du modèle
Hash du modèle
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.
