Girafe noir et blanc se tenant, contemplant un pissenlit gigantesque sur une colline enneigée sous un ciel venteux dispersant des graines de pissenlit en tons monochromatiques.

Prompts négatifs recommandés

big boobs, ((watermark)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Paramètres recommandés

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, DPM++ 2M beta, sgm_uniform, DDEIS, normal, simple, beta, dpmpp_3m_sde, dpmpp_3m_sde_gpu

steps

12 - 25

cfg

1.5 - 11

Conseils

Utilisez DPM++ 2/3M SDE avec les samplers Karras ou Exponential et 25+ étapes avec un CFG autour de 5-7 pour de meilleurs résultats SDXL.

Essayez DPM++ SDE Karras avec moins d'étapes (ex. 12) et un CFG plus élevé (8-11) pour des styles alternatifs.

Les samplers Euler Ancestral / Normal produisent des résultats moins détaillés qui peuvent être désirables avec le modèle Fv6 pour réduire le bruit.

Le CLIP Skip par défaut est 2, mais essayer 1 peut renforcer l’adhérence au prompt, et 3-4 peut améliorer la focalisation sur les concepts.

Pour les modèles Flux, les samplers comme DPM++ 2M beta ou sgm_uniform sont préférés.

Les réglages CFG influencent grandement la qualité de l’image ; un CFG plus faible (1.5-2.5) évite l'effet peau plastique sur les photos, tandis que les styles d’illustration peuvent nécessiter un CFG plus élevé (3-6+).

Un CFG ou un nombre d’étapes inapproprié provoque souvent des images floues ou déformées, et des ajustements peuvent être nécessaires selon le style.

Points forts de la version

Basé sur Fv4 avec une fusion avec certaines versions précédentes de mes modèles ainsi que BigLove_XL2 afin de pousser davantage le réalisme.

Le résultat est que Fv5 est ma version la plus photoréaliste à ce jour avec des images plus précises et subtiles par rapport à F4, mais à mesure que le réalisme est poussé plus loin, le modèle est de moins en moins capable de produire des images stylisées, notamment des illustrations : une nouvelle version de la série G arrive bientôt pour ces cas d'usage :)

Pour les réglages, DPM++ 2/3M SDE / Karras ou Exponential sont toujours un bon choix avec plus de 25 étapes et un CFG autour de 5-7. Mais DPM++ SDE / Karras avec moins d'étapes (ex. 12) et CFG plus élevé (8-11) mérite d'être essayé. Le CLIP SKIP par défaut de 2 est aussi un bon choix, mais utiliser 1 ou 3-4 vaut aussi la peine d'être essayé.

Sponsors du créateur

Si vous appréciez ma contribution à cette communauté, n'hésitez pas à m'offrir un café : plus je bois de caféine, plus je peux créer de modèles 😅

Si vous appréciez ma contribution à cette communauté, n'hésitez pas à m'offrir un café : plus je bois de caféine, plus je peux créer de modèles 😅

Galerie de comparaison ici : Fv6-Fv5 et comparaison d'illustrations NSFW entre Gv1-Cv6-Fv2.

Modèle SOTA actuel dans mon expérience :

  • Modèle de base SDXL : Gv4 est le modèle le plus équilibré permettant des images réalistes et stylisées NSFW et SFW. Meilleure esthétique que Fv6 mais moins photoréaliste.

  • Modèle photoréaliste SDXL (SFW et NSFW) : Fv6 est idéal pour l'hyper-réalisme incluant des images NSFW réalistes mais manque surtout des capacités de stylisation de Gv4.

  • Illustration SDXL : Gv4 (SFW et NSFW). Cv6 vaut toutefois toujours la peine d'être essayé si vous n'êtes pas intéressé par les images NSFW.

  • Modèle Flux : Flux1-A1

Paramètres de génération d'image pour les modèles SDXL

DPM++ 2/3M SDE / Karras ou Exponential sont toujours un bon choix avec plus de 25 étapes et un CFG autour de 5-7. Mais DPM++ SDE / Karras avec moins d'étapes (ex. 12) et un CFG plus élevé (8-11) mérite d'être essayé, tout comme Euler Ancestral / Normal pour un résultat moins détaillé qui peut aussi être intéressant avec un modèle comme Fv6 pour obtenir quelque chose de moins "bruyant".

Le CLIP Skip par défaut de 2 est aussi une bonne option, mais utiliser 1 ou 3-4 vaut aussi la peine d'être essayé : 1 pousse davantage vers le respect du prompt et 3-4 donnent parfois un meilleur résultat que le défaut, en se concentrant plus sur les "concepts".

Paramètres de génération d'image pour les modèles Flux

Mes réglages préférés sont DPM++ 2M / beta ou sgm_uniform ou DDEIS / normal pour le sampler / scheduler, beta donnant une image plus marquée et forte. Pour une image plus subtile, Euler / simple ou beta semble un bon choix.

Le CFG semble avoir un impact énorme sur l'image finale et être très sensible même à de petites variations.

  • Pour les photos, le CFG doit rester bas (1.5-2.5) pour éviter l'effet peau plastique.

  • Pour les arts plastiques et les illustrations, c'est plus compliqué car cela dépend du médium. Pour les styles "rugueux" (peinture, aquarelles, etc.), le CFG doit rester assez bas dans la plage 1.5-2.5, mais pour le style anime ou bande dessinée, le CFG doit souvent être poussé plus loin pour atteindre le style désiré (3-6 ou plus).

Si l'image est brouillonne/déformée ou floue, c'est souvent parce que le CFG/les étapes sont inappropriés pour cette image, mais il n'est pas toujours facile de savoir s'il faut augmenter ou diminuer le CFG/les étapes (du moins pour moi 😊).

Il y a sûrement beaucoup à apprendre concernant le comportement de Flux, qui est assez différent de SDXL, et il nous faudra nous adapter.

Flux de travail

Toutes mes images sont téléchargées avec des workflows ComfyUI intégrés, qui sont hélas incompatibles avec le traitement CivitAI et le prompt ne peut le plus souvent pas être récupéré. Vous pouvez cependant télécharger l'image PNG originale avec le workflow inclus en cliquant sur l'icône "DOWNLOAD" dans le visualiseur d'images.

Pourquoi j'essaie de publier principalement des images directement à partir de mon modèle avec peut-être un peu de Lora (le mien ou un amplificateur de détails), j'utilise également parfois Controlnet pour obtenir plus facilement des compositions plus détaillées : dans ce cas, l'image source n'est évidemment pas dans le workflow, mais je suppose que vous pouvez toujours utiliser l'image que je publie comme source si vous voulez faire une variation :)

Passé


À partir de la série E, les modèles évoluent parfois par fusion avec d'autres modèles (merci aux autres contributeurs !), mais surtout via l'entraînement sur mon propre jeu de données : un jeu de données modeste (~2000 images actuellement), mais j'essaie de compenser d'une certaine façon avec la qualité et l'originalité.

À partir de Fv1, j'ai inclus de nombreuses images synthétiques que j'ai créées en utilisant des versions précédentes : en jouant dur avec le prompt et en retouchant lorsque nécessaire le résultat dans Photoshop afin d'avoir un jeu de données contenant beaucoup d'images originales.


L'idée principale derrière ce modèle était de créer un outil polyvalent en fusionnant certains des meilleurs modèles existants qui correspondent à mes goûts personnels (photographie et art fantastique pour simplifier). Mes objectifs principaux étaient :

  1. Photoréalisme : La capacité à produire des images remarquablement réalistes de personnes et de objets/nature.

  2. Flexibilité : La capacité à créer des images très stylisées, permettant l'expression artistique à travers divers styles et combinaisons d'artistes. Je viens d'une génération plus ancienne et d'Europe, donc "style" ne signifie pas pour moi "kawaii japonais mignon avec des seins" ou "dessin animé DC Comics avec plein de super-héros et des blondes voluptueuses", mais plutôt un univers à la Frank Frazetta, Milo Manara, Boris Vallejo, H.R.Giger, Wojtek Siudmak et autres maîtres de l'art fantastique : il y a des seins bien sûr, mais le style est un peu différent :P

  3. Comme je n'aime pas être limité dans mon exploration du corps humain, l'idée est aussi d'avoir un modèle NSFW assez compétent. Cependant, en raison de la nature des images d'entraînement disponibles dans les jeux de données, le NSFW comporte souvent un fort biais vers les photos porno ou les animes porno japonais et impacte la flexibilité (typiquement dès que vous utilisez le mot "sexy" dans votre prompt, vous devez pondérer le style). Ce point n'est donc PAS la priorité pour le modèle de base, mais est poussé en avant dans le modèle NSFW.

Précédent
ICBINP XL - v4
Suivant
MonsterCoffeeBang! Mix - v1.1 Sans VAE

Détails du modèle

Type de modèle

Checkpoint

Modèle de base

SDXL 1.0

Version du modèle

Fv5

Hash du modèle

17b3e65f07

Discussion

Veuillez vous log in pour laisser un commentaire.

Images par The Araminta Experiment (SDXL+Flux) - Fv5

Girafe noir et blanc se tenant, contemplant un pissenlit gigantesque sur une colline enneigée sous un ciel venteux dispersant des graines de pissenlit en tons monochromatiques.

Images avec modèle de base

Scène photoréaliste de personnages morts-vivants comprenant des zombies et des squelettes marchant à travers un cimetière hanté éclairé par des citrouilles-lanternes lumineuses sous un ciel sombre et menaçant.

Images avec nsfw

Un portrait numérique détaillé d'une guerrière aux longs cheveux noirs, yeux rouges et taches de rousseur, tenant un katana sur son épaule sur fond bleu.
Une jeune femme posée portant une combinaison rouge vif avec un détail de col noir, assise élégamment sur une chaise en bois tapissée cramoisie, aux cheveux noirs raides et au visage détaillé.
Vue de profil d'une guerrière cyberpunk aux longs cheveux roses tressés, tatouages sur le bras, portant un gilet d'armure bleu sarcelle et tenant un katana, sur un fond industriel éclairé par des néons.
Illustration de style anime d'une fille aux cheveux blonds avec yeux bleus portant un bikini rouge, posant avec assurance à la plage avec des gouttes d'eau sur la peau et des vagues en arrière-plan.
Une peinture numérique détaillée d'une féroce guerrière aux longs cheveux rouges accroupie sur un piédestal en pierre dans un cimetière, tenant une épée dans son dos. Elle porte une armure sombre et une cape turquoise, éclairée par des éclairs mystiques dans le ciel nocturne.
Une jeune femme portant un chapeau de paille et une robe se tient avec son vélo sur un chemin de campagne entouré de fleurs sauvages, regardant le coucher du soleil sur un village et des collines ondulantes.
Portrait en gros plan d'une princesse guerrière viking avec un mohawk blanc, des yeux bleus, des bijoux complexes, des vêtements en fourrure et des tatouages, sur fond de ciel nocturne avec nébuleuse et étoiles.
Une femme steampunk aux cheveux tressés et lunettes sur la tête, avec un torse mécanique horloger transparent montrant engrenages et pistons visibles, posant avec confiance dans un paysage urbain mécanique.
Vue en gros plan d'une petite femme portant des lunettes de soleil et une veste en cuir, illuminée par des lumières au néon dans une ville futuriste nocturne au style synthwave rétro des années 1980.
Une femme cyborg cyberpunk avec des cornes rouges d’oni et des cheveux noirs, portant un masque noir et des bras mécaniques bleus, tenant un katana bleu lumineux dans un couloir futuriste sombre.

Images avec photorealiste

Silhouette d'un homme cybernétique avec des ailes et de longues jambes fines rempli d'un collage multimédia photoréaliste de paysages urbains et de bâtiments sous un éclairage cinématographique.
Image futuriste en noir et blanc présentant des lignes métalliques partant du haut, avec un feuillage teinté de rouge encadrant la scène et un diamant bleu pulsant au centre.
Image photoréaliste d'un robot femme de ménage allongé sur le sol forestier avec des feuillages mêlés à ses cheveux et parties robotiques, vêtue d'une robe de bonne blanche.
Supermodèle fantastique à la beauté éthérée portant une robe avant-gardiste colorée et vibrante, ornée de bijoux complexes, sur un fond multicolore vif tourbillonnant.
Jeune barista féminine debout derrière un comptoir de café rustique portant une chemise noire à boutons et un tablier noir, souriant doucement avec un maquillage naturel et les cheveux attachés.
Trois femmes portant des pulls et pantalons de style nautique debout ensemble sur le pont d'un yacht de luxe la nuit avec en arrière-plan l'océan des Caraïbes.
Scène photoréaliste d'une jeune femme japonaise en robe d'été colorée et fluide, marchant le long d'un sentier forestier entouré de méduses flottantes et lumineuses sous un éclairage naturel.
Une fille mignonne assise confortablement dans une bibliothèque cosy, étudiant à la lumière de bougie avec un éclairage d'ambiance chaleureux et un livre ouvert devant elle.
Une illustration vectorielle 2D détaillée d'une femme ornée de fleurs d'orchidée noire et de motifs floraux complexes de style baroque.
Gros plan d'un jeune homme avec une barbe blonde courte en pointe et des lunettes, à moitié éclairé par le soleil du matin, avec un chat tigré reposant sur son épaule.

Images avec réaliste

Portrait réaliste détaillé d'une jeune femme aux beaux yeux bleus, cheveux blancs ornés de fleurs et d'ornements dorés, mis en valeur par un éclairage latéral et une peau lumineuse.
L'Anneau Unique lumineux avec des runes dorées repose sur une carte fantastique détaillée de la Terre du Milieu, éclairé par un éclairage cinématographique dramatique et entouré d'ombres d'arbres miniatures.
Peinture à l'huile de style impressionniste d'une femme séduisante à la peau claire avec une coupe au carré noire moderne portant une robe sans manches en satin grenat avec une large ceinture noire, sur un fond chaud doré et texturé sombre avec un éclairage clair-obscur.
Un portrait réaliste et détaillé d'un homme blond tenant une grande émeraude magique avec des gravures en or, portant un gilet bleu orné de pierres vertes et de bijoux en or finement travaillés.
Illustration réaliste d'une fille aux cheveux blancs et aux yeux violets lumineux portant un crop top noir et une mini jupe bleu clair, assise parmi des fleurs roses sous un ciel nocturne avec un soleil éclatant.
Vue réaliste depuis le cockpit d'un vaisseau spatial montrant un voyageur spatial avec un casque pilotant le vaisseau avec des graphismes spatiaux à la vitesse de la lumière à l'extérieur et la Terre en arrière-plan.
Un paysage urbain cinématographique avec de hauts gratte-ciel illuminés sous un ciel orageux avec lumière volumétrique et brouillard, rendu dans une palette de couleurs néon.
Robot mecha blanc en armure détaillée avec yeux lumineux, portant une cape noire flottante, debout en extérieur au soleil intense avec un arrière-plan naturel flou.

Images avec femme

Peinture impressionniste d'une femme en jean denim et chemise à carreaux cueillant des pommes d'un arbre sous une lumière douce et nuageuse
Photographie en noir et blanc d'une femme en tenue formelle et chapeau à large bord debout sur une plateforme de glace flottante à côté d'une chaise moderne, réfléchie sur une eau calme sous un ciel couvert.
Une cyborg féminine debout dans une ruelle d'une ville dystopique éclairée au néon la nuit, avec des yeux rouges lumineux, portant une tenue biomécanique réfléchissante, entourée par la dégradation urbaine sous la pluie et les reflets humides du néon.
Une femme aux cheveux foncés avec un bandeau rouge portant une mini robe à carreaux rouge et blanc et des bottes de motard noires, assise sur un rebord en béton la nuit devant un mur urbain texturé avec des lumières de la ville en arrière-plan.
Une femme chinoise sereine aux longs cheveux noirs ornés de bijoux ornés et de vêtements traditionnels, yeux fermés paisiblement avec une créature mythique derrière elle.
Femme mince en robe rouge longue et moulante avec fente et franges, portant des gants noirs et des bas noirs, lunettes futuristes sur la tête et un bandeau à plumes, sur un fond bleu art déco.
Gros plan sur l'œil noisette d'une femme montrant des cils détaillés, une texture de peau lisse et un maquillage subtil.
Portrait d'une femme rousse aux yeux bleus saisissants, avec des taches de rousseur et de longs cheveux ondulés portant un chemisier vert.
Vue de dos d'une femme aux cheveux attachés en chignon portant une robe blanche épaules dénudées, se tenant contemplativement à côté d'une fenêtre avec une lumière chaleureuse entrant dans une pièce sombre.