UltraReal Fine-Tune - v4
Mots-clés et tags associés
Prompts recommandés
d1g1cam, amateur photo, low-lit, Low-resolution photo, shot on a mobile phone
Paramètres recommandés
samplers
steps
cfg
Conseils
Utilisez les échantillonneurs DPM++ 2M pour des sorties fluides et cohérentes.
Visez 30 à 50 étapes pour capturer les détails fins sans sur-traiter.
Beta Scheduler reste le meilleur choix pour ce checkpoint.
Utilisez des prompts complexes avec des phrases claires séparées par des virgules ; restez concis et descriptif.
Réduire le CFG de 0,1 ou 0,2 peut parfois améliorer les détails mais peut augmenter le temps de génération.
Évitez d’utiliser UltraRealPhoto LoRA avec ce checkpoint pour prévenir les images surtraitées ; préférez Realism Amplifier.
L’usage du haute résolution dans les prompts peut aider à éviter les artefacts de basse résolution.
Points forts de la version
Esthétique augmentée, anatomie légèrement diminuée
V4
Voici ce qu’il y a de nouveau dans cette version : j’ai augmenté le niveau esthétique, ajouté plus de diversité dans les âges et amélioré la gestion des traits asiatiques. Mais - car il y a toujours un mais - j’ai remarqué que les mains sont un peu plus déformées. Eh bien, on ne peut pas tout gagner.
Je recommande fortement d’associer ce modèle à mes LoRAs, comme le realism amplifier, 2000s analog core, et d’autres, car ce checkpoint fonctionne mieux comme base pour des LoRAs stylisées. Il est possible qu’une autre version sorte (car, soyons réalistes, j’ai un peu bâclé v3 et v4), mais pour l’instant, je me concentre sur l’affinage de Flex.Alpha.
Versions disponibles cette fois : bf16, fp8, q8_0 - pruned fp16 name et q4_k_m - pruned fp8 name
P.S : Ne pas utiliser mon UltraRealPhoto LoRA avec ce checkpoint - il a un impact majeur sur le style, rendant l’image trop travaillée. Si vous utilisez UltraReal Fine-Tune, préférezRealism Amplifier pour de meilleurs résultats. UltraRealPhoto LoRa a été créé pour corriger les ombres, la lumière et les visages médiocres, mais tout cela est déjà intégré dans le checkpoint, vous pouvez juste ajouter l’amplificateur pour un réalisme amélioré.
Mise à jour V3 (Expérimentale)
Cette version marque une avancée, bien qu’elle soit encore en cours de développement. Je me suis concentré sur plusieurs aspects clés comme les nus, les pieds et l’anatomie du bas du corps. Les résultats sont meilleurs qu’avant, mais pas encore au niveau visé. Cela dit, cette version apporte des améliorations notables en qualité et texture, offrant des rendus plus détaillés et affinés comparés aux versions précédentes.
Paramètres recommandés :
CFG Scale : 3 (au lieu de 2.5 utilisé dans les versions précédentes)
Steps : 50 (aide à la stabilité, bien qu’il subsiste une légère instabilité dans les mains et les doigts)
CFG 0,9 vs. 1,0 : Une diminution de CFG à 0,1 ou même 0,2 peut parfois améliorer certains détails (peut ne pas améliorer, donc n’hésitez pas à expérimenter), bien que cela allonge le temps de génération.
Concernant les nus : ils ne fonctionnent pas encore comme prévu, mais je travaille activement sur ce point et compte résoudre cela dans la prochaine version.
La bonne nouvelle est que j’ai déjà préparé les ensembles de données pour V3.5, que je vise à sortir beaucoup plus rapidement qu’entre V2 et V3. Avec plus d’expérience et les retours de cette version, je suis confiant que la prochaine mise à jour apportera des améliorations significatives.
Comme toujours, j’apprécie énormément votre soutien et vos retours — ils sont précieux pour continuer à affiner ce projet ❤️
P.S. : Je trouve que plus je peaufine Flux, plus il décline dans certains domaines. Je songe aussi à essayer d’affiner Flex Alpha (ce projet semble très prometteur).
Quoi de neuf en v2.0 ?
Anatomie améliorée : Les mains, pieds et poses ont été grandement améliorés, offrant des résultats plus naturels et précis. Fini les membres trop déformés !
Textures et qualité améliorées : Détails de peau améliorés, textures plus riches, et résultats plus nets dans l’ensemble. Les images floues surviennent encore parfois, mais beaucoup moins fréquemment que dans la version précédente ou avec les LoRAs seules.
Rendu du texte amélioré : Des efforts ont été faits pour améliorer la génération de texte dans les images, nettement mieux qu’avant. Toutefois, des artefacts peuvent encore survenir et des symboles étranges peuvent parfois apparaître à la place de mots lisibles. C’est toujours en cours d’amélioration.
Dataset étendu : Un dataset plus large et plus diversifié (1800 images) offre un meilleur équilibre entre styles, éclairages et compositions.
Variations de checkpoint ajoutées
Pour assurer la compatibilité avec différents workflows, j’ai inclus plusieurs variations de checkpoint :
BF16
FP8
Quant 8 (Q8)
Quant 4 (Q4)
NF4
D’après mes tests, Quant 8 (Q8) offre une qualité légèrement supérieure à FP8, offrant plus de détails tout en maintenant des exigences de ressources raisonnables, mais les autres versions fonctionnent bien aussi. Choisissez celle qui convient le mieux à votre configuration.
Limites connues
Capacités NSFW : Toujours un point faible dans cette version. Cependant, un léger affinage ciblé sur le contenu NSFW est déjà en cours.
Rendu du texte : Bien que la génération de texte soit meilleure, des artefacts occasionnels comme des symboles étranges ou des mots incomplets peuvent encore apparaître. Mais l’utilisation de t5xxl fp16 au lieu de fp8 aide beaucoup pour le texte.
Conseils pour des résultats optimaux
Échantillonneur : Utilisez les échantillonneurs DPM++ 2M pour des sorties fluides et cohérentes.
Steps : Visez 30 à 50 étapes pour capturer les détails fins sans sur-traitement.
Scheduler : Beta Scheduler reste le meilleur choix pour ce checkpoint.
Conseils de promptLe meilleur style de prompt implique des prompts complexes avec des phrases claires, séparées par des virgules. Bien qu’il soit possible d’être créatif avec des prompts narratifs, les descriptions inutiles comme « cette merde a ajouté plus de vintage à son style » ne vont pas améliorer les résultats. Restez concis et descriptif, en vous concentrant sur les détails visuels essentiels pour une meilleure sortie.
Plans futurs
Je suis engagé à continuer le développement de cet affinage. La prochaine mise à jour se concentrera probablement sur :
Élargir les capacités NSFW
Améliorer les cas spécifiques comme les poses dynamiques et les scénarios d’éclairage
Améliorer le rendu du texte pour des résultats plus nets et précis
P.S : Si vous n’obtenez toujours pas un effet réaliste, essayez d’ajouter mon lora ultrareal, il m’aide généralement beaucoup
Ultra-Realistic Flux Fine-Tune v1
Ceci est ma première expérience d’affinage d’un checkpoint, construit sur les bases de ma UltraReal LoRA et étendu avec un dataset plus large. Le but ? Pousser le réalisme à un niveau supérieur, en trouvant un équilibre entre esthétique amateur et visuels professionnels de haute qualité.
Bien que ce soit seulement la première version et que je voie encore place à amélioration – les résultats sont bons, mais pas idéaux (les mains et pieds peuvent parfois être défectueux, mais la situation n’est pas critique, c’est toujours mieux que le Flux par défaut). Cet affinage ne vise pas seulement une qualité amateur ; il brille avec des images de qualité professionnelle, offrant des détails exceptionnels, des ombres réalistes et un éclairage soigné. C’est un modèle polyvalent conçu pour débloquer une gamme plus large de possibilités de génération d’images réalistes.
C’est encore un travail en cours, et je le partage pour recueillir des retours et voir comment les autres l’utilisent de façon créative. Si vous le testez, j’adorerais avoir vos avis ou voir vos résultats !
J’ai aussi uploadé les deux versions : fp16 (dans ComfyUI il est préférable d’utiliser avec e5m2) ainsi que fp8 et Q4_0
🌟 Quoi de neuf dans cet affinage ?
Dataset étendu : Presque le double de la taille du dataset original de la LoRA, couvrant une large gamme de styles, d’éclairages et de compositions.
Réalisme amélioré : Détails plus nets, textures plus riches et éclairage plus naturel, comblant le fossé entre image générée par IA et réalité.
Polyvalence : Des clichés amateurs décontractés aux rendus cinématographiques de qualité professionnelle, cet affinage s’adapte à divers besoins créatifs.
Anatomie améliorée : Mains, membres et poses plus naturels comparés au modèle de base Flux.
💡 Conseils pour de meilleurs résultats
Utilisez les échantillonneurs DPM++ 2M pour des sorties fluides et cohérentes.
Visez 30–50 étapes pour des détails fins sans exagération.
Sélectionnez le Beta Scheduler pour une performance de rendu optimale.
⚡ Pourquoi affiner ?
Cet affinage a été conçu pour dépasser certaines limites du modèle Flux par défaut. Il améliore sa capacité à gérer des scènes complexes tout en maintenant une qualité constante sur divers prompts. L’objectif est simple : rendre la génération d’images ultra-réalistes accessible, fiable et visuellement impressionnante, sans nécessiter d’ajustements interminables.
P.S : je prévois d’entraîner davantage ce modèle pour créer le checkpoint ultime avec la meilleure anatomie et réalisme. Cette version n’est pas très bonne pour le contenu NSFW (cela sera corrigé dans la prochaine version).
P.S.S : pour l’instant, il est possible de générer aléatoirement une image basse résolution (je ne sais pas exactement ce qui déclenche cela, mais je chercherai des solutions). Il semble que l’utilisation du haute résolution dans le prompt aide.
Détails du modèle
Type de modèle
Modèle de base
Version du modèle
Hash du modèle
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.


