modèles/HelloWorld XL de LEOSAM - HelloWorld XL 5.0 GPT4V

HelloWorld XL de LEOSAM - HelloWorld XL 5.0 GPT4V

Camille Dubois

7/26/2025

1:23:27 PM

| Discussion|

Mots-clés et tags associés

Déesse cyborg marchant à la surface d'une petite planète au coucher du soleil, portant un sac en plastique translucide néon avec une atmosphère de nuages cosmiques bleus en arrière-plan

Princesse bédouine à capuche aux cheveux blonds tenant une orbe Pokéball translucide et lumineuse dans une prairie éclairée par le soleil au coucher du soleil, entourée de lumière dorée et de brume atmosphérique.

Une chevaleresse capuchonnée sans visage en armure médiévale détaillée se tient dans une prairie grise brumeuse tenant un orbe rouge et blanc lumineux, avec une ancienne fontaine en pierre et des collines rocheuses en arrière-plan.

Portrait photoréaliste en gros plan d'une femme souriante avec les cheveux couvrant ses yeux, présentant un éclairage cinématographique, des ombres douces et une brume atmosphérique.

Portrait d'une jeune femme debout dans un lac portant une robe col roulé bleu clair avec un détail en forme de trou de serrure, éclairage naturel doux et arrière-plan flou d'eau et d'arbres.

Prompts recommandés

studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still,film grain texture,analog photography aesthetic

Prompts négatifs recommandés

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

(worst quality, low resolution, bad hands), distorted, twisted, watermark

Paramètres recommandés

samplers

DPM++ 2M Karras, Euler a, Restart

steps

6 - 40

cfg

1 - 10

resolution

1024x1024, 832x1248, 896x1152, 1248x832, 1360x768, 1152x896, 832x1260, 900x1200

Paramètres haute résolution recommandés

upscaler

ESRGAN 4x, 8x_NMKD-Faces_160000_G, ESRGAN_4x

upscale

1.5

steps

8 - 21

denoising strength

0.2 - 0.3

Conseils

Ajoutez le mot déclencheur 'leogirl' pour HelloWorld 1.0 afin de déclencher un effet d'entraînement stable.

Utilisez le plugin 'adetailer' pour corriger les portraits éloignés, surtout en plein corps.

Pour des détails faciaux améliorés en plein corps, effectuez une réparation haute résolution 1.5x avec environ 0.3 d’intensité.

Utilisez des prompts en langage naturel pour améliorer la qualité de sortie avec les modèles SDXL.

Évitez le ton chaud indésirable en utilisant des prompts tels que 'studio light' et 'sharp focus'.

Les images corps entier peuvent présenter des scènes plus larges et des détails du visage moins nets en 1024 px ; utilisez des prompts de composition ou adetailer pour améliorer.

Le modèle inclut divers concepts tels que surréalisme, boudoir, masques, origami, mechas, animaux et textures film.

Points forts de la version

HelloWorld 5.0 est la mise à jour la plus importante de la série HelloWorld, taggée GPT-4v, avec de nombreux ajustements dans les domaines science-fiction, animaux, architecture et illustration.

Les tests comparatifs montrent les améliorations suivantes :

1. Poses de personnages et compositions d’images plus variées et dynamiques, rendant les images visuellement attractives ;

2. Ensemble de données film bien entraîné. Alors que la texture film était faible des versions 2.0 à 4.0, beaucoup préféraient le style leogirl de la version 1.0. Cette mise à jour renforce la texture film sans compromettre les autres qualités photographiques. Les textures film peuvent être déclenchées par les phrases texture grain de film et esthétique photographie analogique ;

3. Expressivité accrue dans les thèmes science-fiction, thriller, animaux, avec mechas et autres sujets plus designés. Animaux comme le chat de Pallas, le léopard des neiges, le panda roux, le panda géant, le tigre, les chats et chiens domestiques sont plus réalistes ;

4. Grâce au marquage GPT, l’adhérence au prompt et la précision conceptuelle sont améliorées.

Inconvénients :

1. Cette mise au point approfondie peut légèrement augmenter le taux d'erreurs pour les membres, phénomène normal en sortie de zone de confort vers une optimisation relative nouvelle. Les versions précédentes ont eu beaucoup de temps pour tests des membres, la nouvelle version moins. Cependant, la précision des membres ici est au moins meilleure qu’en v1.0, et des améliorations futures sont prévues.

2. En raison de la texture film renforcée, malgré la précision maximale du marquage GPT, un ton chaud par défaut peut apparaître. Vous pouvez toutefois utiliser lumière de studio ou mise au point nette pour des images studio HD, avec des tons de peau et attrait visuel supérieurs aux versions précédentes.

3. Cette version contient plus d'images corps entier, ce qui peut produire des scènes plus larges sans composition précise. Les détails du visage en corps entier 1024 px sont parfois moins nets que semi-corps ou gros plan, mais améliorables avec des prompts comme adetailer et correction hires 1.5x à intensité 0.3, ou en spécifiant la composition pour éviter les corps entiers.

4. Quelques datasets d’illustrations haute qualité ont été ajoutés, pouvant produire des images animées si prompt animé. Ajustez les prompts au besoin.

Ce sont les principaux points de cette version. Entraîner un grand modèle SDXL est un défi ; avec près de 10 000 images, le coût d'étiquetage et d'entraînement dépasse 300 USD par modèle. J'encourage son utilisation et apprécie tout retour ! Si vous aimez ce modèle, merci de promouvoir largement.

Sponsors du créateur

🖥️Essayez l'open-source GPT4V-Image-Captioner avec installation en un clic et fonctionnalités comme la pré-compression d’image et le marquage.

Utilisez la version plugin webui pour une intégration simple.

🖥️Bienvenue pour essayer l'outil open-source GPT4V-Image-Captioner, développé par mon ami et moi-même. Il offre une installation en un clic et intègre plusieurs fonctionnalités dont la pré-compression d'image, le marquage d'image et les statistiques de tags. Récemment, nous avons également lancé la version plugin webui de cet outil, ouverte à tous !

🌍Bienvenue dans les groupes QQ "兔狲·AIGC梦工北厂" numéro : 780132897 ; "兔狲·AIGC梦工南厂" numéro : 835297318 (mot de passe d'entrée : 兔狲). Groupe Telegram "兔狲的SDXL百老汇" lien :https://t.me/+KkflmfLTAdwzMzI1

📖Mise à jour HelloWorld 7.0 - 13 juin 2024

Résumé de la mise à jour en une phrase : HelloWorld 7.0 est une version optimisée de manière itérative, avec la meilleure performance corporelle de toute la série, étendue du champ conceptuel et richesse des détails renforcées.

Détails de la mise à jour :

En ajoutant des images négatives à l'entraînement, renforçant la formation sur les poses et optimisant le modèle clip, la précision des membres et des mains a été améliorée par rapport aux versions précédentes. Les mots recommandés pour les prompts négatifs sont : "main incorrecte, mauvaise anatomie, qualité la plus basse, images générées par IA, faible qualité, qualité moyenne".
Extraction du LoRA affiné du modèle officiel SPO et incorporation dans HelloWorld 7.0. SPO est une amélioration supplémentaire de la méthode DPO. Le modèle de base SPO est utilisé pour de meilleures performances par rapport au modèle DPO XL et au modèle SDXL de base original. Le LoRA SPO peut renforcer les détails et le contraste des images tout en les embellissant. Merci à l'équipe technique derrière SPO.

Extension continue du champ conceptuel de l'ensemble de formation, tout en optimisant et rationalisant l'ensemble (la mise au point sur un grand ensemble est trop coûteuse, le H800 est difficile à louer récemment, temps local de formation non abordable). Le total actuel est de 20 821 images. La distribution des résolutions est la suivante, il est conseillé d'utiliser plusieurs résolutions avec un grand nombre d'images pour la sortie :

(832, 1248) - Quantité : 7128
(896, 1152) - Quantité : 6250
(1248, 832) - Quantité : 2402
(1024, 1024) - Quantité : 1639
(1360, 768) - Quantité : 928
(1152, 896) - Quantité : 870
(768, 1360) - Quantité : 432
(960, 1088) - Quantité : 506
(992, 1056) - Quantité : 162
(1088, 960) - Quantité : 140
(704, 1472) - Quantité : 120
(1056, 992) - Quantité : 122
(1472, 704) - Quantité : 115
(1632, 640) - Quantité : 75
(640, 1632) - Quantité : 12

Utilisation de GPT4O pour re-étiqueter tous les ensembles de données. Cette fois, une méthode d’étiquetage structurée a été adoptée, avec la structure spécifique : « description résumée en une phrase + plusieurs tags d’éléments d’image + inspiré par XXX + mots décrivant la qualité esthétique », ces mots étant répartis en cinq niveaux : pire qualité, faible qualité, qualité moyenne, meilleure qualité, et chef-d'œuvre. Un exemple typique d’étiquetage est :
```
art conceptuel mettant en scène une main humaine enveloppée de rubans rouges et beiges, isolée sur un fond clair uni, style réaliste, palette minimaliste, textures lisses, esthétique allongée et surréaliste, inspirée des œuvres surréalistes de Salvador Dalí, chef-d'œuvre
```

La "Liste de mots d'étiquetage à haute fréquence" et la "Liste des styles artistiques à haute fréquence" impliquées dans la section Inspiré par XXX pour la version HelloWorld 7.0 ne seront fournies qu'aux utilisateurs de licence commerciale. Les partenaires ayant acheté l'autorisation des modèles de la série HelloWorld XL dans le passé, veuillez me contacter en cas d’oubli pour l’obtenir gratuitement.

Les utilisateurs peuvent consulter la Liste des 250 mots d’étiquetage à haute fréquence de HelloWorld 6.0. De plus, j'ai fourni plus de 150 images exemples de qualité supérieure de HelloWorld 7.0 dans la galerie, qui peuvent servir de référence pour vos créations. La fabrication de modèles n’est pas simple, merci pour votre compréhension et tolérance !

📖Mise à jour HelloWorld 6.0 - 20 avril 2024

LEOSAM HelloWorld 6.0 Liste des 250 mots d’étiquetage à haute fréquence

Merci pour votre patience. J'ai cherché un emploi récemment, ce qui a retardé les mises à jour HelloWorld. Voici les principales nouveautés de la version 6.0 :

HelloWorld 6.0 est une amélioration itérative basée sur la version 5.0. Selon mes tests, l'effet de réalisme n’est pas très différent. L'avantage principal réside dans une couverture élargie des concepts dans l'ensemble d'entraînement. Selon les retours, des améliorations ont été apportées dans les thèmes comme le surréalisme, boudoir, photos de groupes, masques, origami, rendus 3D, voitures, dragons et photographie maternité. Certains exemples sont fournis dans les illustrations.
HelloWorld 6.0 inclut intentionnellement certaines images de faible qualité pour renforcer la réponse du modèle aux prompts négatifs. Il est conseillé d’utiliser les termes suivants dans les prompts négatifs : "faible qualité, artefacts jpeg, flou, mal dessiné, laid, qualité la plus basse".
Le corps principal de l’ensemble d’entraînement HelloWorld 6.0 utilise le marquage GPT4v. Pour les images que GPT4v ne peut pas étiqueter, cogVQA guidé par blip2-opt-6.7b est utilisé. Le style de langage d’étiquetage de ces modèles multimodaux diffère largement du tagger traditionnel WD1.4. Pour faciliter un déclenchement plus précis des différents concepts, j’ai compilé les 250 mots d’étiquetage à haute fréquence de l’ensemble HelloWorld 6.0. Vous pouvez consulter ces mots dans ce document.

Enfin, bien que SD3 soit sur le point d’être lancé, je continuerai à mettre à jour HelloWorld XL 7.0 en espérant des améliorations accrues !

📖Présentation du 22.02.2024 "HW5.0_Euler_a_Lightning"

Ce modèle est une version accélérée du modèle de base HelloWorld SDXL, intégrant la technologie SDXL-Lightning. Équipé du sampler Euler a et CFG 1, il génère des images en 6-8 étapes, trois fois plus rapide que la version SDXL originale. De plus, comparativement, ses images sont supérieures à celles des versions LCM ou Turbo.

Paramètres recommandés pour la génération :

Sampler : Euler a (Important ! Adapté spécifiquement à Euler a, autres samplers peuvent donner moins bon résultat)

CFG scale : 1

Étapes d’échantillonnage : 8 (6~8 acceptables)

Algorithme Hires : ESRGAN 4x / 8x_NMKD-Faces_160000_G

Facteur d’agrandissement hires : 1.5x

Étapes hires : 8

Force de débruitage hires : 0.3

📖Présentation du 11.02.2024 "HelloWorld 5.0 GPT4V"

HelloWorld 5.0 est la mise à jour la plus importante de la série HelloWorld, taggée GPT-4v, avec de nombreux ajustements dans les domaines science-fiction, animaux, architecture et illustration.

Les tests comparatifs montrent les améliorations suivantes :

1. Poses de personnages et compositions d’images plus variées et dynamiques, rendant les images visuellement attractives ;

3. Expressivité accrue dans les thèmes science-fiction, thriller, animaux, avec mechas et autres sujets plus designés. Animaux comme chat de Pallas, léopard des neiges, panda roux, panda géant, tigre, chats et chiens domestiques sont plus réalistes ;

4. Grâce au marquage GPT, l’adhérence au prompt et la précision conceptuelle sont améliorées.

Inconvénients :

3. Cette version contient plus d'images corps entier, ce qui peut produire des scènes plus larges sans composition précise. Les détails du visage en corps entier 1024 px sont parfois moins nets que semi-corps ou gros plan, mais améliorables avec adetailer et correction hires 1.5x à intensité 0.3, ou par prompt compositif évitant les corps entiers.

4. Quelques datasets d’illustrations haute qualité ont été ajoutés, pouvant produire des images animées si prompt animé. Ajustez les prompts au besoin.

📖Présentation du 31.01.2024 "HelloWorld 4.0"

HelloWorld 4.0 est une version de transition progressive du marquage blip+clip au marquage GPT4V. J’ai initialement entraîné un modèle avec مارquage purement GPT4V puis fusionné avec une forte proportion de HelloWorld 3.2 et 0.05 de Juggernaut XL (pour ajuster le teint). Cette version montre des progrès en conformité au prompt et couverture conceptuelle par rapport à 3.2.

Le nouvel ensemble GPT4V a doublé de 4 000 à 8 000 images, couvrant portraits, animaux, architecture, nature, nourriture, illustrations, etc. Cependant, la version pure GPT4V souffre d’un problème de surapprentissage, attribué à ce doublement. La prochaine optimisation vise à inclure un maximum de concepts non-portraits tout en assurant un bon entraînement portrait. À ce stade, fusion des versions ancienne et nouvelle assure une transition fluide, donc les avantages du concept élargi et du marquage GPT4V sont peu visibles pour l’instant, mais se feront sentir dans les versions 5 et 6 suivantes.

📖Présentation du 05.01.2024 "HelloWorld 3.2"

La version 3.2 est une itération optimisée avec la technologie DPO, avec des optimisations sur le teint et la précision des membres par rapport à la version 3.0, mais sans améliorations majeures. D’où le label 3.2 plutôt que 4.0.

📖Présentation du 15.12.2023 "HelloWorld 3.0"

Nouvelle version avec un ensemble d’entraînement élargi, améliorant la capacité d’expression dans différents styles artistiques, dont la science-fiction et l’art.
Intégration d’un LoCon d’amélioration de qualité fait maison (créé avec technologie slider) pour améliorer la texture et réduire la déformation des doigts et membres.

📖Présentation du 17.11.2023 "HelloWorld 2.0"

Merci de votre patience. Après divers défis, HelloWorld 2.0 est enfin prêt et conforme à mes attentes. Principales différences avec la 1.0 :

HelloWorld 2.0 n’a plus besoin de mots déclencheurs, offrant une qualité comparable à la 1.0 avec le déclencheur. Le mot déclencheur 'leogirl' en 1.0 était très associé aux Asiatiques de l’Est. Après suppression, bien que "1girl" produise encore probablement des portraits d’Asiatiques de l’Est sans mention raciale, la race peut maintenant être spécifiée par mots-clés tels que nationalité, couleur de peau, etc. Par exemple, les effets déclencheurs pour "Chinese", "Russian", "Iranian", "Jamaican", "Kenyan", "dark-skinned", "pale-skinned" etc. sont listés ci-dessous.
Différents styles sont également accessibles en mentionnant noms de personnes de divers pays et sexes dans le prompt, tels que Han Meimei (Chine), Sophie Martin (France), Priya Patel (Inde), Fatima Al-Hassan (Arabe), Wanjiru Mwangi (Kenya). Ces exemples ne sont qu’illustratifs, il en existe beaucoup d’autres à explorer et partager.
HelloWorld 2.0 équilibre qualité/couleur et offre plus d’options de style. La version 1.0 avec 'leogirl' produisait souvent une forte texture film. HelloWorld 2.0 n’en dépend pas et peut être personnalisé avec des prompts axés sur la qualité, tels que :
shooting mode haut de gamme, photo produit, maquillage coréen populaire, aegyo sal, photo nette haute qualité, lumière studio, photo moyen format, photo Mamiya, film analogique, portrait moyen avec lumière douce, image réelle, photographie raffinée éditoriale, photo brute, photo réelle, photo scannée, plan film
Les effets couleurs de ces prompts sont illustrés ci-dessous :
L’ensemble d’entraînement de HelloWorld 2.0 a largement augmenté la proportion de photos corps entier pour améliorer les performances SDXL en portraits corps entier et plans éloignés. Bien que supérieur à la 1.0, il est toujours fortement conseillé d’utiliser 'adetailer' pour générer des photos corps entier. Pour les utilisateurs disposant de suffisamment de mémoire vidéo (24 Go), la correction hires 1.5x est recommandée, améliorant significativement les détails des visages.

📖Présentation du 29.08.2023 "HelloWorld" modèle base SDXL

Rappel spécial : Pour utiliser HelloWorld 1.0, n’oubliez pas d’ajouter le mot déclencheur "leogirl".

Différent du modèle de base SD1.5 “MoonFilm”, “HelloWorld” est une toute nouvelle série de modèles base SDXL réalistes. Pour permettre plus d’utilisateurs de découvrir HelloWorld, j’ai conservé le lien d’origine de MoonFilm. Il peut être perçu comme une continuation spirituelle de MoonFilm sur la nouvelle plateforme SDXL, mais HelloWorld vise plus que réalisme et qualité film dans les portraits. Grâce à la quantité d’informations et compréhension du texte bien supérieure de SDXL à SD1.5, HelloWorld est un modèle de base cherchant à représenter de façon réaliste toutes choses, ou dit autrement, je souhaite bâtir progressivement un monde virtuel de photographie avec HelloWorld.

Le modèle base SD1.5 réaliste est assez mature, peu de meilleures performances sont attendues sauf nouvelle technologie. La série Moonfilm & MoonMix ne sera donc plus mise à jour. Je concentre mes efforts sur HelloWorld SDXL. La v1.0 est disponible au téléchargement, la v2.0 en développement rapide, prévue début septembre.

Trois différences entre HelloWorld et les modèles SD1.5 :

Contrairement aux bases SD1.5 n’utilisant généralement pas de mots déclencheurs, utilisez le mot déclencheur "leogirl" pour HelloWorld 1.0. Cela stabilise le déclenchement de l’effet de l’ensemble de formation.
HelloWorld supporte une sortie directe à 1024*1024 px, sans agrandissement haute résolution. La qualité des portraits rapprochés est équivalente à SD1.5, mais des défauts persistent pour les portraits éloignés. Il est conseillé d’utiliser le plugin ADetailer qui corrige efficacement les visages distants.
SDXL permet désormais une sortie plus facile via prompts en langage naturel simple. Il est conseillé d’essayer plus de prompts naturels, pour de meilleurs résultats en photos réalistes IA.

Après plusieurs tests, paramètres recommandés :

Étapes ≥ 25
Sampler : DPM++ 2M Karras
Échelle CFG : 10
Taille ≥ 1024x1024
ADetailer : activé

Essayez HelloWorld et donnez vos retours, précieux pour améliorer le modèle !

Déclaration de droits d’auteur :

La série de modèles HelloWorld (ci-après "le Modèle") a été réalisée par moi-même (ci-après "le Propriétaire") avec l’aide de la plateforme LiblibAI. La republication sur des plateformes autres que LiblibAI et Civitai est interdite sans autorisation du Propriétaire.

Le Propriétaire autorise l’usage des images générées par le Modèle à des fins éducatives ou informatives non commerciales, gratuitement, sous condition que :

- Les utilisateurs respectent les lois applicables et ne portent pas atteinte aux droits du Modèle ou de tiers.

- L’attribution claire soit mentionnée comme "créé par le modèle base HelloWorld de LEOSAM".

Toute utilisation commerciale exige une licence commerciale préalable avec le Propriétaire. Pour questions sur licences commerciales et personnalisation, contactez le Propriétaire via les infos sur sa page d’accueil.

Le développement et la distribution gratuite du modèle SDXL sont un travail important. Le Propriétaire s’engage à assurer des mises à jour gratuites pour les passionnés individuels, en remerciement à la communauté open source. Les collaborations commerciales sont essentielles pour l’évolution du Modèle. Merci à tous pour votre compréhension et soutien.

L’usage non autorisé peut enfreindre la loi et entraîner des poursuites. Le Propriétaire conserve le droit d’interpréter cette déclaration sous les lois en vigueur.

Contributeur

Camille Dubois

Bonjour ! Je m’appelle Camille Dubois. Passionnée d’art visuel, j’orchestre des galeries numériques pour révéler toute la poésie des images générées par l’IA.

Midjourney V6.1 rencontre FLUX 🖼️ [+ILLUSTRIOUS / SDXL] - ILLUSTRIOUS v0.5

XL Pokemon Ball - Par HailoKnight - v1.0

Utiliser ce modèle