Gros plan d'une guerrière à la peau foncée aux cheveux courts portant une armure argentée et une cape rouge, debout dans une forêt au lever du soleil.

Prompts recommandés

film grain texture,analog photography aesthetic,studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still

film grain texture, analog photography aesthetic

Prompts négatifs recommandés

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

(worst quality, low resolution, bad hands), distorted, twisted, watermark, open mouth

Paramètres recommandés

samplers

DPM++ 2M Karras, Euler a

steps

6 - 25

cfg

1 - 10

resolution

1024x1024, 832x1248, 896x1152, 1248x832, 1360x768, 768x1360, 900x1200

Paramètres haute résolution recommandés

upscaler

ESRGAN 4x, 8x_NMKD-Faces_160000_G

upscale

1.5

steps

8

denoising strength

0.3

Conseils

Utilisez le mot déclencheur "leogirl" avec HelloWorld 1.0 pour des résultats stables.

Pour les plans pleins corps, utilisez le plugin ADetailer et une réparation haute résolution 1,5x pour améliorer les détails.

Les prompts en langage naturel améliorent les résultats photo réalistes IA.

Soyez vigilant aux tons chauds dans HelloWorld 5.0 dus aux textures film renforcées ; ajoutez "lumière de studio" ou "focalisation nette" dans le prompt pour de meilleurs tons de peau.

Évitez les prompts de styles animés si non désirés, car certains datasets d’illustration ont été ajoutés en version 5.0.

Utilisez les prompts négatifs recommandés pour améliorer la précision des membres et mains ainsi que la qualité globale de l'image.

Points forts de la version

Ce modèle est une version accélérée du modèle de base HelloWorld SDXL, intégrant les technologies SDXL-Lightning. Équipé du sampler Euler a et CFG 1, il est capable de générer des images en 6-8 étapes, ce qui est trois fois plus rapide que la version SDXL originale. De plus, ses résultats sont supérieurs à ceux des versions LCM ou Turbo, et il est fortement recommandé de le tester et l'utiliser.

Les paramètres recommandés pour générer des images avec ce modèle sont :

Sampler : Euler a (Important ! Le modèle est spécifiquement adapté à Euler a, d'autres samplers peuvent ne pas donner de bons résultats)

Échelle CFG : 1

Étapes d'échantillonnage : 8 étapes (6 à 8 étapes acceptables)

Algorithme Hires : ESRGAN 4x / 8x_NMKD-Faces_160000_G

Facteur d'agrandissement Hires : 1,5x

Étapes Hires : 8 étapes

Force de réduction de bruit Hires : 0,3

Sponsors du créateur

🖥️Bienvenue pour essayer le GPT4V-Image-Captioner open-source, développé par mon ami et moi. Il offre une installation en un clic et intègre les fonctionnalités de pré-compression d’image, d’étiquetage d’image et de statistiques de tags.

Récemment, nous avons lancé la version plugin webui de cet outil, tout le monde est invité à l'utiliser !

🖥️Bienvenue pour essayer le GPT4V-Image-Captioner open-source, développé par mon ami et moi. Il offre une installation en un clic et intègre plusieurs fonctionnalités dont la pré-compression d'images, l'étiquetage d'images, et les statistiques de tags. Récemment, nous avons également lancé la version plugin webui de cet outil, tout le monde est invité à l'utiliser !

🌍欢迎加入QQ群"兔狲·AIGC梦工北厂",群号 :780132897 ;"兔狲·AIGC梦工南厂",群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1

📖Mise à jour HelloWorld 7.0 - 13 juin 2024

Résumé en une phrase : HelloWorld 7.0 est une version optimisée itérativement, avec la meilleure performance corporelle de toute la série, et une portée conceptuelle ainsi qu'une richesse du détail encore améliorées.

Détails de la mise à jour :

  1. En ajoutant des images d'entraînement négatives, en renforçant l'entraînement des poses, et en optimisant le modèle clip, la précision des membres et mains du modèle est améliorée par rapport aux versions précédentes. Les mots de prompt négatifs recommandés sont : "mauvaise main, mauvaise anatomie, pire qualité, images générées par IA, faible qualité, qualité moyenne".

  2. Extraction du LoRA affiné issu du modèle officiel SPO et incorporation dans HelloWorld 7.0. SPO est une amélioration de la méthode DPO. Le modèle de base SPO offre de meilleures performances que le modèle de base DPO XL et le modèle de base SDXL original. Le LoRA SPO permet d'améliorer les détails d'image, le contraste et d'embellir les images. Merci à l'équipe technique derrière SPO.

  3. Extension continue de la portée des concepts du set d'entraînement, tout en optimisant et rationalisant le set (la fine-tuning d'un grand set est très coûteuse, et H800 est récemment difficile à louer, entraînement local difficile à assurer). Le set total comprend maintenant 20 821 images. La répartition des résolutions du set d'entraînement est la suivante, il est recommandé d'utiliser plusieurs résolutions avec un grand nombre d'images pour la sortie :

    (832, 1248) - Quantité : 7128
    (896, 1152) - Quantité : 6250
    (1248, 832) - Quantité : 2402
    (1024, 1024) - Quantité : 1639
    (1360, 768) - Quantité : 928
    (1152, 896) - Quantité : 870
    (768, 1360) - Quantité : 432
    (960, 1088) - Quantité : 506
    (992, 1056) - Quantité : 162
    (1088, 960) - Quantité : 140
    (704, 1472) - Quantité : 120
    (1056, 992) - Quantité : 122
    (1472, 704) - Quantité : 115
    (1632, 640) - Quantité : 75
    (640, 1632) - Quantité : 12
  4. Utilisation de GPT4O pour renommer tous les jeux de données. Cette fois, méthode d'étiquetage structurée utilisée, avec la structure spécifique suivante : "description résumé en une phrase + plusieurs tags d'éléments d'image + inspiré par XXX + mots décrivant la qualité esthétique", où les mots de qualité esthétique sont divisés en cinq niveaux : pire qualité, faible qualité, qualité moyenne, meilleure qualité, chef-d'œuvre. Exemple typique d'étiquetage :

    art conceptuel présentant une main humaine enveloppée de rubans rouges et beige, isolée sur un fond clair uni, style réaliste, palette minimaliste, textures lisses, esthétique allongée et surréaliste, inspirée des œuvres surréalistes de Salvador Dalí, chef-d'œuvre

La "Liste de mots de balisage à haute fréquence" et la "Liste des styles artistiques à haute fréquence" impliquées dans "Inspiré par XXX" pour la version HelloWorld 7.0 seront fournies uniquement aux utilisateurs sous licence commerciale. Les partenaires ayant déjà acquis la licence du modèle HelloWorld XL peuvent me contacter en cas d'oubli pour l'obtenir gratuitement.

Les utilisateurs peuvent se référer à la Liste de mots d'étiquetage à haute fréquence de HelloWorld 6.0. De plus, j'ai fourni plus de 150 images d'exemple de haute qualité HelloWorld 7.0 dans la galerie, pour servir de référence à tous. La création de modèle n’est pas facile, merci aux utilisateurs pour leur compréhension et leur indulgence !

📖Mise à jour HelloWorld 6.0 - 20 avril 2024

Liste des 250 mots d'étiquetage à haute fréquence de LEOSAM HelloWorld 6.0

Merci pour votre patience. J'ai été en recherche d'emploi dernièrement, ce qui a causé quelques retards dans les mises à jour HelloWorld. Voici les principales améliorations de la version 6.0 :

  • HelloWorld 6.0 est une amélioration itérative basée sur la version 5.0. D'après mes tests, l'effet réaliste n'est pas significativement différent de la version 5.0. Le principal avantage de la 6.0 réside dans la couverture plus large des concepts du set d'entraînement. Selon les retours, des améliorations ont été faites sur divers thèmes incluant le surréalisme, le boudoir, les photos de groupe, les masques, l'origami, les rendus 3D, les voitures, les dragons et la photographie de maternité. Quelques exemples sont fournis dans les illustrations.

  • HelloWorld 6.0 inclut volontairement des images de faible qualité dans l'entraînement pour améliorer la réponse aux prompts négatifs. Il est recommandé d'utiliser dans ces prompts des termes tels que : "faible qualité, artefacts jpeg, flou, mal dessiné, moche, pire qualité".

  • Le corps principal du set d'entraînement HelloWorld 6.0 utilise l'étiquetage GPT4v. Pour les images non étiquetables par GPT4v, cogVQA guidé par blip2-opt-6.7b est utilisé. Le style de langage employé dans l'étiquetage de ces modèles multimodaux diffère significativement de celui de l'étiqueteur traditionnel WD1.4. Pour faciliter un déclenchement plus précis des différents concepts du set d'entraînement, j’ai compilé les 250 mots d’étiquetage à haute fréquence d’HelloWorld 6.0. Vous pouvez consulter ces mots fréquents dans ce document.

Enfin, bien que SD3 soit sur le point d’être publié, je continuerai à mettre à jour HelloWorld XL 7.0, espérant des améliorations plus importantes dans la version 7.0 !

📖2024.2.22 Présentation de "HW5.0_Euler_a_Lightning"

Ce modèle est une version accélérée du modèle de base HelloWorld SDXL, intégrant les technologies SDXL-Lightning. Equipé du sampler Euler a et CFG 1, il est capable de générer des images en 6-8 étapes, ce qui est trois fois plus rapide que la version SDXL originale. De plus, ses résultats sont supérieurs à ceux des versions LCM ou Turbo.

Les paramètres recommandés pour générer des images avec ce modèle sont :

Sampler : Euler a (Important ! Ce modèle est spécifiquement adapté à Euler a, les autres samplers peuvent ne pas donner de bons résultats)

Échelle CFG : 1

Étapes d'échantillonnage : 8 étapes (6 à 8 étapes acceptables)

Algorithme Hires : ESRGAN 4x / 8x_NMKD-Faces_160000_G

Facteur d'agrandissement Hires : 1,5x

Étapes Hires : 8 étapes

Force de réduction de bruit Hires : 0,3

📖2024.2.11 Présentation de "HelloWorld 5.0 GPT4V"

HelloWorld 5.0 est la mise à jour la plus importante de l'histoire de la série HelloWorld, étiquetée avec GPT-4v, ayant subi un affinage significatif dans les domaines de la science-fiction, des animaux, de l'architecture et de l'illustration.

Les tests comparatifs montrent les améliorations suivantes :

1. Des poses de personnage plus variées et dynamiques ainsi que des compositions d'image créant des visuels captivants ;

2. Le dataset cinématographique est largement entraîné. Alors que la texture film était faible des versions 2.0 à 4.0, beaucoup de fans regrettaient le style leogirl de la version 1.0. Cette mise à jour renforce spécifiquement la texture film sans compromettre les autres qualités photographiques. La texture film peut être déclenchée par des expressions telles que granularité film et esthétique photo analogique ;

3. Expression améliorée sur les thèmes science-fiction, thriller et animaux, avec les mechas et autres sujets plus designés. Les animaux comme le léopard des neiges, le panda roux, le panda géant, le tigre, le chat de Pallas ainsi que chats et chiens domestiques sont plus réalistes ;

4. Grâce au tagging GPT, l'adhérence aux prompts et la précision conceptuelle sont améliorées.

Cependant, les inconvénients sont :

1. Etant une mise à jour importante, le taux d'erreur sur les membres peut légèrement augmenter, ce qui est normal en quittant la zone de confort pour une nouvelle optimisation. Les versions précédentes bénéficiaient de tests approfondis sur les membres, ce qui a manqué cette fois. Néanmoins, l'exactitude des membres dans cette version est au moins meilleure que la version 1.0, et des améliorations continueront.

2. En raison de la texture film renforcée, même si le tagging GPT est aussi précis que possible, un ton chaud par défaut peut apparaître dans les images. Toutefois, vous pouvez utiliser des prompts comme lumière de studio ou focalisation nette pour produire des images HD de qualité studio, et obtenir de meilleurs tons de peau et rendu visuel que les versions précédentes.

3. Cette version inclut davantage d'images de personnages en plein corps pour améliorer l'effet plein corps, donc le modèle peut générer des scènes plus larges si aucune composition spécifique n'est indiquée. Actuellement, les détails du visage en pleine résolution 1024 des plans pleins corps sont moins nets que pour les plans moyens ou rapprochés. Cela peut être amélioré avec adetailer, un agrandissement 1,5x et une correction à 0,3 d'intensité, ou en précisant la composition pour éviter les images plein corps.

4. Comme un petit nombre de datasets d'illustration de haute qualité ont été ajoutés, il se peut que certains prompts liés aux styles animés génèrent des images animées. Si cela vous dérange, veuillez ajuster vos prompts.

Ce sont les principales nouveautés. L'entraînement du modèle de base SDXL est difficile, lorsque le set approche les dix mille images, le coût d'étiquetage et d'entraînement dépasse 300 USD par modèle. J'invite tout le monde à utiliser le modèle et apprécie vos retours ! Si ce modèle vous satisfait, j'apprécierais énormément que vous aidiez à le faire connaître.

📖2024.1.31 Présentation de "HelloWorld 4.0"

HelloWorld 4.0 est une version transitoire progressive passant d'un étiquetage avec blip+clip à un étiquetage avec GPT4V. J'ai initialement entraîné un modèle d’étiquetage purement GPT4V, puis fusionné avec une grande proportion de la version HelloWorld 3.2 et une proportion de 0,05 de Juggernaut XL (pour ajuster le teint). La nouvelle version montre une amélioration de la conformité aux prompts et de la couverture des concepts par rapport à la 3.2.

Le dataset d'entraînement avec étiquetage GPT4V a doublé, passant de 4000 images pour la série HelloWorld3 à 8000 images, couvrant non seulement les portraits mais aussi animaux, architecture, nature, nourriture, illustrations, etc. Cependant, la version pure GPT4V rencontre un problème de sur-apprentissage, attribué à ce doublement. L’étape suivante d’optimisation consistera à inclure le plus possible de concepts non portrait tout en assurant suffisamment d’entraînement des portraits. Actuellement, une fusion des anciennes et nouvelles versions est utilisée pour une transition en douceur, donc les avantages de l'ouverture conceptuelle et du tagging GPT4V ne sont pas très perceptibles, mais ils seront plus visibles dans les générations 5 et 6 à venir.

📖2024.1.5 Présentation de "HelloWorld 3.2"

La version 3.2 est une optimisation itérative avec la technologie DPO, et comparée à la version 3.0, elle améliore le teint et la précision des membres mais de façon modérée. C’est pourquoi elle est nommée 3.2 et non 4.0.

📖2023.12.15 Présentation de "HelloWorld 3.0"

  1. Cette version a élargi le set d'entraînement pour améliorer la capacité à exprimer différents styles artistiques incluant la science-fiction et l'art.

  2. Elle intègre un LoCon de qualité améliorée auto-construit (créé avec la technologie slider) pour améliorer la texture des images et atténuer les problèmes de déformation des doigts et membres.

📖2023.11.17 Présentation de "HelloWorld 2.0"

Merci à tous pour votre patience. Après divers défis, la version 2.0 est prête et satisfaisante. Les différences clés entre HelloWorld 2.0 et 1.0 sont :

  1. HelloWorld 2.0 n’a plus besoin de mots déclencheurs, et les résultats sont comparables à la version 1.0 avec mots déclencheurs. Le mot déclencheur « leogirl » dans la 1.0 était fortement associé aux Asiatiques de l’Est. Après suppression du mot déclencheur, même si des termes comme « 1girl » généreront encore probablement des portraits asiatiques en l’absence de précision raciale, vous pouvez désormais spécifier la race avec des mots-clés comme nationalité, couleur de peau, etc. Par exemple, déclenchements pour mots comme « chinois », « russe », « iranien », « jamaïcain », « kényan », « peau foncée », « peau claire », etc., sont listés ci-dessous.

    Vous pouvez aussi obtenir différents styles de personnages en écrivant des noms de personnes de pays et genres variés comme Han Meimei (Chine), Sophie Martin (France), Priya Patel (Inde), Fatima Al-Hassan (Arabie), Wanjiru Mwangi (Kenya). Ces prompts sont des exemples parmi d'autres à explorer et partager librement.

  2. HelloWorld 2.0 équilibre qualité/couleur et offre plus d'options de styles. La version 1.0 avec « leogirl » produisait souvent une forte texture film. HelloWorld 2.0 n'est plus liée à cette texture film et peut être personnalisée avec certains prompts qualité. Exemples testés fonctionnels :

    shooting mode haut de gamme, photo d’introduction produit, maquillage coréen populaire, aegyo sal, photo nette haute qualité, lumière de studio, photo moyen format, photographie Mamiya, film analogique, portrait moyen lumière douce, image réaliste, photo éditoriale raffinée, photo RAW, vraie photo, photo scannée, plan filmé

    Effets couleur des prompts :

  3. Le set d'entraînement HelloWorld 2.0 a considérablement augmenté la proportion de photos en pied afin d'améliorer la génération de portraits plein corps et éloignés par SDXL. Malgré une amélioration par rapport à la 1.0, il est très conseillé d’utiliser « adetailer » lors de la génération de photos pleines jambes. Pour ceux avec assez de mémoire vidéo (24 Go), il est recommandé d'appliquer une réparation haute résolution 1,5x, ce qui améliore nettement les détails du visage.

📖2023.8.29 Présentation du modèle de base "HelloWorld" SDXL

Rappel spécial : Lors de l'utilisation du modèle HelloWorld 1.0, n'oubliez pas d'ajouter le mot déclencheur "leogirl".

Distinct du modèle de base SD1.5 “MoonFilm”, “HelloWorld” est une toute nouvelle série de modèles de base réalistes SDXL. Pour permettre à plus d'utilisateurs de découvrir HelloWorld, j'ai conservé le lien du modèle original Moonfilm. On peut le considérer comme une continuation spirituelle de Moonfilm sur la plateforme SDXL, mais HelloWorld vise bien plus que le réalisme et la qualité filmique pour les portraits. Grâce à la quantité d'informations et aux capacités de compréhension textuelle bien supérieures de SDXL comparé à SD1.5, HelloWorld est un modèle de base cherchant à représenter réalistement toutes choses, ou en d'autres termes, construire progressivement un monde photo virtuel avec HelloWorld.

Le modèle réaliste de base SD1.5 a atteint une maturité avancée, et il est peu probable d’obtenir des améliorations majeures. Sauf percée technologique pour la plateforme SD1.5, les séries Moonfilm & MoonMix cesseront essentiellement leurs mises à jour. Je concentre donc mon énergie principale sur le développement de HelloWorld SDXL. La version 1.0 est téléchargeable, et la 2.0 est en cours de développement avec une mise à jour prévue début septembre.

En tant que nouveau modèle SDXL, HelloWorld diffère des modèles SD1.5 traditionnels sur trois points :

  1. Contrairement aux modèles SD1.5 de base qui n’incluent généralement pas de mots déclencheurs, veuillez utiliser le mot déclencheur "leogirl" avec HelloWorld 1.0 pour assurer un effet stable du set d'entraînement du modèle SDXL.

  2. Le modèle HelloWorld permet une sortie directe en 1024*1024 pixels sans besoin d'agrandissement haute résolution. La qualité de portrait en gros plan directe n'est pas inférieure à la version SD1.5, mais des défauts apparaissent pour des portraits éloignés. Il est donc conseillé d’utiliser le plugin ADetailer pour corriger efficacement les défauts des visages éloignés.

  3. SDXL permet maintenant une sortie plus facile en utilisant des prompts en langage naturel simple. Il est recommandé d’expérimenter ces prompts pour de meilleurs résultats de photos réalistes IA.

Après plusieurs séries de tests, les paramètres recommandés sont :

  • Étapes ≥ 25

  • Sampler : DPM++ 2M Karras

  • Échelle CFG : 10

  • Taille ≥ 1024x1024

  • ADetailer : activé

Tout le monde est invité à essayer HelloWorld et à donner beaucoup de retours. Vos avis précieux sont essentiels pour l’amélioration future des modèles !

La série de modèles HelloWorld (ci-après « le Modèle ») a été créée par moi-même (ci-après « le Propriétaire ») avec l’aide de la plateforme LiblibAI. Toute republication du Modèle sur des plateformes autres que LiblibAI et Civitai est non autorisée par le Propriétaire.

Le Propriétaire autorise l’usage des images générées par le Modèle à des fins éducatives ou informatives non commerciales gratuitement, à condition que :

- Les utilisateurs respectent les lois applicables et ne violent aucun droit du Modèle ou de tiers.

- L’attribution des images soit clairement indiquée comme « créé par le modèle de base HelloWorld de LEOSAM ».

Pour toute utilisation commerciale, un accord de licence commerciale préalable avec le Propriétaire est requis. Pour les demandes de licence commerciale et personnalisation du modèle, veuillez contacter le Propriétaire via les informations sur sa page d'accueil.

Le développement et la distribution gratuite du modèle SDXL représentent des efforts importants. Le Propriétaire s’engage à fournir des mises à jour gratuites du modèle HelloWorld aux passionnés individuels, en reconnaissance de la contribution de la communauté à l’open-source. Les collaborations commerciales sont essentielles pour la progression et le perfectionnement du Modèle. Le Propriétaire remercie tous les utilisateurs pour leur compréhension et soutien.

L’usage non autorisé peut violer la loi et entraîner des sanctions. Le Propriétaire détient les droits exclusifs d’interprétation de cette déclaration, régie par les lois en vigueur.

Précédent
Big Centaur Lora XL - 0.5
Suivant
Akira Mizutani Growth Academy (GA) [FLUX, Pony XL, SD 1.5] - v0.96

Détails du modèle

Type de modèle

Checkpoint

Modèle de base

SDXL Lightning

Version du modèle

HW5.0_Euler_a_Lightning

Hash du modèle

d5e0492911

Créateur

Discussion

Veuillez vous log in pour laisser un commentaire.

Images par HelloWorld XL de LEOSAM - HW5.0_Euler_a_Lightning

Images avec modèle de base

Images avec photo

Images avec photorealiste

Images avec réaliste

Images avec femme