Pony: People's Works + - v8_Illusv2.0Stable
Prompts recommandés
masterpiece,best quality,very aesthetic
collarbone, HDR, 8K, masterpiece, high contrast, best quality, very aesthetic, amazing quality, light smile, white hair, newest, long hair, volumetric lighting, 1girl, red eyes, (artist:incase:0.3), solo, sitting, (artist:tsuaii:0.3), holding phone, (realistic:1), sundress, (flat color:1.5), outdoors, bench, shopping bag, himuromizuki, garden, short hair, day, orange hair, pink hair, streaked hair, multicolored hair, hair between eyes, ahoge, pink eyes, hairclip, hand on hip, leaning forward, open mouth, smile, lens flare, gradient background, abstract background, yojifuku, witch, dress, pantyhose, hat
Prompts négatifs recommandés
low quality,displeasing
Base:bad quality, muted color, worst detail, low quality, worst quality, sketch, displeasing, censor, text, watermark, bad anatomy, artist name, signature
Paramètres recommandés
samplers
steps
cfg
Conseils
Pour le style photoréaliste, utilisez le tag 'photorealistic' à faible poids pour ajuster la texture.
Le tag 'realistic' fonctionne bien à poids plus élevés pour un meilleur réalisme.
Le modèle économise de l'espace token en produisant des images de qualité stable sans mots-clés d'artiste ni prompts qualité longs.
La version LoCon haute dimension offre un meilleur contrôle du poids des effets et une généralisation renforcée, mais nécessite plus de stockage et ressources de calcul.
Le modèle n'est pas spécifique à un style ; les résultats peuvent varier subtilement selon les prompts et conditions de génération.
v8
Mise à jour de la texture : renforcement de l'apprentissage des tags suivants :
Texture Update : Les tags suivants ont été renforcés lors de l'entraînement :
realistic, photorealistic, flat color,shiny skin, matte skin, shiny hair,Veuillez noter que dans le jeu de données Danbooru, plusieurs tags sont utilisés pour décrire les styles « photo » ou « proche de la photo ». J'ai uniformément étiqueté ces images comme « photorealistic » dans le jeu de données. Cependant, la plupart des modèles SDXL entraînés avec Danbooru ne parviennent pas à produire des images réalistes de qualité, donc « photorealistic » est seulement recommandé à faible poids pour modifier la texture. Le tag « realistic » peut être utilisé à poids plus élevés.
Veuillez noter que le dataset Danbooru contient plusieurs tags pour décrire les styles « photo » ou « proche de la photo ». J’ai tagué toutes ces images comme « photorealistic » dans le dataset.
Cependant, la plupart des modèles SDXL entraînés sur le dataset Danbooru ne rendent pas bien les images réalistes. « photorealistic » est uniquement recommandé à faible poids, où il sert à ajuster la texture plutôt qu’à créer des images réalistes. Le tag « realistic » fonctionne correctement à poids plus élevé.
Prise en main rapide | Quick Start
Qu'est-ce que c'est ? | What is this?
Pony: People's Works (ppw) est une série de modèles affinés expérimentaux, environ 85 % du dataset provient d'images générées par IA publiées par les utilisateurs sur CivitAI. Le premier dataset ppw était initialement basé sur des images générées par Pony v6, ainsi les images produites conservent des caractéristiques de Pony Diffusion.
Cette série utilise les tags standards Danbooru et est principalement optimisée pour générer des portraits stylisés en plans moyen et rapproché. Le but principal est de permettre au modèle de base d'obtenir une qualité d'image stable sans utiliser de mots-clés d'artiste ni de prompts qualité longs, économisant ainsi l'espace token.
Ce modèle n'est pas un LoRA de style, il peut y avoir des variations subtiles du style selon les prompts et conditions de génération.
Pony: People's Works (ppw) est une série de modèles affinés expérimentaux, environ 85 % du dataset provient d'images générées par IA publiées par les utilisateurs sur CivitAI. Étant donné que le premier ensemble ppw était basé sur des images générées par Pony V6, les résultats conservent certaines caractéristiques de Pony Diffusion.
Cette série utilise les tags Danbooru standards et est principalement optimisée pour la génération de portraits stylisés en plans moyen et rapproché. L'effet principal est de permettre au modèle de base d'obtenir une qualité d'image stable, sans mots-clés d'artiste ni prompts qualité longs, libérant de l'espace token pour les prompts.
Ces modèles ne sont pas des LoRAs de style. Il peut y avoir des variations stylistiques subtiles selon les prompts et conditions de génération.
Informations sur la version | Version Info.
Cette page publie la version LoCon haute dimension de ppw, qui est également la page principale du projet.
La version LoCon de ppw peut être combinée de manière flexible avec diverses LoRA fonctionnelles et checkpoints, avec un meilleur contrôle sur l'intensité des effets. La version haute dimension offre une meilleure généralisation et des détails plus poussés, mais nécessite plus d’espace de stockage et de ressources de calcul.
Elle est principalement destinée aux services de génération en ligne et aux utilisateurs disposant de configurations locales performantes.
Cette page présente la version LoCon haute dimension des modèles ppw, qui sert également de page principale du projet.
Les versions LoCon de ppw peuvent être combinées de manière flexible avec diverses LoRAs fonctionnelles et checkpoints, offrant une meilleure contrôlabilité du poids des effets. Les versions haute dimension offrent une généralisation plus forte et un rendu plus détaillé, mais nécessitent plus d’espace de stockage et de ressources de calcul.
Elles sont principalement destinées aux services de génération en ligne et à une utilisation locale par des utilisateurs disposant de PC hautes performances.
Version légère LoCon | Lightweight LoCon ver.
Version modèle de base | Versions checkpoint (Illustrious)
Version modèle de base | Versions checkpoint (NoobAI)
Mode d'emploi | Usage
positif :
masterpiece, best quality, very aestheticnégatif :
low quality, displeasingJournal des mises à jour | Change log
v7
La version v7 a apporté des ajustements significatifs à la structure du dataset, avec des paramètres et stratégies d'entraînement différents. Par conséquent, la version pourrait être moins stable que les précédentes.
La version v7 a subi d'importants ajustements structurels du dataset, avec des paramètres et stratégies d'entraînement différents. Ainsi, la v7 peut être moins stable que les versions précédentes.
Les performances du modèle v-pred sur le générateur en ligne civitAI diffèrent totalement de celles sur l'outil en ligne TensorArt, le même paramétrage produisant des résultats non reproductibles. Je n'en connais pas la raison...
Les performances du modèle v-pred sur le générateur en ligne CivitAI sont complètement différentes de celles sur TensorArt. Les mêmes paramètres ne reproduisent pas les mêmes résultats. Je ne sais pas pourquoi...
Version TensorArt Version CivitAI avec les mêmes paramètres sur CivitAI avec poids plus élevé
Description de la version v7 :
Il s'agit d'un LoCon de qualité d'image développé à partir du dataset de la version précédente, environ 90 %-95 % des images provenant de CivitAI.
Il permet au modèle d’obtenir une qualité d'image relativement stable sans utiliser de tags d'artistes ni de longs prompts qualité, économisant ainsi de l'espace token. Il corrige également certains défauts de génération inhérents au modèle. (sauf les mains)
En raison du choix du dataset, les images générées présentent une esthétique proche de Pony. Comme il ne vise aucun artiste, style ou technique en particulier, il peut y avoir des variations stylistiques subtiles selon les prompts et conditions de génération.
C'est un LoCon qualité de génération développé à partir du dataset du travail précédent. Environ 90%-95 % des données images proviennent de CivitAI.
Il permet aux modèles d'obtenir une qualité d'image stable sans tags artiste ou prompts longs, libérant plus d'espace token. Il peut aussi corriger certains défauts de génération du modèle. (hors mains)
À cause du dataset sélectionné, les images générées ont une esthétique proche de Pony. Comme il ne s'agit pas d'un style ciblant un artiste ou une technique spécifique, il peut y avoir des différences subtiles dans le style selon les prompts et conditions du modèle.
Source du dataset et licence | Dataset Source & License
Chaque image du dataset a été soigneusement sélectionnée, catégorisée et annotée manuellement par l'auteur. Des centaines d'images ont également été éditées et corrigées à la main.
Ce modèle est un modèle gratuit et open-source, que les utilisateurs peuvent déployer sur leurs appareils personnels. L'auteur ne reçoit aucune compensation liée à la vente du modèle. L'auteur n'impose aucune restriction à l'utilisation de ce modèle pour des services commerciaux de génération d'images ou à la génération d'images à usage commercial, mais il faut respecter les licences du checkpoint et des autres LoRAs utilisés.
Environ 90%-95 % des données sont générées par IA, mais environ 250+ images proviennent de médias publics, médias d'information et publications pour enrichir les concepts. Les versions futures remplaceront progressivement ces images. Les utilisateurs à vocation commerciale doivent être conscients des risques associés.
Ce dataset ne contient pas de données spécifiques à un artiste ni d'attribution explicite (bien qu'une erreur d'étiquetage IA ne soit pas exclue).
De plus, ce modèle ne peut pas être utilisé pour des applications commerciales fermées, la revente de modèles ni la fusion dans des modèles fermés commerciaux. Pour les modèles fusionnés open-source utilisés dans des services de génération, il n'y a pas de restriction, mais il est recommandé de mentionner la source des modèles fusionnés.
Toutes les images du dataset ont été sélectionnées, catégorisées et annotées manuellement par l'auteur. Des centaines d'images ont aussi été corrigées et éditées manuellement.
Ce modèle est un modèle gratuit et open-source, autorisant les utilisateurs à le déployer sur leurs appareils personnels. L'auteur ne perçoit aucun revenu de la vente du modèle. L'auteur n'impose aucune restriction quant à l'utilisation de ce modèle pour des services commerciaux de génération d'images ou la génération d'images à des fins commerciales. Cependant, il faut respecter les licences du checkpoint et des autres LoRAs utilisés en combinaison.
Le dataset comprend environ 90%-95 % d'images générées par IA. Toutefois, environ 250+ images ont été collectées dans des médias publics, médias d'actualité et publications pour compléter les concepts. Les futures versions remplaceront progressivement ces matériaux. Les utilisateurs commerciaux doivent être alertés des risques éventuels.
Ce dataset n'entraîne pas avec des données d'artistes individuels, ni n'inclut d'attributions précises (même si des erreurs d'étiquetage IA sont possibles).
En outre, ce modèle n'est pas autorisé à être utilisé pour des applications commerciales fermées, la revente de modèles, ni la fusion dans des modèles fermés commerciaux. Pour les modèles fusionnés open-source destinés aux services de génération, il n'y a pas de restrictions, mais il est conseillé de citer les sources des modèles fusionnés.
Détails du modèle
Type de modèle
Modèle de base
Version du modèle
Hash du modèle
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.






