NoobAI-XL (NAI-XL) - V-Pred-1.0-Version
Prompts recommandés
masterpiece, best quality, newest, absurdres, highres, safe
year 2024, long hair, best quality, masterpiece, absurdres, newest, highres
Prompts négatifs recommandés
nsfw, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro
Paramètres recommandés
samplers
steps
cfg
resolution
other models
Paramètres haute résolution recommandés
upscaler
upscale
steps
denoising strength
Conseils
Ce modèle fonctionne différemment des modèles EPS et nécessite l’utilisation exclusive de l’échantillonneur Euler.
La plage recommandée pour le CFG est de 4 à 5 pour des résultats optimaux.
Le nombre recommandé d'étapes est compris entre 28 et 35.
Utilisez des préréglages de résolution autour de 1024x1024 pour la meilleure qualité d’image.
Respectez les restrictions d’utilisation : pas d’usage nuisible, malveillant ou commercial.
Les prompts doivent inclure 'masterpiece, best quality, newest, absurdres, highres, safe' comme préfixe positif.
Les prompts négatifs doivent exclure nsfw, mauvaise qualité, mauvaises mains, mains mutées, et contenu indésirable.
Consultez le guide et les tutoriels pour une utilisation détaillée et l'entraînement de LoRA.
Le support communautaire est disponible via les groupes QQ et Discord.
Points forts de la version
Joyeux Noël ! NOOBAI XL-VPred 1.0 est sorti ! La série de prédiction V s’achève avec succès, et quel voyage intéressant cela a été. Qui sait, nous pourrions avoir l'occasion de refaire cela à l'avenir. Avec cela, le plan de mise à jour hebdomadaire de notre Laxhar Lab tire sa révérence en beauté !
Au fait, voici les avantages de cette version :
1. Affinage avec des ensembles de données de haute qualité : Nous avons optimisé le modèle pour une précision anatomique et une rationalité compositionnelle grâce à des ajustements minutieux avec des ensembles de haute qualité.
2. Poids flexibles pour la combinaison de styles : Le modèle offre désormais plus de flexibilité pour combiner différents styles de peinture, avec une meilleure robustesse lors du superposition de multiples styles.
3. Utilisation améliorée des mots de qualité : L'efficacité des mots de qualité est devenue plus prononcée dans cette version.
4. Un mélange des caractéristiques des versions standard et S : Le style de couleur est vibrant tout en étant moins sujet à la surexposition, combinant le meilleur des deux mondes.
Recommandations d'utilisation et travaux à venir :
1. Utilisation avec le plugin dynamic CFG : Nous recommandons d'utiliser le plugin dynamic CFG & CFG Rescale lors de l'emploi du modèle de prédiction V pour éviter la saturation excessive ou des images trop grisâtres. Vous pouvez vous référer à la configuration de 0.2 pour de meilleurs résultats.
2. Choix des méthodes d'échantillonnage : Bien que NOOBAI XL-VPred 1.0 supporte la plupart des méthodes d'échantillonnage, la prédiction V ne supporte pas la série d'échantillonnage Karras. Par conséquent, nous suggérons d'utiliser les méthodes Euler et DDIM pour des résultats plus stables.
3. Mises à jour et support continus : Nous continuerons à mettre à jour VPred 1.0, y compris le modèle ControlNet et d'autres plugins. Le modèle principal sera également mis à jour de manière irrégulière lorsqu'il y aura des améliorations significatives (voyons comment est l'effet DIT de NAI4 et apprenons-en), alors restez à l’écoute !
Enfin, je dois partager une recommandation personnelle : le récent jeu "MiSide" est vraiment un excellent jeu. Cela faisait longtemps qu’un jeu solo ne m’avait pas autant ému. Je le recommande vivement. Je vous souhaite à tous un Joyeux Noël. Après une année de dur labeur, il est temps de se reposer. Jusqu’à ce que nous nous retrouvions dans ce monde de possibilitésミ(・・)ミ
Sponsors du créateur
Sponsorisé par Lanyun Cloud, Civitai & Seaart
Introduction du modèle
Ce modèle de génération d'images, basé sur Laxhar/noobai-XL_v1.0, utilise l'intégralité des jeux de données Danbooru et e621 avec des tags natifs et des légendes en langage naturel.
Implémenté comme un modèle de prédiction v (différent de la prédiction eps), il nécessite des configurations paramétriques spécifiques - détaillées dans les sections suivantes.
Un grand merci à mon coéquipier euge pour le travail de codage, et nous sommes reconnaissants pour le soutien technique de nombreux membres bienveillants de la communauté.
⚠️ AVIS IMPORTANT ⚠️
CE MODÈLE FONCTIONNE DIFFÉREMMENT DES MODÈLES EPS !
VEUILLEZ LIRE ATTENTIVEMENT LE GUIDE !
Détails du modèle
Développé par: Laxhar Lab
Type de modèle: Modèle génératif texte-image basé sur la diffusion
Affiné à partir de: Laxhar/noobai-XL_v1.0
Sponsorisé par :
Tests collaboratifs :
Comment utiliser le modèle.
Manuel pour NoobAI XL :
ENG :
https://civitai.com/articles/8962
CHS :
https://fcnk27d6mpa5.feishu.cn/wiki/S8Z4wy7fSiePNRksiBXcyrUenOh
Liste recommandée de LoRa pour NoobAI XL :
https://fcnk27d6mpa5.feishu.cn/wiki/IBVGwvVGViazLYkMgVEcvbklnge
Méthode I : reForge
(Si vous n'avez pas installé reForge) Installez reForge en suivant les instructions dans le dépôt ;
Lancez WebUI et utilisez le modèle comme d'habitude !
Méthode II : ComfyUI
ÉCHANTILLON avec NODES
Méthode III : WebUI
Notez que la branche dev n'est pas stable et peut contenir des bugs.
1. (Si vous n'avez pas installé WebUI) Installez WebUI en suivant les instructions dans le dépôt. Pour simplifier
2. Passez à la branche dev :
git switch dev
3. Récupérez les dernières mises à jour :
git pull
4. Lancez WebUI et utilisez le modèle comme d'habitude !
Méthode IV : Diffusers
import torch
from diffusers import StableDiffusionXLPipeline
from diffusers import EulerDiscreteScheduler
ckpt_path = "/path/to/model.safetensors"
pipe = StableDiffusionXLPipeline.from_single_file(
ckpt_path,
use_safetensors=True,
torch_dtype=torch.float16,
)
scheduler_args = {"prediction_type": "v_prediction", "rescale_betas_zero_snr": True}
pipe.scheduler = EulerDiscreteScheduler.from_config(pipe.scheduler.config, **scheduler_args)
pipe.enable_xformers_memory_efficient_attention()
pipe = pipe.to("cuda")
prompt = """masterpiece, best quality,artist:john_kafka,artist:nixeu,artist:quasarcake, chromatic aberration, film grain, horror \(theme\), limited palette, x-shaped pupils, high contrast, color contrast, cold colors, arlecchino \(genshin impact\), black theme, gritty, graphite \(medium\)"""
negative_prompt = "nsfw, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro"
image = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
width=832,
height=1216,
num_inference_steps=28,
guidance_scale=5,
generator=torch.Generator().manual_seed(42),
).images[0]
image.save("output.png")
Note : Veuillez vous assurer que Git est installé et que l'environnement est correctement configuré sur votre machine.
Paramètres recommandés
Paramètres
CFG : 4 ~ 5
Étapes : 28 ~ 35
Méthode d'échantillonnage : Euler (⚠️ Les autres échantillonneurs ne fonctionneront pas correctement)
Résolution : Zone totale autour de 1024x1024. Il est préférable de choisir parmi : 768x1344, 832x1216, 896x1152, 1024x1024, 1152x896, 1216x832, 1344x768
Prompts
Préfixe du prompt :
masterpiece, best quality, newest, absurdres, highres, safe,
Prompt négatif :
nsfw, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro
Lignes directrices d'utilisation
Légende
<1famille/1garçon/1autre/...>, <personnage>, <série>, <artistes>, <tags spéciaux>, <tags généraux>, <autres tags>
Tags de qualité
Pour les tags de qualité, nous avons évalué la popularité des images à travers le processus suivant :
Normalisation des données basée sur diverses sources et évaluations.
Application de coefficients de décroissance temporelle selon la date de récence.
Classement des images dans l'ensemble du dataset basé sur ce traitement.
Notre objectif final est de garantir que les tags de qualité suivent efficacement les préférences des utilisateurs ces dernières années.
Gammes en percentileTags de qualité> 95e chef-d'œuvre> 85e, <= 95e meilleure qualité> 60e, <= 85e bonne qualité> 30e, <= 60e qualité normale<= 30e pire qualité
Tags esthétiques
TagDescriptiontrès awaTop 5 % des images en termes de score esthétique par waifu-scorerpire esthétiqueTous les 5 % inférieurs des images en termes de score esthétique par waifu-scorer et aesthetic-shadow-v2......
Tags de date
Il existe deux types de tags de date : tags d'année et tags de période. Pour les tags d'année, utilisez le format year xxxx, par exemple year 2021. Pour les tags de période, veuillez vous référer au tableau suivant :
Plage d'annéesTag de période2005-2010ancien2011-2014début2014-2017milieu2018-2020récent2021-2024plus récent
Dataset
Les images Danbooru les plus récentes jusqu'à la date d'entraînement (approximativement avant 2024-10-23)
Images E621 e621-2024-webp-4Mpixel dataset sur Hugging Face
Communication
Groupes QQ :
657327419
875042008
914818692
635772191
870086562
Discord : Laxhar Dream Lab SDXL NOOB
Comment entraîner un LoRA sur le modèle v-pred SDXL
Un tutoriel destiné aux entraîneurs de LoRA basé sur sd-scripts.
Lien de l'article : https://civitai.com/articles/8723
Outil utilitaire
Laxhar Lab entraîne un modèle ControlNet dédié pour NoobXL, et les modèles sont publiés progressivement. Jusqu'à présent, les modèles normal, profondeur, et canny ont été publiés.
Lien du modèle : https://civitai.com/models/929685
Licence du modèle
La licence de ce modèle hérite de https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0 fair-ai-public-license-1.0-sd et ajoute les termes suivants. Toute utilisation de ce modèle et de ses variantes est soumise à cette licence.
I. Restrictions d'utilisation
Utilisation interdite pour des activités nuisibles, malveillantes ou illégales, y compris mais sans s’y limiter le harcèlement, les menaces et la diffusion de fausses informations.
Interdiction de générer du contenu non éthique ou offensant.
Interdiction de violer les lois et règlements en vigueur dans la juridiction de l'utilisateur.
II. Interdiction commerciale
Nous interdisons toute forme de commercialisation, y compris mais sans s’y limiter à la monétisation ou à l’utilisation commerciale du modèle, des modèles dérivés, ou des produits générés par le modèle.
III. Communauté open source
Pour encourager une communauté open source florissante, les utilisateurs DOIVENT se conformer aux exigences suivantes :
Ouvrir le code des modèles dérivés, modèles fusionnés, LoRAs, et produits basés sur les modèles ci-dessus.
Partager les détails du travail tels que formules de synthèse, prompts, et workflows.
Suivre la fair-ai-public-license afin d’assurer que les œuvres dérivées restent open source.
IV. Avertissement
Les modèles générés peuvent produire des résultats inattendus ou nuisibles. Les utilisateurs doivent assumer tous les risques et conséquences potentielles liés à leur utilisation.
Participants et contributeurs
Participants
L_A_X : Civitai | Liblib.art | Huggingface
li_li : Civitai | Huggingface
nebulae : Civitai | Huggingface
Chenkin : Civitai | Huggingface
Euge : Civitai | Huggingface | Github
Contributeurs
Narugo1992 : Merci à narugo1992 et à l'équipe deepghs pour la mise en open source de divers ensembles d'entraînement, outils de traitement d’images et modèles.
Onommai : Merci à OnommAI pour la mise en open source d'un modèle de base puissant.
V-Prediction : Merci aux personnes suivantes pour leurs instructions détaillées et expériences.
adsfssdf
madmanfourohfour
Communauté : aria1th261, neggles, sdtana, chewing, irldoggo, reoe, kblueleaf, Yidhar, ageless, 白玲可, Creeper, KaerMorh, 吟游诗人, SeASnAkE, zwh20081, Wenaka~喵, 稀里哗啦, 幸运二副, 昨日の約, 445, EBIX, Sopp, Y_X, Minthybasis, Rakosz, 孤辰NULL, 汤人烂, 沅月弯刀,David, 年糕特工队,
Détails du modèle
Type de modèle
Modèle de base
Version du modèle
Hash du modèle
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.
