Photographie Amateur [Flux Dev] - v2.0
Mots-clés et tags associés
Prompts recommandés
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
2005 blog
Paramètres recommandés
samplers
steps
cfg
resolution
other models
Paramètres haute résolution recommandés
upscaler
upscale
steps
Conseils
Vous devez expérimenter avec le poids Lora selon vos invites; les poids recommandés varient de 0,3-0,5 à 0,6-1 selon la version.
Les invites détaillées liées à la photographie guident mieux le modèle; utilisez des termes comme photo, photographie, ou incluez des types d'appareil photo ou des dates.
Si des problèmes apparaissent avec les mains, le texte, les personnes en arrière-plan, ou la texture de peau, essayez de réduire le poids Lora.
Vous pouvez aussi générer directement à des résolutions plus élevées comme 1344x1728 si votre configuration le permet.
Les légendes du jeu de données ont été créées avec GPT4o; les légendes détaillées donnent les meilleurs résultats.
Points forts de la version
Invite GPT4o :
Je prévois d'entraîner un LoRA pour le modèle Stable Diffusion texte-image, qui utilise le transformeur T5XXL dans son architecture. Les invites doivent être en langage naturel et suivre un format spécifique. Je vais télécharger des images et j'ai besoin que vous m'aidiez à créer des invites détaillées basées sur ces images. Les invites doivent commencer par "Photographie amateur de" et se terminer par "sur flickr en 2007, blog 2005, blog 2007." Donnez-moi toujours l'invite sous forme de paragraphe unique.Le format doit être :Description du sujet : Commencez par décrire en détail toutes les personnes présentes sur l'image. Il est très important d'inclure leur race et ethnicité, attributs physiques (comme la taille, la silhouette, la carnation, la couleur des cheveux), caractéristiques du visage, tenue vestimentaire, ainsi que leurs expressions ou poses. Soyez aussi précis que possible. Veillez toujours à inclure la silhouette des sujets (par exemple, forte, mince, petite) sans l'oublier.Description de la scène : Décrivez précisément ce que les personnes font dans l'image. Décrivez le cadre, les éléments du fond, les objets avec lesquels elles interagissent, et l'environnement global (urbain, rural, intérieur, extérieur, etc.).Tags de qualité d'image : Incluez des tags descriptifs qui mettent en avant la qualité de l'image. Utilisez des termes comme léger flou de mouvement, arrière-plan encombré, tons chauds, lumière naturelle vive, fort contraste, couleurs vives, etc. Ces tags doivent aussi refléter l'ambiance et le ressenti de l'image.Le résultat final doit combiner tous ces éléments en une invite cohérente et détaillée qui reflète fidèlement l'image.Bonjour à tous, veuillez lire ceci avant d'utiliser la Lora
Paramètres recommandés (v6) :
Échelle CFG distillée : 3,5
Méthode d'échantillonnage et type de planification : DEIS avec DDIM
Pas : 20
Résolution : 896x1152
Modèle hires fix : 4x_NMKD-Superscale-SP_178000_G
Pas : 10
Dénombrement : 0,3
Montée en échelle par : 1,5
Poids Lora : 0,8. Vous devez expérimenter selon vos invites
Paramètres recommandés (v5-final) :
Échelle CFG distillée : 2,5 à 4
Méthode d'échantillonnage et type de planification : Heun avec BETA ou DEIS avec DDIM ou [Forge] Flux Realistic (lent) avec Beta / DDIM
Pas : >=20 (Parfois j'utilise 20 ou 30 ou 35 ou 40 - Vous devez vérifier à combien de pas l'image converge - Donc, veuillez expérimenter vous-même)
Résolution : 896x1152 (Je me suis assuré que cela fonctionne à cette résolution car certains d'entre vous n'aimaient pas quand je disais de générer en haute résolution) - Mais vous devez utiliser hiresfix. Ci-dessous les réglages utilisés dans mes exemples d'images
Correction hires : 4x ultrasharp, 0,4 débruitage, 10 pas (Je ne suis pas le meilleur pour la montée en échelle. Si vous avez d'autres méthodes, vous pouvez les utiliser)
Vous pouvez aussi générer directement à 1344x1728 si possible
Point de contrôle : flux1-dev-Q8_0.gguf (J'utilise celui en Q8. Je ne teste pas cette Lora avec FP8, Q4 ou autres quantifications)
Poids Lora : 0,3-0,5. Vous devez expérimenter selon vos invites
Invite positive : Aucun mot déclencheur nécessaire. Mais vous devez utiliser des termes photographiques pour guider Flux (comme photo, photographie, etc.). Vous pouvez commencer avec ce qui suit. C'est comme cela que j'ai tagué le jeu de données d'entraînement
Photo en plan complet de
Photo en plan moyen de
Selfie de
Photo en gros plan de
Ou ce que vous voulez (ajustez les pas, le poids selon votre invite). Les invites détaillées fonctionnent toujours mieux
Problèmes : Si cela arrive, veuillez réduire le poids
Mains
Texte
Personnes en arrière-plan
Texture de peau - ce n'est pas parfait. Je n'aime pas non plus. J'essaie de trouver des moyens de l'améliorer
Je tiens à remercier tous ceux qui ont donné un pourboire à Buzz et rendu cette version possible. Mention honorable :
plectrudecatastrophe
Paper_Cranes
congo2008
Paramètres recommandés (v4-soap-testing et v5-beta) :
Échelle CFG distillée : 2,5 à 4
Méthode d'échantillonnage et type de planification : Heun avec BETA ou DEIS avec DDIM ou [Forge] Flux Realistic (lent) avec Beta / DDIM
Pas : >=20 (Parfois j'utilise 20 ou 30 ou 35 ou 40 - Vous devez vérifier à combien de pas l'image converge - Donc, veuillez expérimenter vous-même)
Résolution : 1344x1728 ou 1248x1824 ou 1440x1800. 896x1152 fonctionne aussi mais vous devez utiliser hires fix
Point de contrôle : flux1-dev-Q8_0.gguf (J'utilise celui en Q8. Je ne teste pas cette Lora avec FP8, Q4 ou autres quantifications)
Poids Lora : 0,3-0,5 est le point idéal
Invite positive : Ces 2 versions n'ont pas besoin de mot déclencheur. Vous pouvez utiliser photo de, photograph de, Shot on iPhone photo de, Cette image présente ou tout ce que vous voulez (voir les exemples postés par d'autres - certains utilisent différentes sortes d'invites et obtiennent de bons résultats) mais après de nombreux tests, j'ai eu de très bons résultats avec le mot déclencheur que j'ai ajouté sur la droite de cette page. Si vous voulez l'utiliser, vous pouvez sinon utiliser ce que vous voulez. Gardez à l'esprit que le jeu de données est toujours légendé avec GPT4O donc les invites détaillées donnent toujours les meilleurs résultats
Je tiens à remercier tous ceux qui ont donné un pourboire à Buzz et rendu cette version possible. Mention honorable :
kudzueye
Paramètres recommandés (v3 et v2) :
Échelle CFG distillée : 2,5 à 4
Méthode d'échantillonnage et type de planification : Heun avec BETA ou DEIS avec DDIM ou [Forge] Flux Realistic (lent) avec Beta / DDIM
Pas : >=20 (Parfois j'utilise 20 ou 30 ou 35 ou 40 - Vous devez vérifier à combien de pas l'image converge - Donc, veuillez expérimenter vous-même)
Résolution : 896x1152 ou 1152x896 ou 1024x1024 (Vous pouvez générer à des résolutions supérieures aussi. Flux et cette lora peuvent le gérer)
Point de contrôle : flux1-dev-Q8_0.gguf (J'utilise celui en Q8. Je ne teste pas cette Lora avec FP8, Q4 ou autres quantifications)
Poids Lora : 0,6-1
Invite positive : Si d'autres invites fonctionnent pour vous avec cette Lora, utilisez-les simplement. Je souligne juste comment je teste la Lora. J'ai vu plusieurs images ici et sur Reddit où les gens utilisent différents types d'invites
Commencez toujours par "Photographie amateur de" et terminez par "sur flickr en 2007, blog 2005, blog 2007"
L'invite doit être dans ce format pour obtenir les meilleurs résultats : Photographie amateur de <Description du sujet>, <Description de la scène>, <Tags de qualité d'image>, sur flickr en 2007, blog 2005, blog 2007
Comment le jeu de données a-t-il été légendé ? :
J'ai légendé le jeu de données d'entraînement en utilisant GPT4o. Les légendes détaillées fonctionnent le mieux avec cette Lora
Si vous aimez cette lora et pouvez faire un don à Buzz, c'est très apprécié
Si vous ne l'aimez pas et avez des retours constructifs, merci de laisser un commentaire expliquant où cela pose problème et j'essaierai de les corriger dans la prochaine version
Si vous n'avez aucun retour constructif à partager et voulez juste vous plaindre de cette Lora, allez ailleurs avec vos commentaires
Détails du modèle
Type de modèle
Modèle de base
Version du modèle
Hash du modèle
Mots entraînés
Créateur
Discussion
Veuillez vous log in pour laisser un commentaire.






