Femme en bikini blanc et lunettes de soleil se détendant sur un yacht avec la silhouette de Miami en arrière-plan sous un ciel ensoleillé
Femme en robe rouge scintillante avec des lunettes de soleil noires et des cheveux volumineux, debout à côté d'une Lamborghini rouge sous des lumières néon à Miami la nuit.
Femme portant un costume blanc et des lunettes de soleil debout devant des palmiers de Miami et des gratte-ciel de bureaux sous un ciel bleu clair, vue en contre-plongée.
Agent de police style années 1980 portant des lunettes de soleil et une épaisse moustache noire, appuyé contre une voiture de police blanche à Miami, tenant un donut glacé rose avec des palmiers et un immeuble de bureaux en arrière-plan.

Prompts recommandés

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

2005 blog

Paramètres recommandés

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, Heun

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 896x1152

other models

amateurphotov2-000049 (771781fd6719), flux1-dev-Q8_0 (52cfce60d7)

Paramètres haute résolution recommandés

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

10

Conseils

Vous devez expérimenter avec le poids Lora selon vos invites; les poids recommandés varient de 0,3-0,5 à 0,6-1 selon la version.

Les invites détaillées liées à la photographie guident mieux le modèle; utilisez des termes comme photo, photographie, ou incluez des types d'appareil photo ou des dates.

Si des problèmes apparaissent avec les mains, le texte, les personnes en arrière-plan, ou la texture de peau, essayez de réduire le poids Lora.

Vous pouvez aussi générer directement à des résolutions plus élevées comme 1344x1728 si votre configuration le permet.

Les légendes du jeu de données ont été créées avec GPT4o; les légendes détaillées donnent les meilleurs résultats.

Points forts de la version

Invite GPT4o :

Je prévois d'entraîner un LoRA pour le modèle Stable Diffusion texte-image, qui utilise le transformeur T5XXL dans son architecture. Les invites doivent être en langage naturel et suivre un format spécifique. Je vais télécharger des images et j'ai besoin que vous m'aidiez à créer des invites détaillées basées sur ces images. Les invites doivent commencer par "Photographie amateur de" et se terminer par "sur flickr en 2007, blog 2005, blog 2007." Donnez-moi toujours l'invite sous forme de paragraphe unique.
Le format doit être :
Description du sujet : Commencez par décrire en détail toutes les personnes présentes sur l'image. Il est très important d'inclure leur race et ethnicité, attributs physiques (comme la taille, la silhouette, la carnation, la couleur des cheveux), caractéristiques du visage, tenue vestimentaire, ainsi que leurs expressions ou poses. Soyez aussi précis que possible. Veillez toujours à inclure la silhouette des sujets (par exemple, forte, mince, petite) sans l'oublier.
Description de la scène : Décrivez précisément ce que les personnes font dans l'image. Décrivez le cadre, les éléments du fond, les objets avec lesquels elles interagissent, et l'environnement global (urbain, rural, intérieur, extérieur, etc.).
Tags de qualité d'image : Incluez des tags descriptifs qui mettent en avant la qualité de l'image. Utilisez des termes comme léger flou de mouvement, arrière-plan encombré, tons chauds, lumière naturelle vive, fort contraste, couleurs vives, etc. Ces tags doivent aussi refléter l'ambiance et le ressenti de l'image.
Le résultat final doit combiner tous ces éléments en une invite cohérente et détaillée qui reflète fidèlement l'image.

Bonjour à tous, veuillez lire ceci avant d'utiliser la Lora

  • Échelle CFG distillée : 3,5

  • Méthode d'échantillonnage et type de planification : DEIS avec DDIM

  • Pas : 20

  • Résolution : 896x1152

    • Modèle hires fix : 4x_NMKD-Superscale-SP_178000_G

    • Pas : 10

    • Dénombrement : 0,3

    • Montée en échelle par : 1,5

  • Poids Lora : 0,8. Vous devez expérimenter selon vos invites

  • Échelle CFG distillée : 2,5 à 4

  • Méthode d'échantillonnage et type de planification : Heun avec BETA ou DEIS avec DDIM ou [Forge] Flux Realistic (lent) avec Beta / DDIM

  • Pas : >=20 (Parfois j'utilise 20 ou 30 ou 35 ou 40 - Vous devez vérifier à combien de pas l'image converge - Donc, veuillez expérimenter vous-même)

  • Résolution : 896x1152 (Je me suis assuré que cela fonctionne à cette résolution car certains d'entre vous n'aimaient pas quand je disais de générer en haute résolution) - Mais vous devez utiliser hiresfix. Ci-dessous les réglages utilisés dans mes exemples d'images

    • Correction hires : 4x ultrasharp, 0,4 débruitage, 10 pas (Je ne suis pas le meilleur pour la montée en échelle. Si vous avez d'autres méthodes, vous pouvez les utiliser)

    • Vous pouvez aussi générer directement à 1344x1728 si possible

  • Point de contrôle : flux1-dev-Q8_0.gguf (J'utilise celui en Q8. Je ne teste pas cette Lora avec FP8, Q4 ou autres quantifications)

  • Poids Lora : 0,3-0,5. Vous devez expérimenter selon vos invites

  • Invite positive : Aucun mot déclencheur nécessaire. Mais vous devez utiliser des termes photographiques pour guider Flux (comme photo, photographie, etc.). Vous pouvez commencer avec ce qui suit. C'est comme cela que j'ai tagué le jeu de données d'entraînement

    • Photo en plan complet de

    • Photo en plan moyen de

    • Selfie de

    • Photo en gros plan de

    • Ou ce que vous voulez (ajustez les pas, le poids selon votre invite). Les invites détaillées fonctionnent toujours mieux

  • Problèmes : Si cela arrive, veuillez réduire le poids

    • Mains

    • Texte

    • Personnes en arrière-plan

    • Texture de peau - ce n'est pas parfait. Je n'aime pas non plus. J'essaie de trouver des moyens de l'améliorer

Je tiens à remercier tous ceux qui ont donné un pourboire à Buzz et rendu cette version possible. Mention honorable :

  • plectrudecatastrophe

  • Paper_Cranes

  • congo2008

  • Échelle CFG distillée : 2,5 à 4

  • Méthode d'échantillonnage et type de planification : Heun avec BETA ou DEIS avec DDIM ou [Forge] Flux Realistic (lent) avec Beta / DDIM

  • Pas : >=20 (Parfois j'utilise 20 ou 30 ou 35 ou 40 - Vous devez vérifier à combien de pas l'image converge - Donc, veuillez expérimenter vous-même)

  • Résolution : 1344x1728 ou 1248x1824 ou 1440x1800. 896x1152 fonctionne aussi mais vous devez utiliser hires fix

  • Point de contrôle : flux1-dev-Q8_0.gguf (J'utilise celui en Q8. Je ne teste pas cette Lora avec FP8, Q4 ou autres quantifications)

  • Poids Lora : 0,3-0,5 est le point idéal

  • Invite positive : Ces 2 versions n'ont pas besoin de mot déclencheur. Vous pouvez utiliser photo de, photograph de, Shot on iPhone photo de, Cette image présente ou tout ce que vous voulez (voir les exemples postés par d'autres - certains utilisent différentes sortes d'invites et obtiennent de bons résultats) mais après de nombreux tests, j'ai eu de très bons résultats avec le mot déclencheur que j'ai ajouté sur la droite de cette page. Si vous voulez l'utiliser, vous pouvez sinon utiliser ce que vous voulez. Gardez à l'esprit que le jeu de données est toujours légendé avec GPT4O donc les invites détaillées donnent toujours les meilleurs résultats

Je tiens à remercier tous ceux qui ont donné un pourboire à Buzz et rendu cette version possible. Mention honorable :

  • kudzueye

  • Échelle CFG distillée : 2,5 à 4

  • Méthode d'échantillonnage et type de planification : Heun avec BETA ou DEIS avec DDIM ou [Forge] Flux Realistic (lent) avec Beta / DDIM

  • Pas : >=20 (Parfois j'utilise 20 ou 30 ou 35 ou 40 - Vous devez vérifier à combien de pas l'image converge - Donc, veuillez expérimenter vous-même)

  • Résolution : 896x1152 ou 1152x896 ou 1024x1024 (Vous pouvez générer à des résolutions supérieures aussi. Flux et cette lora peuvent le gérer)

  • Point de contrôle : flux1-dev-Q8_0.gguf (J'utilise celui en Q8. Je ne teste pas cette Lora avec FP8, Q4 ou autres quantifications)

  • Poids Lora : 0,6-1

  • Invite positive : Si d'autres invites fonctionnent pour vous avec cette Lora, utilisez-les simplement. Je souligne juste comment je teste la Lora. J'ai vu plusieurs images ici et sur Reddit où les gens utilisent différents types d'invites

    • Commencez toujours par "Photographie amateur de" et terminez par "sur flickr en 2007, blog 2005, blog 2007"

      • L'invite doit être dans ce format pour obtenir les meilleurs résultats : Photographie amateur de <Description du sujet>, <Description de la scène>, <Tags de qualité d'image>, sur flickr en 2007, blog 2005, blog 2007

Comment le jeu de données a-t-il été légendé ? :

  • J'ai légendé le jeu de données d'entraînement en utilisant GPT4o. Les légendes détaillées fonctionnent le mieux avec cette Lora

Si vous aimez cette lora et pouvez faire un don à Buzz, c'est très apprécié

Si vous ne l'aimez pas et avez des retours constructifs, merci de laisser un commentaire expliquant où cela pose problème et j'essaierai de les corriger dans la prochaine version

Si vous n'avez aucun retour constructif à partager et voulez juste vous plaindre de cette Lora, allez ailleurs avec vos commentaires

Précédent
chromeBot robots/portrait cyborg - v0.1
Suivant
Portraits détaillés du Vagabond | FLUX - v1.0

Détails du modèle

Type de modèle

LORA

Modèle de base

Flux.1 D

Version du modèle

v2.0

Hash du modèle

61cff4eebd

Mots entraînés

Amateur photography
on flickr in 2007
2005 blog
2007 blog

Discussion

Veuillez vous log in pour laisser un commentaire.