Vue depuis l'intérieur d'une voiture traversant un quartier suburbain pluvieux avec des maisons américaines lors d'une journée venteuse et couverte, photographiée en style POV à la première personne.
Une femme dans la quarantaine portant une robe fleurie assise sur un banc en bois dans une laverie avec un sol à damier et des machines à laver, sous un éclairage fluorescent.
SUV couvert de neige garé devant un cottage en bois aux fenêtres éclairées durant un blizzard nocturne, entouré de neige et d'arbres dénudés.
Chat tigré gris portant un costume en peluche blanche duveteuse avec des oreilles et un nez roses, ressemblant à une souris ou un petit animal, avec un ruban rose autour du cou.
Homme portant un grand manteau de fourrure marron avec capuche marche dans la neige jusqu'aux genoux pendant une tempête de neige, couvrant son visage avec une main gantée dans une zone résidentielle enneigée.
Portrait d’une femme aux cheveux courts portant un costume fait de découpages de journaux, photographiée un jour nuageux dans une rue de Berne, Suisse, avec un fond flou de personnes et de bâtiments.
Personne portant un fursuit loup anthropomorphe jaune et vert debout dans une maison abandonnée sombre éclairée par un flash, avec un effet de photo granuleuse et de faible qualité.
Paysage de marais présentant un plan d'eau avec des nénuphars verts et des herbes, entouré de grands arbres sous un ciel bleu clair.
Homme mexicain souriant en jean et t-shirt blanc assis sur un trottoir à Los Angeles tenant une bouteille de bière.
Salon confortable avec canapés blancs, papier peint rouge, cheminée en marbre allumée, peintures à l'huile, lampes de table et grandes fenêtres cintrées du sol au plafond avec une tempête de neige à l'extérieur.
Espace de bureau ouvert des années 90 rempli de rangées de cubes, sol en moquette verte, lumières fluorescentes au plafond, et une atmosphère anxieuse.
Un château européen en pierre sombre est posé au sommet d’une colline enneigée dans le brouillard matinal avec une seule fenêtre éclairée montrant une silhouette sombre, entouré d’arbres morts sous un ciel nuageux.

Prompts recommandés

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

Paramètres recommandés

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, DEIS

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 1152x896, 896x1152

other models

amateurphoto-v6-forcu (32f7530463d5), flux1-dev-Q8_0 (52cfce60d7)

Paramètres haute résolution recommandés

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - 4

steps

10

denoising strength

0.25 - 0.3

Conseils

Le poids Lora est ajustable ; expérimentez entre 0.3 et 1 selon la version et l'invite.

Utilisez des invites positives détaillées liées à la photographie pour une meilleure qualité de génération.

Si des problèmes surviennent, comme avec les mains, le texte ou les personnes en arrière-plan, réduisez le poids Lora.

Le dataset a été légendé avec GPT4o pour améliorer la correspondance qualité-invite.

Vous pouvez générer directement à des résolutions plus élevées comme 1344x1728 si votre système le permet.

Pour de meilleurs résultats, vérifiez à combien d'étapes l'image converge en expérimentant avec 20 à 40 étapes.

Bonjour à tous, veuillez lire ceci avant d'utiliser le Lora

  • Échelle CFG distillée : 3.5

  • Méthode d'échantillonnage et type de planning : DEIS avec DDIM

  • Étapes : 20

  • Résolution : 896x1152

    • Modèle hires fix : 4x_NMKD-Superscale-SP_178000_G

    • Étapes : 10

    • Dénégation : 0.3

    • Suréchantillonnage par : 1.5

  • Poids Lora : 0.8. Vous devez expérimenter selon vos invites

  • Échelle CFG distillée : 2.5 à 4

  • Méthode d'échantillonnage et type de planning : Heun avec BETA ou DEIS avec DDIM ou [Forge] Flux Realistic (Slow) avec Beta / DDIM

  • Étapes : >=20 (Parfois j'utilise 20, 30, 35 ou 40 - Vous devriez vérifier à combien d'étapes l'image converge - Alors, expérimentez vous-même)

  • Résolution : 896x1152 (J'ai vérifié que ça fonctionne à cette résolution car certains d'entre vous n'ont pas aimé lorsque j'ai dit de générer en haute résolution) - Mais vous devez utiliser hiresfix. Ci-dessous les réglages que j'ai utilisés pour mes images d'exemple

    • Correction hires : 4x ultrasharp, 0.4 de débruitage, 10 étapes (Je ne suis pas le meilleur en suréchantillonnage. Si vous avez d'autres méthodes, vous pouvez les utiliser)

    • Vous pouvez également générer directement en 1344x1728 si vous le pouvez

  • Point de contrôle : flux1-dev-Q8_0.gguf (J'utilise celui en Q8. Je ne teste pas ce Lora avec FP8, Q4 ou autres quants)

  • Poids Lora : 0.3-0.5. Vous devez expérimenter selon vos invites

  • Invite positive : Pas besoin de mot déclencheur. Mais vous devez utiliser certains termes photographiques pour guider Flux (comme photo, photograph, etc.). Vous pouvez commencer par les suivants. C'est ainsi que j'ai tagué le jeu de données d'entraînement

    • Photo en plan large de

    • Photo en plan moyen de

    • Photo selfie de

    • Photo en gros plan de

    • Ou ce que vous voulez (ajustez les étapes et le poids selon votre invite). Les invites détaillées fonctionnent toujours mieux

  • Problèmes : Si cela arrive, veuillez réduire le poids

    • Mains

    • Texte

    • Personnes en arrière-plan

    • Texture de la peau - ce n'est pas parfait. Je n'aime pas ça non plus. J'essaie de trouver des solutions pour l'améliorer

Je tiens à remercier tous ceux qui ont soutenu Buzz et rendu cette version possible. Remerciements honorables :

  • plectrudecatastrophe

  • Paper_Cranes

  • congo2008

  • Échelle CFG distillée : 2.5 à 4

  • Méthode d'échantillonnage et type de planning : Heun avec BETA ou DEIS avec DDIM ou [Forge] Flux Realistic (Slow) avec Beta / DDIM

  • Étapes : >=20 (Parfois j'utilise 20, 30, 35 ou 40 - Vous devriez vérifier à combien d'étapes l'image converge - Alors, expérimentez vous-même)

  • Résolution : 1344x1728 ou 1248x1824 ou 1440x1800. 896x1152 fonctionne aussi mais vous devez utiliser hires fix

  • Point de contrôle : flux1-dev-Q8_0.gguf (J'utilise celui en Q8. Je ne teste pas ce Lora avec FP8, Q4 ou autres quants)

  • Poids Lora : 0.3-0.5 est l'endroit idéal

  • Invite positive : Ces 2 versions n'ont pas besoin de mot déclencheur. Vous pouvez utiliser photo de, photograph de, photo prise avec un iPhone, Cette image montre, ou tout ce que vous voulez (voir les exemples postés par d'autres - certains utilisent différents types d'invites et obtiennent toujours de bons résultats) mais après beaucoup de tests, j'ai eu de très bons résultats avec le mot déclencheur que j'ai ajouté à droite de cette page. Si vous voulez l'utiliser, vous pouvez sinon utilisez ce que vous voulez. Gardez à l'esprit que le dataset est toujours légendé avec GPT4O donc les invites détaillées donnent toujours les meilleurs résultats

Je tiens à remercier tous ceux qui ont soutenu Buzz et rendu cette version possible. Remerciements honorables :

  • kudzueye

  • Échelle CFG distillée : 2.5 à 4

  • Méthode d'échantillonnage et type de planning : Heun avec BETA ou DEIS avec DDIM ou [Forge] Flux Realistic (Slow) avec Beta / DDIM

  • Étapes : >=20 (Parfois j'utilise 20, 30, 35 ou 40 - Vous devriez vérifier à combien d'étapes l'image converge - Alors, expérimentez vous-même)

  • Résolution : 896x1152 ou 1152x896 ou 1024x1024 (Vous pouvez générer à des résolutions plus élevées aussi. Flux et ce lora peuvent les gérer)

  • Point de contrôle : flux1-dev-Q8_0.gguf (J'utilise celui en Q8. Je ne teste pas ce Lora avec FP8, Q4 ou autres quants)

  • Poids Lora : 0.6-1

  • Invite positive : Si d'autres invites fonctionnent avec ce Lora, utilisez-les. Je souligne juste comment je teste le Lora. J'ai vu plusieurs images ici et sur Reddit où les gens utilisent différents types d'invites

    • Commencez toujours par "Photographie amateur de" et terminez par "sur flickr en 2007, blog 2005, blog 2007"

      • L'invite doit être sous ce format pour obtenir les meilleurs résultats : Photographie amateur de <Description du sujet>, <Description de la scène>, <Tags qualité image>, sur flickr en 2007, blog 2005, blog 2007

Comment le jeu de données a-t-il été légendé ? :

  • J'ai légendé le dataset d'entraînement en utilisant GPT4o. Les légendes détaillées fonctionnent le mieux avec ce Lora

Si vous aimez ce lora et pouvez faire un don à Buzz, c'est très apprécié

Si vous ne l'aimez pas et avez des retours constructifs, veuillez laisser un commentaire expliquant les difficultés et j'essaierai de les corriger dans la prochaine version

Si vous n'avez aucun retour constructif et souhaitez juste vous plaindre de ce Lora, veuillez adresser vos commentaires ailleurs

Précédent
NoobAI-XL Detailer - V-Pred1_V1
Suivant
Dark Side of Light - Synesthesia

Détails du modèle

Type de modèle

LORA

Modèle de base

Flux.1 D

Version du modèle

v6

Hash du modèle

2a485ec548

Discussion

Veuillez vous log in pour laisser un commentaire.