Amateurfotografie [Flux Dev] - v2.0
Verwandte Schlüsselwörter & Tags
Empfohlene Prompts
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
2005 blog
Empfohlene Parameter
samplers
steps
cfg
resolution
other models
Empfohlene Hires (Hochauflösungs-) Parameter
upscaler
upscale
steps
Tipps
Sie müssen das Lora-Gewicht basierend auf Ihren Prompts experimentell anpassen; empfohlene Gewichte variieren je nach Version zwischen 0,3-0,5 und 0,6-1.
Detaillierte fotografiebezogene Prompts steuern das Modell besser; verwenden Sie Begriffe wie Foto, Fotografie oder fügen Sie Kameratypen oder Daten hinzu.
Bei Problemen mit Händen, Text, Personen im Hintergrund oder Hautstruktur, versuchen Sie, das Lora-Gewicht zu reduzieren.
Sie können auch direkt in höheren Auflösungen wie 1344x1728 generieren, wenn Ihr Setup dies erlaubt.
Datensatzbeschriftungen wurden mit GPT4o erstellt; detaillierte Beschriftungen liefern die besten Ergebnisse.
Versions-Highlights
GPT4o Prompt:
Ich plane, eine LoRA für das Stable Diffusion Text-zu-Bild Modell zu trainieren, das in seiner Architektur den T5XXL Transformer verwendet. Die Prompts sollen in natürlicher Sprache sein und einem speziellen Format folgen. Ich werde Bilder hochladen und brauche Ihre Hilfe, um basierend auf diesen Bildern detaillierte Prompts zu erstellen. Die Prompts sollen mit "Amateurfotografie von" beginnen und mit "auf flickr in 2007, 2005 Blog, 2007 Blog" enden. Geben Sie mir den Prompt immer in einem einzigen Absatz.Das Format soll sein:Subjektbeschreibung: Beginnen Sie damit, alle Personen im Bild detailliert zu beschreiben. Es ist sehr wichtig, ihre Rasse und Ethnie, körperliche Merkmale (wie Größe, Statur, Hautfarbe und Haarfarbe), Gesichtszüge, Kleidung und etwaige Ausdrücke oder Posen genau zu erfassen. Seien Sie so spezifisch wie möglich. Stellen Sie sicher, dass die Statur der Personen immer enthalten ist (z. B. Plus Size, schlank, zierlich).Szenenbeschreibung: Geben Sie genau an, was die Personen auf dem Bild tun. Beschreiben Sie die Umgebung, Hintergrundelements, alle Objekte, mit denen sie interagieren, und das Gesamtumfeld (urban, ländlich, innen, außen etc.).Bildqualitäts-Tags: Fügen Sie beschreibende Tags hinzu, die die Qualität des Bildes hervorheben. Verwenden Sie Begriffe wie leichte Bewegungsunschärfe, unordentlicher Hintergrund, warme Farbtöne, helles natürliches Licht, hoher Kontrast, lebendige Farben usw. Diese Tags sollten auch die Stimmung und Atmosphäre des Bildes widerspiegeln.Das finale Ergebnis soll alle diese Elemente zu einem zusammenhängenden, detaillierten Prompt verbinden, das das Bild genau beschreibt.Hallo zusammen, bitte lesen Sie dies, bevor Sie die Lora verwenden
Empfohlene Einstellungen (v6):
Distilled CFG Scale: 3,5
Sampling-Methode und Zeitplan-Typ: DEIS mit DDIM
Schritte: 20
Auflösung: 896x1152
Hires fix Modell: 4x_NMKD-Superscale-SP_178000_G
Schritte: 10
Rauschunterdrückung: 0,3
Hochskalierung um: 1,5
Lora-Gewicht: 0,8. Sie müssen basierend auf Ihren Eingaben experimentieren
Empfohlene Einstellungen (v5-final):
Distilled CFG Scale: 2,5 bis 4
Sampling-Methode und Zeitplan-Typ: Heun mit BETA oder DEIS mit DDIM oder [Forge] Flux Realistic (Langsam) mit Beta / DDIM
Schritte: >=20 (Manchmal verwende ich 20, 30, 35 oder 40 - Sie sollten prüfen, bei wie vielen Schritten das Bild konvergiert - Also experimentieren Sie selbst)
Auflösung: 896x1152 (Ich habe sichergestellt, dass es bei dieser Auflösung funktioniert, da einige von euch es nicht mochten, als ich sagte bei hohen Auflösungen zu generieren) - Aber Sie müssen hiresfix verwenden. Unten sind die Einstellungen, die ich in meinen Beispielbildern verwendet habe
Hires fix: 4x ultrasharp, 0,4 Rauschunterdrückung, 10 Schritte (Ich bin kein Experte für Upscale. Wenn Sie andere Upscaling-Methoden haben, können Sie diese verwenden)
Sie können auch direkt bei 1344x1728 generieren, wenn Sie können
Checkpoint: flux1-dev-Q8_0.gguf (Ich verwende die Q8-Version. Ich teste diese Lora nicht mit FP8 oder Q4 oder anderen Quantisierungen)
Lora-Gewicht: 0,3-0,5. Sie sollten basierend auf Ihren Eingaben experimentieren
Positives Prompt: Kein Triggerwort notwendig. Aber Sie müssen einige Fotografie-Begriffe verwenden, um Flux zu steuern (wie Foto, Fotografie etc.). Sie können mit dem Folgenden beginnen. So habe ich den Trainingsdatensatz getaggt
Ganzkörperaufnahme von
Halbkörperaufnahme von
Selfie von
Nahaufnahme von
Oder was auch immer Sie möchten (passen Sie Schritte, Gewicht basierend auf Ihrem Prompt an). Detaillierte Prompts funktionieren immer noch am besten
Probleme: Falls sie auftreten, bitte Gewicht reduzieren
Hände
Text
Personen im Hintergrund
Hautstruktur - sie ist nicht perfekt. Mir gefällt sie auch nicht. Ich versuche Wege zu finden, sie zu verbessern
Ich möchte mich bei allen bedanken, die Buzz Trinkgelder gegeben und diese Version ermöglicht haben. Ehrungen gehen an:
plectrudecatastrophe
Paper_Cranes
congo2008
Empfohlene Einstellungen (v4-soap-testing und v5-beta):
Distilled CFG Scale: 2,5 bis 4
Sampling-Methode und Zeitplan-Typ: Heun mit BETA oder DEIS mit DDIM oder [Forge] Flux Realistic (Langsam) mit Beta / DDIM
Schritte: >=20 (Manchmal verwende ich 20, 30, 35 oder 40 - Sie sollten prüfen, bei wie vielen Schritten das Bild konvergiert - Experimentieren Sie also selbst)
Auflösung: 1344x1728 oder 1248x1824 oder 1440x1800. 896x1152 funktioniert auch, aber Sie müssen hires fix verwenden
Checkpoint: flux1-dev-Q8_0.gguf (Ich verwende die Q8-Version. Ich teste diese Lora nicht mit FP8 oder Q4 oder anderen Quantisierungen)
Lora-Gewicht: 0,3-0,5 ist der ideale Bereich
Positives Prompt: Diese 2 Versionen benötigen kein Triggerwort. Sie können photo of, photograph of, Shot on iPhone photo of, This Image features oder was auch immer Sie möchten verwenden (siehe Beispiele von anderen - einige nutzen unterschiedliche Prompts und erzielen trotzdem gute Ergebnisse). Nach vielen Tests hatte ich sehr gute Ergebnisse mit dem Triggerwort, das ich auf der rechten Seite dieser Seite hinzugefügt habe. Wenn Sie es verwenden möchten, können Sie dies tun, ansonsten verwenden Sie was Sie wollen. Bedenken Sie, der Datensatz wurde weiterhin mit GPT4O beschriftet, daher liefern detaillierte Prompts immer die besten Ergebnisse
Ich möchte mich bei allen bedanken, die Buzz Trinkgelder gegeben und diese Version ermöglicht haben. Ehrung geht an:
kudzueye
Empfohlene Einstellungen (v3 und v2):
Distilled CFG Scale: 2,5 bis 4
Sampling-Methode und Zeitplan-Typ: Heun mit BETA oder DEIS mit DDIM oder [Forge] Flux Realistic (Langsam) mit Beta / DDIM
Schritte: >=20 (Manchmal verwende ich 20, 30, 35 oder 40 - Prüfen Sie, bei wie vielen Schritten das Bild konvergiert - Experimentieren Sie selbst)
Auflösung: 896x1152 oder 1152x896 oder 1024x1024 (Sie können auch in höheren Auflösungen generieren. Flux und diese Lora können das handhaben)
Checkpoint: flux1-dev-Q8_0.gguf (Ich verwende die Q8-Version. Ich teste diese Lora nicht mit FP8 oder Q4 oder anderen Quantisierungen)
Lora-Gewicht: 0,6-1
Positives Prompt: Wenn andere Prompts für Sie mit dieser Lora funktionieren, verwenden Sie diese einfach. Ich hebe nur hervor, wie ich die Lora teste. Ich habe mehrere Bilder hier und auf Reddit gesehen, bei denen Leute unterschiedliche Prompts verwenden
Beginnen Sie immer mit "Amateurfotografie von" und enden Sie mit "auf flickr in 2007, 2005 Blog, 2007 Blog"
Der Prompt sollte in diesem Format sein, um die besten Ergebnisse zu erzielen: Amateurfotografie von <Subjektsbeschreibung>, <Szenenbeschreibung>, <Bildqualitäts-Tags>, auf flickr in 2007, 2005 Blog, 2007 Blog
Wie wurde der Datensatz beschriftet?:
Ich habe den Trainingsdatensatz mit GPT4o beschriftet. Detaillierte Beschriftungen arbeiten am besten mit dieser Lora
Wenn Sie diese Lora mögen und Buzz unterstützen können, wird das sehr geschätzt
Wenn Sie sie nicht mögen und konstruktives Feedback haben, hinterlassen Sie bitte einen Kommentar, der erklärt, wo es Probleme gibt, und ich werde versuchen, diese in der nächsten Version zu beheben
Wenn Sie kein konstruktives Feedback haben und nur meckern wollen, nehmen Sie Ihre Kommentare bitte woanders hin
Modell-Details
Modelltyp
Basismodell
Modellversion
Modell-Hash
Trainierte Wörter
Ersteller
Diskussion
Bitte log in um einen Kommentar zu hinterlassen.






