Frau im weißen Bikini und Sonnenbrille entspannt auf einer Yacht mit der Skyline von Miami im Hintergrund unter klarem Sonnenschein
Frau in einem glitzernden roten Kleid mit schwarzen Sonnenbrillen und voluminösem Haar, die neben einem roten Lamborghini unter Neonlichtern in Miami bei Nacht steht.
Frau in weißem Anzug und Sonnenbrille steht vor Miami Palmen und Büro-Wolkenkratzern unter einem strahlend blauen Himmel, aus der Froschperspektive gesehen.
Polizist im Stil der 1980er Jahre mit Sonnenbrille und schwarzen Schnurrbart, lehnt an einem weißen Polizeiauto in Miami, hält einen pink glasierten Donut, im Hintergrund Palmen und Bürogebäude.

Empfohlene Prompts

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

2005 blog

Empfohlene Parameter

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, Heun

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 896x1152

other models

amateurphotov2-000049 (771781fd6719), flux1-dev-Q8_0 (52cfce60d7)

Empfohlene Hires (Hochauflösungs-) Parameter

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

10

Tipps

Sie müssen das Lora-Gewicht basierend auf Ihren Prompts experimentell anpassen; empfohlene Gewichte variieren je nach Version zwischen 0,3-0,5 und 0,6-1.

Detaillierte fotografiebezogene Prompts steuern das Modell besser; verwenden Sie Begriffe wie Foto, Fotografie oder fügen Sie Kameratypen oder Daten hinzu.

Bei Problemen mit Händen, Text, Personen im Hintergrund oder Hautstruktur, versuchen Sie, das Lora-Gewicht zu reduzieren.

Sie können auch direkt in höheren Auflösungen wie 1344x1728 generieren, wenn Ihr Setup dies erlaubt.

Datensatzbeschriftungen wurden mit GPT4o erstellt; detaillierte Beschriftungen liefern die besten Ergebnisse.

Versions-Highlights

GPT4o Prompt:

Ich plane, eine LoRA für das Stable Diffusion Text-zu-Bild Modell zu trainieren, das in seiner Architektur den T5XXL Transformer verwendet. Die Prompts sollen in natürlicher Sprache sein und einem speziellen Format folgen. Ich werde Bilder hochladen und brauche Ihre Hilfe, um basierend auf diesen Bildern detaillierte Prompts zu erstellen. Die Prompts sollen mit "Amateurfotografie von" beginnen und mit "auf flickr in 2007, 2005 Blog, 2007 Blog" enden. Geben Sie mir den Prompt immer in einem einzigen Absatz.
Das Format soll sein:
Subjektbeschreibung: Beginnen Sie damit, alle Personen im Bild detailliert zu beschreiben. Es ist sehr wichtig, ihre Rasse und Ethnie, körperliche Merkmale (wie Größe, Statur, Hautfarbe und Haarfarbe), Gesichtszüge, Kleidung und etwaige Ausdrücke oder Posen genau zu erfassen. Seien Sie so spezifisch wie möglich. Stellen Sie sicher, dass die Statur der Personen immer enthalten ist (z. B. Plus Size, schlank, zierlich).
Szenenbeschreibung: Geben Sie genau an, was die Personen auf dem Bild tun. Beschreiben Sie die Umgebung, Hintergrundelements, alle Objekte, mit denen sie interagieren, und das Gesamtumfeld (urban, ländlich, innen, außen etc.).
Bildqualitäts-Tags: Fügen Sie beschreibende Tags hinzu, die die Qualität des Bildes hervorheben. Verwenden Sie Begriffe wie leichte Bewegungsunschärfe, unordentlicher Hintergrund, warme Farbtöne, helles natürliches Licht, hoher Kontrast, lebendige Farben usw. Diese Tags sollten auch die Stimmung und Atmosphäre des Bildes widerspiegeln.
Das finale Ergebnis soll alle diese Elemente zu einem zusammenhängenden, detaillierten Prompt verbinden, das das Bild genau beschreibt.

Hallo zusammen, bitte lesen Sie dies, bevor Sie die Lora verwenden

  • Distilled CFG Scale: 3,5

  • Sampling-Methode und Zeitplan-Typ: DEIS mit DDIM

  • Schritte: 20

  • Auflösung: 896x1152

    • Hires fix Modell: 4x_NMKD-Superscale-SP_178000_G

    • Schritte: 10

    • Rauschunterdrückung: 0,3

    • Hochskalierung um: 1,5

  • Lora-Gewicht: 0,8. Sie müssen basierend auf Ihren Eingaben experimentieren

  • Distilled CFG Scale: 2,5 bis 4

  • Sampling-Methode und Zeitplan-Typ: Heun mit BETA oder DEIS mit DDIM oder [Forge] Flux Realistic (Langsam) mit Beta / DDIM

  • Schritte: >=20 (Manchmal verwende ich 20, 30, 35 oder 40 - Sie sollten prüfen, bei wie vielen Schritten das Bild konvergiert - Also experimentieren Sie selbst)

  • Auflösung: 896x1152 (Ich habe sichergestellt, dass es bei dieser Auflösung funktioniert, da einige von euch es nicht mochten, als ich sagte bei hohen Auflösungen zu generieren) - Aber Sie müssen hiresfix verwenden. Unten sind die Einstellungen, die ich in meinen Beispielbildern verwendet habe

    • Hires fix: 4x ultrasharp, 0,4 Rauschunterdrückung, 10 Schritte (Ich bin kein Experte für Upscale. Wenn Sie andere Upscaling-Methoden haben, können Sie diese verwenden)

    • Sie können auch direkt bei 1344x1728 generieren, wenn Sie können

  • Checkpoint: flux1-dev-Q8_0.gguf (Ich verwende die Q8-Version. Ich teste diese Lora nicht mit FP8 oder Q4 oder anderen Quantisierungen)

  • Lora-Gewicht: 0,3-0,5. Sie sollten basierend auf Ihren Eingaben experimentieren

  • Positives Prompt: Kein Triggerwort notwendig. Aber Sie müssen einige Fotografie-Begriffe verwenden, um Flux zu steuern (wie Foto, Fotografie etc.). Sie können mit dem Folgenden beginnen. So habe ich den Trainingsdatensatz getaggt

    • Ganzkörperaufnahme von

    • Halbkörperaufnahme von

    • Selfie von

    • Nahaufnahme von

    • Oder was auch immer Sie möchten (passen Sie Schritte, Gewicht basierend auf Ihrem Prompt an). Detaillierte Prompts funktionieren immer noch am besten

  • Probleme: Falls sie auftreten, bitte Gewicht reduzieren

    • Hände

    • Text

    • Personen im Hintergrund

    • Hautstruktur - sie ist nicht perfekt. Mir gefällt sie auch nicht. Ich versuche Wege zu finden, sie zu verbessern

Ich möchte mich bei allen bedanken, die Buzz Trinkgelder gegeben und diese Version ermöglicht haben. Ehrungen gehen an:

  • plectrudecatastrophe

  • Paper_Cranes

  • congo2008

  • Distilled CFG Scale: 2,5 bis 4

  • Sampling-Methode und Zeitplan-Typ: Heun mit BETA oder DEIS mit DDIM oder [Forge] Flux Realistic (Langsam) mit Beta / DDIM

  • Schritte: >=20 (Manchmal verwende ich 20, 30, 35 oder 40 - Sie sollten prüfen, bei wie vielen Schritten das Bild konvergiert - Experimentieren Sie also selbst)

  • Auflösung: 1344x1728 oder 1248x1824 oder 1440x1800. 896x1152 funktioniert auch, aber Sie müssen hires fix verwenden

  • Checkpoint: flux1-dev-Q8_0.gguf (Ich verwende die Q8-Version. Ich teste diese Lora nicht mit FP8 oder Q4 oder anderen Quantisierungen)

  • Lora-Gewicht: 0,3-0,5 ist der ideale Bereich

  • Positives Prompt: Diese 2 Versionen benötigen kein Triggerwort. Sie können photo of, photograph of, Shot on iPhone photo of, This Image features oder was auch immer Sie möchten verwenden (siehe Beispiele von anderen - einige nutzen unterschiedliche Prompts und erzielen trotzdem gute Ergebnisse). Nach vielen Tests hatte ich sehr gute Ergebnisse mit dem Triggerwort, das ich auf der rechten Seite dieser Seite hinzugefügt habe. Wenn Sie es verwenden möchten, können Sie dies tun, ansonsten verwenden Sie was Sie wollen. Bedenken Sie, der Datensatz wurde weiterhin mit GPT4O beschriftet, daher liefern detaillierte Prompts immer die besten Ergebnisse

Ich möchte mich bei allen bedanken, die Buzz Trinkgelder gegeben und diese Version ermöglicht haben. Ehrung geht an:

  • kudzueye

  • Distilled CFG Scale: 2,5 bis 4

  • Sampling-Methode und Zeitplan-Typ: Heun mit BETA oder DEIS mit DDIM oder [Forge] Flux Realistic (Langsam) mit Beta / DDIM

  • Schritte: >=20 (Manchmal verwende ich 20, 30, 35 oder 40 - Prüfen Sie, bei wie vielen Schritten das Bild konvergiert - Experimentieren Sie selbst)

  • Auflösung: 896x1152 oder 1152x896 oder 1024x1024 (Sie können auch in höheren Auflösungen generieren. Flux und diese Lora können das handhaben)

  • Checkpoint: flux1-dev-Q8_0.gguf (Ich verwende die Q8-Version. Ich teste diese Lora nicht mit FP8 oder Q4 oder anderen Quantisierungen)

  • Lora-Gewicht: 0,6-1

  • Positives Prompt: Wenn andere Prompts für Sie mit dieser Lora funktionieren, verwenden Sie diese einfach. Ich hebe nur hervor, wie ich die Lora teste. Ich habe mehrere Bilder hier und auf Reddit gesehen, bei denen Leute unterschiedliche Prompts verwenden

    • Beginnen Sie immer mit "Amateurfotografie von" und enden Sie mit "auf flickr in 2007, 2005 Blog, 2007 Blog"

      • Der Prompt sollte in diesem Format sein, um die besten Ergebnisse zu erzielen: Amateurfotografie von <Subjektsbeschreibung>, <Szenenbeschreibung>, <Bildqualitäts-Tags>, auf flickr in 2007, 2005 Blog, 2007 Blog

Wie wurde der Datensatz beschriftet?:

  • Ich habe den Trainingsdatensatz mit GPT4o beschriftet. Detaillierte Beschriftungen arbeiten am besten mit dieser Lora

Wenn Sie diese Lora mögen und Buzz unterstützen können, wird das sehr geschätzt

Wenn Sie sie nicht mögen und konstruktives Feedback haben, hinterlassen Sie bitte einen Kommentar, der erklärt, wo es Probleme gibt, und ich werde versuchen, diese in der nächsten Version zu beheben

Wenn Sie kein konstruktives Feedback haben und nur meckern wollen, nehmen Sie Ihre Kommentare bitte woanders hin

Zurück
chromeBot Roboter/Cyborg-Porträt - v0.1
Weiter
Wanderer's Detailed Portraits | FLUX - v1.0

Modell-Details

Modelltyp

LORA

Basismodell

Flux.1 D

Modellversion

v2.0

Modell-Hash

61cff4eebd

Trainierte Wörter

Amateur photography
on flickr in 2007
2005 blog
2007 blog

Diskussion

Bitte log in um einen Kommentar zu hinterlassen.