Ein Eisbär steht am Rand eines schneebedeckten Eisbergs in ruhigem arktischem Wasser unter einem bewölkten Himmel.
Scharfes Foto einer weiblichen Touristin in Zentralflorida, die ein Mickey Mouse T-Shirt und Shorts trägt und sich an einem sonnigen Tag in einer Vorstadtsiedlung an einen Palmbaum lehnt.
Gelbes zweistöckiges Vororthaus in Florida, umgeben von Hochwasser, mit Palmen, die sich auf der Wasseroberfläche spiegeln.
Mann gekleidet als Zauberer mit langem weißem Bart, geblümtem spitzem Hut und grünem Gewand, der einen Holzstab hält, auf einer vollen Wohnzimmerparty mit Sofas, Luftballons und Bierflaschen auf dem Boden.

Empfohlene Prompts

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

Empfohlene Parameter

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, DEIS, [Forge] Flux Realistic (Slow)

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 1824x1248, 1344x1728, 1248x1824

other models

amateurphoto-version5-gm (d9ccc813e4d8), flux1-dev-Q8_0 (52cfce60d7)

Empfohlene Hires (Hochauflösungs-) Parameter

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

10

Tipps

Du musst das Lora-Gewicht basierend auf deinen Prompts ausprobieren; empfohlene Gewichte variieren je nach Version zwischen 0,3-0,5 und 0,6-1.

Detaillierte, fotografisch bezogene Prompts lenken das Modell besser; verwende Begriffe wie Foto, Photograph oder nenne Kameratypen oder Daten.

Wenn Probleme mit Händen, Text, Personen im Hintergrund oder Hautstruktur auftreten, versuche das Lora-Gewicht zu reduzieren.

Du kannst auch direkt bei höheren Auflösungen wie 1344x1728 generieren, wenn dein Setup das erlaubt.

Die Dataset-Beschriftungen wurden mit GPT4o erstellt; detaillierte Beschriftungen liefern die besten Ergebnisse.

Versions-Highlights

Kleine Verbesserungen gegenüber v4

Hallo zusammen, bitte lest dies, bevor ihr die Lora benutzt

  • Distilled CFG Scale: 3,5

  • Sampling-Methode und Zeitplan-Typ: DEIS mit DDIM

  • Schritte: 20

  • Auflösung: 896x1152

    • Hires-Fix-Modell: 4x_NMKD-Superscale-SP_178000_G

    • Schritte: 10

    • Rauschreduzierung: 0,3

    • Hochskalierung um: 1,5

  • Lora-Gewicht: 0,8. Du musst basierend auf deinen Prompts experimentieren

  • Distilled CFG Scale: 2,5 bis 4

  • Sampling-Methode und Zeitplan-Typ: Heun mit BETA oder DEIS mit DDIM oder [Forge] Flux Realistic (Langsam) mit Beta / DDIM

  • Schritte: >=20 (Manchmal verwende ich 20, 30, 35 oder 40 - Du solltest prüfen, bei wie vielen Schritten das Bild konvergiert - also bitte selbst experimentieren)

  • Auflösung: 896x1152 (Ich habe sichergestellt, dass es bei dieser Auflösung funktioniert, da es einigen von euch nicht gefiel, wenn ich sagte, bei hohen Auflösungen zu generieren) - Aber du musst hiresfix verwenden. Unten sind die Einstellungen, die ich in meinen Beispielbildern verwendet habe

    • Hires-Fix: 4x Ultrasharp, 0,4 Rauschreduzierung, 10 Schritte (Ich bin nicht der beste für Upscaling. Wenn du andere Upscaling-Methoden hast, kannst du diese verwenden)

    • Du kannst auch direkt bei 1344x1728 generieren, falls möglich

  • Checkpoint: flux1-dev-Q8_0.gguf (Ich verwende die Q8-Version. Ich teste diese Lora nicht mit FP8, Q4 oder anderen Quantisierungen)

  • Lora-Gewicht: 0,3-0,5. Du musst basierend auf deinen Prompts experimentieren

  • Positiver Prompt: Kein Trigger-Wort nötig. Aber du solltest einige Fotografie-Begriffe verwenden, um Flux zu steuern (wie Foto, Photograph etc.). Du kannst mit folgendem beginnen. So habe ich das Trainings-Datenset getaggt

    • Ganzkörperfoto von

    • Mittleres Foto von

    • Selfie-Foto von

    • Nahaufnahmefoto von

    • Oder was auch immer du möchtest (Passe die Schritte und das Gewicht basierend auf deinem Prompt an). Detaillierte Prompts funktionieren immer noch am besten

  • Probleme: Falls solche auftreten, verringere das Gewicht

    • Hände

    • Text

    • Menschen im Hintergrund

    • Hautstruktur – ist nicht perfekt. Ich mag das auch nicht. Ich versuche Verbesserungen zu finden

Ich möchte allen danken, die Buzz unterstützt und diese Version ermöglicht haben. Ehrenvolle Erwähnungen:

  • plectrudecatastrophe

  • Paper_Cranes

  • congo2008

  • Distilled CFG Scale: 2,5 bis 4

  • Sampling-Methode und Zeitplan-Typ: Heun mit BETA oder DEIS mit DDIM oder [Forge] Flux Realistic (Langsam) mit Beta / DDIM

  • Schritte: >=20 (Manchmal verwende ich 20, 30, 35 oder 40 - Du solltest prüfen, bei wie vielen Schritten das Bild konvergiert - also bitte selbst experimentieren)

  • Auflösung: 1344x1728 oder 1248x1824 oder 1440x1800. 896x1152 funktioniert auch, aber du musst hires fix verwenden

  • Checkpoint: flux1-dev-Q8_0.gguf (Ich verwende die Q8-Version. Ich teste diese Lora nicht mit FP8, Q4 oder anderen Quantisierungen)

  • Lora-Gewicht: 0,3-0,5 ist der Sweetspot

  • Positiver Prompt: Diese 2 Versionen benötigen kein Trigger-Wort. Du kannst "photo of", "photograph of", "Shot on iPhone photo of", "This Image features" oder was auch immer du möchtest verwenden (siehe Beispiele von anderen - einige nutzen andere Arten von Prompts und erzielen dennoch gute Ergebnisse). Nach vielen Tests hatte ich sehr gute Resultate mit dem Trigger-Wort, das ich rechts auf dieser Seite hinzugefügt habe. Wenn du es nutzen möchtest, kannst du das tun, ansonsten kannst du alles verwenden, was du möchtest. Denk daran, das Dataset ist weiterhin mit GPT4O betitelt, detaillierte Eingaben geben immer die besten Ergebnisse

Ich möchte allen danken, die Buzz eingeworfen haben und diese Version möglich gemacht haben. Ehrenvolle Erwähnung:

  • kudzueye

  • Distilled CFG Scale: 2,5 bis 4

  • Sampling-Methode und Zeitplan-Typ: Heun mit BETA oder DEIS mit DDIM oder [Forge] Flux Realistic (Langsam) mit Beta / DDIM

  • Schritte: >=20 (Manchmal verwende ich 20, 30, 35 oder 40 - Du solltest prüfen, bei wie vielen Schritten das Bild konvergiert - also bitte selbst experimentieren)

  • Auflösung: 896x1152 oder 1152x896 oder 1024x1024 (Du kannst auch in höheren Auflösungen generieren. Flux und diese Lora können das handhaben)

  • Checkpoint: flux1-dev-Q8_0.gguf (Ich verwende die Q8-Version. Ich teste diese Lora nicht mit FP8, Q4 oder anderen Quantisierungen)

  • Lora-Gewicht: 0,6-1

  • Positiver Prompt: Wenn andere Prompts für dich mit dieser Lora funktionieren, benutze diese einfach. Ich beschreibe nur, wie ich die Lora teste. Ich habe mehrere Bilder hier und bei Reddit gesehen, wo Leute unterschiedliche Prompts nutzen

    • Beginne immer mit "Amateurfotografie von" und beende mit "auf flickr im Jahr 2007, 2005 Blog, 2007 Blog"

      • Der Prompt sollte in diesem Format sein, um die besten Ergebnisse zu erzielen: Amateurfotografie von <Subjektbeschreibung>, <Szenenbeschreibung>, <Bildqualitäts-Tags>, auf flickr im Jahr 2007, 2005 Blog, 2007 Blog

Wie wurde das Dataset betitelt?:

  • Ich habe das Trainings-Dataset mit GPT4o betitelt. Detaillierte Beschriftungen funktionieren am besten mit dieser Lora

Wenn dir diese Lora gefällt und du Buzz spenden kannst, wird das sehr geschätzt

Wenn sie dir nicht gefällt und du konstruktives Feedback hast, hinterlasse bitte einen Kommentar, der erklärt, wo es Probleme gibt, und ich werde versuchen, diese in der nächsten Version zu beheben

Wenn du kein konstruktives Feedback hast und nur jammern willst, dann verschone uns bitte mit deinen Kommentaren

Zurück
ZavyChromaXL - b1
Weiter
Disney Animation [Illustrious & Pony] - [illustrious]

Modell-Details

Modelltyp

LORA

Basismodell

Flux.1 D

Modellversion

v5-beta

Modell-Hash

8840a76daf

Trainierte Wörter

Hack Forums scrapped posted to WhatsApp r/me_irl r/pics Shot on iPhone Bad Quality Sharp photo of

Diskussion

Bitte log in um einen Kommentar zu hinterlassen.