The Araminta Experiment (SDXL+Flux) - Fv3
Empfohlene Prompts
(photography by Jimmy Nelson and Sally Mann:1.0), (anus gaping), eye contact, (petite-bodied African) girl with her ass spread apart, hairy asshole, rear view, beautiful out of focus background
Empfohlene Negative Prompts
child, big boobs, ((watermark)), ((make-up)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb
Empfohlene Parameter
samplers
steps
cfg
Tipps
Für SDXL-Modelle 25+ Schritte verwenden und CFG um 5-7 mit Samplern wie DPM++ 2/3M SDE Karras oder Exponential einstellen.
DPM++ SDE Karras mit weniger Schritten (z.B. 12) und höherem CFG (8-11) für unterschiedliche Ergebnisse ausprobieren.
Euler Ancestral / Normal Sampler können weniger detaillierte Ergebnisse liefern, nützlich bei Fv6 für weniger verrauschte Bilder.
Standardwert für CLIP Skip ist 2; 1 erhöht die Prompt-Einhaltung, 3-4 verbessern manchmal die Konzept-Fokussierung.
CFG des Flux-Modells ist empfindlich; für Fotos niedrigen CFG-Wert (1,5-2,5) verwenden, um den Kunststoff-Haut-Effekt zu vermeiden.
Für raue Stile in Flux niedrigen CFG-Wert (1,5-2,5) beibehalten; für Anime/Comic-Stile ist ein höherer CFG-Wert (3-6+) empfehlenswert.
Versions-Highlights
Verbesserte F-Version mit realistischeren NSFW-Darstellungen: verbessertes Verständnis der Konzepte und bessere Hauttextur (siehe Vergleichsbilder)
Basierend auf Fv2 mit dem Merge von batchXLPHOTOREAL_v1 sowie einigen persönlich trainierten Loras.
Ersteller-Sponsoren
Wenn Ihnen mein Beitrag zu dieser Community gefällt, können Sie mir gerne einen Kaffee spendieren: Je mehr Koffein ich trinke, desto mehr Modelle kann ich erstellen 😅
Wenn Ihnen mein Beitrag zu dieser Community gefällt, können Sie mir gerne einen Kaffee spendieren: Je mehr Koffein ich trinke, desto mehr Modelle kann ich erstellen 😅
Vergleichsgalerie hier: Fv6-Fv5 und NSFW-Illustrationsvergleich zwischen Gv1-Cv6-Fv2.

Aktuelles SOTA-Modell in meinem Experiment:
SDXL Basismodell: Gv4 ist das ausgewogenste Modell, das sowohl realistische als auch gestylte NSFW- und SFW-Bilder ermöglicht. Bessere Ästhetik als Fv6, aber weniger fotorealistisch.
SDXL photorealistisches (SFW und NSFW) Modell: Fv6 ist für Hyperrealismus, einschließlich realistischer NSFW-Bilder, der richtige Weg, bietet jedoch meist nicht die Styling-Fähigkeiten von Gv4.
SDXL Illustration : Gv4 (SFW und NSFW). Cv6 ist jedoch einen Versuch wert, wenn man keine NSFW-Bilder möchte.
Flux-Modell: Flux1-A1
Bildeinstellungen für die SDXL-Modelle
DPM++ 2/3M SDE / Karras oder Exponential sind immer eine gute Wahl mit 25+ Schritten und einem CFG von etwa 5-7. Aber DPM++ SDE / Karras mit weniger Schritten (z.B. 12) und höherem CFG (8-11) ist einen Versuch wert, ebenso wie Euler Ancestral / Normal für ein weniger detailliertes Ergebnis, das mit einem Modell wie Fv6 interessant sein kann, um etwas weniger "rauschiges" zu erhalten.
Der Standard-CLIP Skip von 2 ist auch eine gute Wahl, aber die Verwendung von 1 oder 3-4 ist ebenfalls einen Versuch wert: 1 sorgt für mehr Prompt-Genauigkeit, während 3-4 manchmal bessere Ergebnisse liefern, indem sie sich mehr auf die "Konzepte" konzentrieren.
Bildeinstellungen für Flux-Modelle
Meine bevorzugten Einstellungen sind DPM++ 2M / beta oder sgm_uniform oder DDEIS / normal für Sampler / Scheduler, wobei beta ein mutigeres, stärkeres Bild liefert. Für subtilere Bilder scheinen Euler / simple oder beta eine gute Wahl zu sein.
CFG scheint einen großen Einfluss auf das Endbild zu haben und ist sehr empfindlich, sogar bei kleinen Abweichungen.
Für Fotos sollte CFG niedrig bleiben (1,5-2,5), um einen Kunststoff-Haut-Effekt zu vermeiden.
Für Kunstwerke und Illustrationen ist es komplizierter, da es vom Medium abhängt. Für "raue" Stile (Malerei, Aquarelle usw.) sollte CFG im Bereich 1,5-2,5 bleiben, aber für Anime- oder Comic-Stile muss CFG oft höher eingestellt werden, um den gewünschten Stil zu erreichen (3-6 oder mehr).
Wenn das Bild unordentlich, verformt oder verschwommen ist, liegt das oft daran, dass CFG/Schritte für dieses Bild ungeeignet sind, aber es ist nicht immer einfach zu wissen, ob CFG/Schritte erhöht oder verringert werden müssen (zumindest für mich 😊).
Es gibt sicherlich viel über das Verhalten von Flux zu lernen, das sich stark von SDXL unterscheidet, und wir werden uns anpassen müssen.
Workflow
Alle meine Bilder werden mit eingebettetem ComfyUI-Workflow hochgeladen, der leider mit der Verarbeitung von CivitAI inkompatibel ist, und der Prompt kann meistens nicht zurückgewonnen werden. Sie können jedoch das ursprüngliche PNG-Bild mit dem eingebetteten Workflow herunterladen, indem Sie im Bildbetrachter auf das "DOWNLOAD"-Symbol klicken.
Warum ich meistens Bilder direkt aus meinem Modell veröffentliche, vielleicht mit etwas Lora (meine oder ein Detailverbesserer), verwende ich jetzt manchmal auch Controlnet, um bessere, detailliertere Kompositionen leichter zu erzielen: In diesem Fall ist das Quellbild natürlich nicht Teil des Workflows, aber ich denke, Sie können das von mir veröffentlichte Bild trotzdem als Quelle verwenden, wenn Sie eine Variation erstellen möchten :)
Vergangenheit
Ausgehend von der E-Serie entwickeln sich die Modelle manchmal durch Verschmelzung mit anderen Modellen (dank anderer Mitwirkender!), meist aber durch Training mit meinem eigenen Datensatz: ein bescheidener Datensatz (~2000 Bilder derzeit), aber ich versuche, mit Qualität und Originalität zu kompensieren.
Ab Fv1 habe ich viele synthetische Bilder eingebunden, die ich mit vorherigen Versionen erstellt habe: intensiv mit Prompts gearbeitet und bei Bedarf das Ergebnis in Photoshop retuschiert, um einen Datensatz mit vielen Originalbildern zu haben.
Die Kernidee dieses Modells war, ein vielseitiges Werkzeug zu schaffen, indem einige der besten vorhandenen Modelle, die meinem persönlichen Geschmack entsprechen (Fotografie und Fantasy-Kunst, um es einfach zu machen) kombiniert werden. Meine Hauptziele waren:
Fotorealismus: Die Fähigkeit, beeindruckend realistische Bilder von sowohl Menschen als auch Objekten/Natur zu erzeugen.
Flexibilität: Die Fähigkeit, stark stilisierte Bilder zu erstellen, die künstlerischen Ausdruck durch verschiedene Stile und Kombinationen von Künstlern ermöglichen. Ich gehöre einer älteren Generation an und komme aus Europa, daher bedeutet "Stil" für mich nicht "japanischer kawaii Anime mit Brüsten" oder "DC Comics Cartoon mit vielen Superhelden und üppigen blonden Schönheiten", sondern eher aus der Welt von Frank Frazetta, Milo Manara, Boris Vallejo, H.R.Giger, Wojtek Siudmak und solchen Fantasy-Kunst-Meistern: Es gibt definitiv Brüste, aber der Stil ist etwas anders :P
Da ich es nicht mag, in meiner Erforschung des menschlichen Körpers eingeschränkt zu sein, ist die Idee auch, ein ziemlich leistungsfähiges NSFW-Modell zu haben. Aufgrund der verfügbaren Trainingsbilder in den Datensätzen ist NSFW jedoch oft stark auf Pornofotos oder pornografischen japanischen Anime ausgerichtet, was die Flexibilität beeinträchtigt (typischerweise, sobald das Wort "sexy" im Prompt verwendet wird, muss der Stil mitgewichtet werden). Dieser Punkt ist daher NICHT die Priorität für das Basismodell, wird aber im NSFW-Modell weiter vorangetrieben.
Modell-Details
Diskussion
Bitte log in um einen Kommentar zu hinterlassen.
