Flux.1 D - Beruhigende Atmosphäre - v1.0
Empfohlene Parameter
samplers
steps
cfg
resolution
other models
Empfohlene Hires (Hochauflösungs-) Parameter
steps
Tipps
Verwenden Sie niedrige Stärke-Einstellungen, um unerwünschte Tentakel-ähnliche Verzerrungen zu vermeiden.
LoRA-Feinabstimmung ermöglicht das Auswählen spezifischer Merkmale aus Trainingsbildern und damit einzigartige Bildkombinationen.
Voll trainierte Checkpoints erzeugen oft verzerrte oder anatomisch inkorrekte Ergebnisse, daher sind LoRA-stilisierte Modelle für bessere Resultate zu bevorzugen.
Häufig genutzte thematische Schlüsselwörter sind atmosphärisch, stimmungsvoll, ruhig, beruhigend, gelassen und mysteriös für beste Ergebnisse.
V.2.0
Mehr Bilder und höhere Schrittanzahl hinzugefügt.
Es wird empfohlen, eine niedrige Stärke zu verwenden, sonst verwandelt sich alles aus irgendeinem Grund in ein Tentakelmonster.
Ich wünschte wirklich, sie würden die Pro-Version von Flux herausbringen, da dieses destillierte Zeug schwer zu kontrollieren und in seiner Flexibilität eingeschränkt ist. Wenn man mit einigen Prompts experimentiert, kommt es immer zu einem bestimmten Bild oder etwas, das es gut kennt und auf das es trainiert wurde, was zum typischen steril wirkenden Flux-Look führt (cinematisch, Foto, bestimmte Tiere oder Menschen usw.)
Ich bezweifle auch stark, dass eine der voll trainierten Checkpoints überhaupt funktionieren wird. Ich habe mir nahezu jeden einzelnen angesehen, doch es landet immer bei fehlerhafter Anatomie oder einer starken Voreingenommenheit, die man durch negative Prompts oder Prompt-Gewichtung nicht ausgleichen kann, da Flux diese Methoden nicht verwendet. Ein Bild einer Person, die immer nackt ist, selbst wenn man Kleidung verlangt. Fraglich, ob das in SDXL überhaupt etwas bewirkt hat oder bewirkt, da ich nie viele negative Prompts verwendet habe, aber es war gut genug, um einige unerwünschte Dinge zu vermeiden.
Seltsamerweise funktionieren alle Checkpoints, die mit einem Stil (wie Anime) trainiert oder als LoRA umgesetzt wurden, hervorragend, sogar für realistische Bilder, was ich für nahezu alle meine Bilder benutze (hier nicht, hier benutze ich ausstellungszwecken ein einfaches FP8-Checkpoint)... ziemlich verwirrend.
Trainiert auf einem Datensatz, den ich für SDXL verwenden wollte, aber nie zufriedenstellende Ergebnisse erzielte. Nur ein kleiner Test mit einigen Bildern (vorerst einfache Beschriftungen) und nur 800 Schritten. Das wird später auf natürliche Sprache umgestellt.
Die am häufigsten verwendeten Wörter sollten atmosphärisch, stimmungsvoll, ruhig, beruhigend, gelassen, mysteriös ... und gemischt sein (die Bilder ohne Beschriftung ... naja, das ist eine Beschriftung, ich habe vergessen, dass Kohya den Ordnernamen nimmt, wenn keine .txt-Datei vorhanden ist :D)
Reihenfolge: Die ersten 2 Bilder mit LoRA/ohne LoRA, danach in umgekehrter Reihenfolge
Hat in bestimmten Fällen mehr/weniger Einfluss (vorerst)
Ich habe einige Tests mit den Flux LoRAs gemacht, die ich erstellt habe, und wirklich verrückte Ergebnisse erzielt. Selbst nach nur etwa 100 - 200 Schritten versteht das Modell das Konzept, und eine niedrigere/höhere Stärke als Basis 1 hat immer große Auswirkungen, aber es bleibt immer etwas übrig, und es fühlt sich an, als könne man bestimmte Teile aus den Trainingsbildern auswählen, ohne dass das ganze Bild genutzt wird (als wolle man nur die gelbe Kleidung, aber nichts anderes).
Ich habe bisher etwa 30 LoRAs gemacht (nur zu Testzwecken), und was man mit nur wenigen Bildern erreichen kann, ist verblüffend.
Vielleicht ist es nur ein Zufall, wer weiß.
Modell-Details
Diskussion
Bitte log in um einen Kommentar zu hinterlassen.
