Vanillaware Stil PonyXL - v0.1
Verwandte Schlüsselwörter & Tags
Empfohlene Prompts
score_9, score_8_up, score_7_up, <lora:vanillawareStyle:1>, 1girl, solo, looking at viewer, full body, light particles
Empfohlene Negative Prompts
thumbnail,3d
3d, bad anatomy, watermark
Empfohlene Parameter
samplers
steps
cfg
clip skip
resolution
vae
other models
Empfohlene Hires (Hochauflösungs-) Parameter
upscaler
upscale
denoising strength
Tipps
Prompt in der Reihenfolge komponieren: [Charaktereigenschaften] + [Stil] + [Ausdruck] + [Kleidung] + [Kamera und Aktion] + [Hintergrund], bei Bedarf anpassen.
Wenn das Bild unscharf ist, "thumbnail" zu negativen Prompts hinzufügen und das Gewicht erhöhen, um die Klarheit zu verbessern.
Das Hinzufügen von '3d' zu negativen Prompts kann die Ergebnisse verbessern.
Das Hinzufügen von Tags wie 'realistisch' oder 'Realismus' kann die Merkmale der Figur verstärken.
Empfohlenes Gewicht zwischen 1,0 und 0,6 einstellen für gewünschtes Charakteraussehen.
Die Qualität des Datensatzes verbessern und sorgfältiges Tagging für besseres Training verwenden.
Tags von Bildern niedrigerer Qualität in negativen Prompts platzieren, um ihren Einfluss während der Generierung zu reduzieren.
Das Training dieses Modells und die von ihm erzeugten Bilder dienen ausschließlich Lernzwecken.
Ich habe nichts gemacht, ich bin nur ein Porter.
Dieses Modell ist eher ein Charakterpaket, dessen Nebeneffekt der mitgelieferte Stil ist.
Es dauerte mehr als 30 Stunden wiederholter Versuche, während der ich fast aufgegeben hätte, aber am Ende erreichte ich einen ausgewogeneren Effekt. Am wichtigsten war, dass meine Trainingsthese bestätigt wurde. In Zukunft könnte ich diese Erfahrungen in einem Artikel zusammenfassen.
Aber Probleme mit schlechten Händen bestehen weiterhin.
Auslöserwort: vanillastyle
Beispielprompts finden Sie in den obigen Bildern.
Die Prompts der vorherigen Modellversion funktionierten größtenteils auch.
Meine Prompts sind grundsätzlich in der Reihenfolge [Charaktereigenschaften] + [Stil] + [Ausdruck] + [Kleidung] + [Kamera und Aktion] + [Hintergrund] aufgebaut, und Sie können diese bei Bedarf löschen oder ändern.
Wenn eine besonders verschwommene Situation vorliegt, ziehen Sie in Erwägung, "thumbnail" zum negativen Prompt hinzuzufügen und das Gewicht zu erhöhen, bis das Bild klar wird.
Das Hinzufügen von '3d' zum negativen Prompt kann ein besseres Ergebnis erzielen, während Tags wie 'realistisch' oder 'Realismus' die Merkmale der Figur verbessern können.
Empfohlenes Gewicht: 1,0~0,6, passen Sie es nach Bedarf an, bis das Aussehen der Figur Ihren Anforderungen entspricht.
Empfohlener Upscale-Wert liegt etwa zwischen 1,2 und 2,0, Denoising-Stärke ist 0,2.
Der Datensatz konzentrierte sich hauptsächlich auf die Werke von George Kamitani.
20240907v0.2
In dieser Version habe ich mehr Bilder getaggt, und bei den übrigen habe ich die Tags entfernt, sodass nur noch die Auslöserwörter bleiben, um Konflikte mit den sorgfältig gesetzten Tags zu vermeiden. (Diese Methode könnte falsch sein.)
Während des Trainingsprozesses gab es viele Fälle, in denen die Bilder im Datensatz durch die Prompts nicht genau dargestellt wurden. Ich versucht verschiedene Tags zu ändern und erneut zu trainieren, mit dem gleichen Ergebnis. Die Wiederholungsrate dieser Bilder im Datensatz ist ebenfalls nicht hoch, es fehlt an Kontinuität.
Schließlich las ich einen Artikel, der erwähnte, die Anzahl der Trainingswiederholungen für bestimmte Charaktere zu erhöhen, um zu verhindern, dass das Modell diese Bilder nicht ausreichend lernt.
Also habe ich alle einzeln vorhandenen Bilder im Datensatz in einen Unterordner gelegt, die Trainingswiederholungen auf 2 gesetzt und die bereits gut gelernten Bilder unverändert gelassen.
Da es jedoch einige Qualitätsprobleme mit diesen diskontinuierlichen Bildern gibt und ich sie vorerst nicht repariert habe, hatte die Erhöhung ihrer Trainingswiederholungen einen gewissen Einfluss auf den Gesamtstil.
Für die nächste Version ist der grundlegendste Ansatz zur Verbesserung, die Qualität des Datensatzes zu erhöhen und außerdem Captioning-Techniken gut zu nutzen, indem man denselben Tag zu leicht minderwertigen Bildern hinzufügt und diese dann alle im negativen Prompt beim Modelllauf platziert.
20240715v0.1
Dieses Modell kann nur als v0.1 betrachtet werden, es ist nicht sehr einfach normalerweise zu verwenden, und ich denke es ist am besten, mehr Bilder im Datensatz detailliert zu taggen für bessere Ergebnisse. In Zukunft werde ich vielleicht langsam das Training dieses Modells abschließen.
Die Leistung dieser Version ist nicht sehr gut, die erzeugten Bilder wirken oft chaotisch.
Ich sammelte über 100 Bilder als Datensatz, aber die Anzahl ist für manuelles Taggen immer noch zu groß. Ich habe zunächst wd1.4 verwendet, um alle Bilder zu taggen, aber die Qualität der Tags ist immer noch nicht gut (vielleicht war meine Anwendung nicht korrekt genug, und ich begrüße Vorschläge von allen).
Weil ich die Ergebnisse schnell sehen wollte, habe ich in diesem Datensatz nur einige Bilder manuell getaggt, die meinen persönlichen Vorlieben entsprechen, daher ist der Ausgabeeffekt des Modells für diese Bilder besser.
Modell-Details
Diskussion
Bitte log in um einen Kommentar zu hinterlassen.






