Animagine XL V3.1 - v3.1
Verwandte Schlüsselwörter & Tags
Empfohlene Prompts
masterpiece, best quality, very aesthetic, absurdres
outdoors, masterpiece, very aesthetic, best quality, absurdres
Empfohlene Negative Prompts
nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]
nsfw, worst quality, low quality
Empfohlene Parameter
samplers
steps
cfg
resolution
other models
Empfohlene Hires (Hochauflösungs-) Parameter
upscaler
upscale
steps
denoising strength
Tipps
Verwenden Sie die strukturierte Prompt-Vorlage: '1girl/1boy, Charaktername, aus welcher Serie, alles andere in beliebiger Reihenfolge.'
Nutzen Sie spezielle Tags für Qualität, Bewertung, Jahr und Ästhetik, um die Generierungsergebnisse genauer zu steuern.
Das Modell ist für Danbooru-Stil Tags optimiert, nicht für natürliche Sprach-Prompts.
Verwenden Sie einen niedrigeren CFG Scale Wert von etwa 5-7 und Sampling-Schritte unter 30 für bessere Qualität.
Die ästhetischen Tags stammen von einem spezialisierten ViT Bildklassifizierungsmodell, das auf Anime-Daten trainiert wurde.
Ersteller-Sponsoren
Tritt dem Cagliostro Lab Server Discord bei: https://discord.gg/cqh9tZgbGc
Wenn du spenden oder uns einen Kaffee kaufen möchtest, kannst du hier spenden
Vielen Dank ^_^
Animagine XL 3.1 ist ein Update der Animagine XL V3 Serie, das die vorherige Version Animagine XL 3.0 verbessert. Dieses Open-Source Anime-Text-zu-Bild-Modell wurde zur Generierung qualitativ hochwertigerer Anime-Bilder weiterentwickelt. Es umfasst eine größere Bandbreite an Charakteren bekannter Anime-Serien, einen optimierten Datensatz und neue ästhetische Tags für eine bessere Bildgestaltung. Basierend auf Stable Diffusion XL zielt Animagine XL 3.1 darauf ab, eine wertvolle Ressource für Anime-Fans, Künstler und Content-Ersteller zu sein, indem es genaue und detaillierte Darstellungen von Anime-Charakteren erzeugt.
Modelldetails
Entwickelt von: Cagliostro Research Lab
In Zusammenarbeit mit: SeaArt.ai
Modelltyp: Diffusionsbasiertes Text-zu-Bild-Generationsmodell
Modellbeschreibung: Animagine XL 3.1 erzeugt hochwertige Anime-Bilder aus Textvorgaben. Es bietet verbesserte Handanatomie, besseres Konzeptverständnis und erweiterte Prompt-Interpretation.
Lizenz: Fair AI Public License 1.0-SD
Feinabgestimmt von: Animagine XL 3.0
Gebrauchsanleitung
Tag-Reihenfolge
Für optimale Ergebnisse wird empfohlen, der strukturierten Prompt-Vorlage zu folgen, da das Modell so trainiert wurde:
1girl/1boy, Charaktername, aus welcher Serie, alles andere in beliebiger Reihenfolge.
Spezielle Tags
Animagine XL 3.1 nutzt spezielle Tags, um das Ergebnis in Bezug auf Qualität, Bewertung, Erstelldatum und Ästhetik zu steuern. Obwohl das Modell auch ohne diese Tags Bilder erzeugen kann, helfen sie, bessere Ergebnisse zu erzielen.
Qualitätsmodifikatoren
Qualitätstags berücksichtigen nun sowohl Scores als auch Beitragsbewertungen, um eine ausgewogene Qualitätsverteilung sicherzustellen. Wir haben Labels für mehr Klarheit verfeinert, z.B. wurde 'high quality' zu 'great quality' geändert.
Qualitätsmodifikator Bewertungskriterium
masterpiece > 95%
best quality > 85% & ≤ 95%
great quality > 75% & ≤ 85%
good quality > 50% & ≤ 75%
normal quality > 25% & ≤ 50%
low quality > 10% & ≤ 25%
worst quality ≤ 10%Bewertungsmodifikatoren
Wir haben unsere Bewertungstags ebenfalls vereinfacht und klarer gestaltet, um globale Regeln zu schaffen, die modellübergreifend anwendbar sind. Beispielsweise lautet der Tag 'rating: general' jetzt einfach 'general' und 'rating: sensitive' wurde zu 'sensitive' verkürzt.
Bewertungsmodifikator Bewertungskriterium
safe Allgemein
sensitive Sensibel
nsfw Fragwürdig
explicit, nsfw ExplizitJahresmodifikator
Der Jahresbereich wurde neu definiert, um Ergebnisse gezielter in Richtung moderner oder Vintage-Anime-Kunststile zu lenken. Dieses Update vereinfacht den Bereich mit Fokus auf Relevanz zu aktuellen und vergangenen Epochen.
Jahrestag Jahresbereich
newest 2021 bis 2024
recent 2018 bis 2020
mid 2015 bis 2017
early 2011 bis 2014
oldest 2005 bis 2010Ästhetische Tags
Unser Tagging-System wurde um ästhetische Tags erweitert, um die Inhaltskategorisierung basierend auf visueller Attraktivität zu verfeinern. Diese Tags stammen von einem spezialisierten ViT (Vision Transformer)-Bildklassifizierungsmodell, das speziell auf Anime-Daten trainiert wurde. Zu diesem Zweck verwendeten wir das Modell shadowlilac/aesthetic-shadow-v2, das den ästhetischen Wert von Inhalten vor dem Training bewertet. Dies stellt sicher, dass jeder Inhalt nicht nur relevant und genau, sondern auch visuell ansprechend ist.
Ästhetik-Tag Bewertungsbereich
very aesthetic > 0.71
aesthetic > 0.45 & < 0.71
displeasing > 0.27 & < 0.45
very displeasing ≤ 0.27Empfohlene Einstellungen
Um das Modell zur Erzeugung ästhetisch hochwertiger Bilder zu lenken, verwenden Sie Negative Prompts wie:
nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]
Für bessere Qualität fügen Sie den Prompts folgende Präfixe hinzu:
masterpiece, best quality, very aesthetic, absurdres
Es wird empfohlen, den Classifier-Free Guidance (CFG Scale) Wert auf etwa 5-7 zu setzen, Sampling-Schritte unter 30 zu verwenden und Euler Ancestral (Euler a) als Sampler zu wählen.
Multi-Aspect-Auflösung
Dieses Modell unterstützt die Bildgenerierung in folgenden Dimensionen:
Dimensionen Seitenverhältnis
1024 x 1024 1:1 Quadrat
1152 x 896 9:7
896 x 1152 7:9
1216 x 832 19:13
832 x 1216 13:19
1344 x 768 7:4 Querformat
768 x 1344 4:7 Hochformat
1536 x 640 12:5 Querformat
640 x 1536 5:12 HochformatDanksagungen
Die Entwicklung und Veröffentlichung von Animagine XL 3.1 wäre ohne die unschätzbare Unterstützung und Beiträge der folgenden Personen und Organisationen nicht möglich gewesen:
SeaArt.ai: Unser Kooperationspartner und Sponsor.
Shadow Lilac: Für die Bereitstellung des ästhetischen Klassifizierungsmodells, aesthetic-shadow-v2.
Derrian Distro: Für ihren benutzerdefinierten Lernraten-Scheduler, adaptiert von LoRA Easy Training Scripts.
Kohya SS: Für ihre umfassenden Trainingsskripte.
Cagliostrolab Kollaborateure: Für ihr Engagement in Modelltraining, Projektmanagement und Datenaufbereitung.
Frühe Tester: Für ihr wertvolles Feedback und Qualitätssicherung.
NovelAI: Für ihren innovativen Ansatz bei der ästhetischen Tagging-Implementierung, der uns als Inspiration diente.
Danke an alle für ihre Unterstützung und Expertise, die Grenzen der Anime-Bilderzeugung zu erweitern.
Beschränkungen
Obwohl Animagine XL 3.1 einen bedeutenden Fortschritt in der Anime-Bildgenerierung darstellt, sollten folgende Einschränkungen beachtet werden:
Anime-Fokus: Dieses Modell ist speziell für die Erzeugung von Anime-Stil Bildern konzipiert und eignet sich nicht für die Erstellung realistischer Fotos.
Prompt-Komplexität: Das Modell ist möglicherweise nicht geeignet für Nutzer, die bei kurzen oder einfachen Prompts hochwertige Ergebnisse erwarten. Der Fokus des Trainings lag auf Konzeptverständnis und nicht auf ästhetischer Verfeinerung, was detailliertere und spezifischere Prompts für bessere Ergebnisse erfordert.
Prompt-Format: Animagine XL 3.1 ist für Danbooru-Stil Tags optimiert und weniger für natürliche Sprachprompts. Für beste Ergebnisse wird empfohlen, die passende Tag- und Syntaxstruktur zu verwenden.
Anatomie und Handdarstellung: Trotz Verbesserungen kann das Modell in diesen Bereichen noch suboptimale Ergebnisse produzieren.
Datensatzgröße: Der Trainingsdatensatz umfasst ca. 870.000 Bilder. Zusammen mit dem Datensatz der vorherigen Version (1,2 Millionen) beträgt die Gesamtdatenmenge etwa 2,1 Millionen Bilder. Obwohl umfangreich, kann diese Datenmenge für ein "ultimatives" Anime-Modell noch als begrenzt angesehen werden.
NSFW-Inhalte: Animagine XL 3.1 wurde so gestaltet, dass NSFW-Inhalte ausgewogener generiert werden. Dennoch kann das Modell weiterhin NSFW-Bilder erzeugen, auch ohne explizite Aufforderung.
Wir geben diese Beschränkungen offen an, um Nutzern realistische Erwartungen zu ermöglichen. Trotz dieser Limitationen stellt das Modell einen bedeutenden Schritt in der Anime-Bildgenerierung dar und bietet Künstlern, Designern und Enthusiasten ein leistungsfähiges Werkzeug.
Lizenz
Basierend auf Animagine XL 3.0 fällt Animagine XL 3.1 unter die Fair AI Public License 1.0-SD, welche kompatibel mit den Lizenzen von Stable Diffusion Modellen ist. Wesentliche Punkte:
Änderungen teilen: Wenn Sie Animagine XL 3.1 modifizieren, müssen Sie sowohl Ihre Änderungen als auch die Original-Lizenz weitergeben.
Quellcodezugang: Bei netzwerkzugänglichen modifizierten Versionen muss ein Zugang (z.B. Downloadlink) zum Quellcode bereitgestellt werden. Dies gilt auch für abgeleitete Modelle.
Vertriebskonditionen: Jede Verbreitung muss unter dieser oder einer ähnlich geregelten Lizenz erfolgen.
Einhaltung: Nicht-Einhaltung ist innerhalb von 30 Tagen zu beheben, um Lizenzaufhebung zu vermeiden, zur Förderung von Transparenz und Open-Source-Werten.
Diese Lizenzwahl soll Animagine XL 3.1 offen und modifizierbar halten und den Geist der Open-Source-Community fördern. Sie schützt Mitwirkende und Nutzer und fördert eine kollaborative sowie ethische Open-Source-Gemeinschaft. So profitiert das Modell nicht nur von gemeinschaftlichem Input, sondern respektiert auch die Freiheiten der Open-Source-Entwicklung.
Zum Schluss ist der Cagliostro Lab Server öffentlich erreichbar unter https://discord.gg/cqh9tZgbGc
Fühlen Sie sich frei, unserem Discord-Server beizutreten.
Wenn Sie spenden oder uns einen Kaffee kaufen möchten, können Sie hier spenden.
Vielen Dank ^_^
Modell-Details
Diskussion
Bitte log in um einen Kommentar zu hinterlassen.
