Porträt einer Frau mit feuerrotem Haar und leuchtend roten Augen, umgeben von wirbelnden Flammen, Oberkörper sichtbar mit nackten Schultern.
Eine Ganzkörperansicht eines männlichen Schülers in schwarzer Gakuran-Uniform mit grünem Hemd, der im Freien auf einem mit Herbstblättern bedeckten Bürgersteig steht, nach oben blickt, eine Tasche hält, begleitet von einer schwarzen Katze.
Eine reife blonde Frau mit mehrfarbigem Haar und leuchtenden, feurigen Augen, die randlose Brillen und einen schwarzen Businessanzug mit rotem Hemd und Krawatte trägt, umgeben von wirbelnden Flammen und Glut.
Asuka Langley, eine Anime-Figur, steht selbstbewusst in einem glänzenden roten Plugsuit mit langen braunen Haaren und lächelt zwischen zerstörten Stadtgebäuden unter einem blauen Himmel.
Nahaufnahme eines Anime-Mädchens mit Wolfsohren, fließendem schwarz-orangefarbenem Haar, roten Augen, das ein schwarzes schulterfreies Kleid trägt und in einer regnerischen Straßenszene steht.
Ein dunkler Fantasy-Nekromanten-Ritter in blutbefleckter Rüstung, der ein Großschwert in Paradehaltung auf einem vom Regen durchnässten mittelalterlichen Schlachtfeld mit großem vollem rotem Mond und brennenden Gebäuden im Hintergrund hält.
Eine rot-schwarze Skizze eines Drachens, der nachts im Regen über einer Person schwebt.
Farbenfrohes Cyberpunk-Mädchen mit blau-orangefarbenem Haar, das einen lebhaften Bodysuit trägt, dargestellt in einem dynamischen Comic-Stil mit abstraktem Hintergrund.
Eine schöne Landschaftsübersicht mit blauem Himmel, Bergplateau mit grünen Feldern, umgeben von Wolken und einem entfernten Tal.
Wunderschön handgemaltes Tinten- und Aquarell-Doodle eines grauhaarigen Mädchens mit Zwillingsschwänzen, das ein süßes Huhn hält, vor einem Hintergrund mit Regen und tropfenden Wolken.
Futuristische weibliche Kriegerin in einem Miko-Motiv-Exoskelettanzug, die eine Gasmaske trägt und eine leuchtend rote Klinge führt, beleuchtet von kinoreifer Beleuchtung in einer dunklen Stadtlandschaft.
Eine neonbeleuchtete futuristische Landschaft, inspiriert von Cyberpunk-Anime der 1990er, mit einer Einzelperson, die große, neonbedeckte Gebäude auf Hügeln bei Dämmerung in Texas überblickt.

Empfohlene Prompts

masterpiece, best quality, very aesthetic, absurdres

outdoors, masterpiece, very aesthetic, best quality, absurdres

Empfohlene Negative Prompts

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

nsfw, worst quality, low quality

Empfohlene Parameter

samplers

Euler Ancestral (Euler a), Euler a

steps

28 - 30

cfg

5 - 7

resolution

1024x1024, 1152x896, 896x1152, 1216x832, 832x1216, 1344x768, 768x1344, 1536x640, 640x1536, 896x1152, 1216x832

other models

animagine-xl-3.1 (9f86289b6a)

Empfohlene Hires (Hochauflösungs-) Parameter

upscaler

Latent (nearest-exact), R-ESRGAN 4x+ Anime6B

upscale

1.5

steps

15 - 30

denoising strength

0.4 - 0.55

Tipps

Verwenden Sie die strukturierte Prompt-Vorlage: '1girl/1boy, Charaktername, aus welcher Serie, alles andere in beliebiger Reihenfolge.'

Nutzen Sie spezielle Tags für Qualität, Bewertung, Jahr und Ästhetik, um die Generierungsergebnisse genauer zu steuern.

Das Modell ist für Danbooru-Stil Tags optimiert, nicht für natürliche Sprach-Prompts.

Verwenden Sie einen niedrigeren CFG Scale Wert von etwa 5-7 und Sampling-Schritte unter 30 für bessere Qualität.

Die ästhetischen Tags stammen von einem spezialisierten ViT Bildklassifizierungsmodell, das auf Anime-Daten trainiert wurde.

Ersteller-Sponsoren

Tritt dem Cagliostro Lab Server Discord bei: https://discord.gg/cqh9tZgbGc

Wenn du spenden oder uns einen Kaffee kaufen möchtest, kannst du hier spenden

Vielen Dank ^_^

Animagine XL 3.1 ist ein Update der Animagine XL V3 Serie, das die vorherige Version Animagine XL 3.0 verbessert. Dieses Open-Source Anime-Text-zu-Bild-Modell wurde zur Generierung qualitativ hochwertigerer Anime-Bilder weiterentwickelt. Es umfasst eine größere Bandbreite an Charakteren bekannter Anime-Serien, einen optimierten Datensatz und neue ästhetische Tags für eine bessere Bildgestaltung. Basierend auf Stable Diffusion XL zielt Animagine XL 3.1 darauf ab, eine wertvolle Ressource für Anime-Fans, Künstler und Content-Ersteller zu sein, indem es genaue und detaillierte Darstellungen von Anime-Charakteren erzeugt.

Modelldetails

  • Entwickelt von: Cagliostro Research Lab

  • In Zusammenarbeit mit: SeaArt.ai

  • Modelltyp: Diffusionsbasiertes Text-zu-Bild-Generationsmodell

  • Modellbeschreibung: Animagine XL 3.1 erzeugt hochwertige Anime-Bilder aus Textvorgaben. Es bietet verbesserte Handanatomie, besseres Konzeptverständnis und erweiterte Prompt-Interpretation.

  • Lizenz: Fair AI Public License 1.0-SD

  • Feinabgestimmt von: Animagine XL 3.0

Gebrauchsanleitung

Tag-Reihenfolge

Für optimale Ergebnisse wird empfohlen, der strukturierten Prompt-Vorlage zu folgen, da das Modell so trainiert wurde:

1girl/1boy, Charaktername, aus welcher Serie, alles andere in beliebiger Reihenfolge.

Spezielle Tags

Animagine XL 3.1 nutzt spezielle Tags, um das Ergebnis in Bezug auf Qualität, Bewertung, Erstelldatum und Ästhetik zu steuern. Obwohl das Modell auch ohne diese Tags Bilder erzeugen kann, helfen sie, bessere Ergebnisse zu erzielen.

Qualitätsmodifikatoren

Qualitätstags berücksichtigen nun sowohl Scores als auch Beitragsbewertungen, um eine ausgewogene Qualitätsverteilung sicherzustellen. Wir haben Labels für mehr Klarheit verfeinert, z.B. wurde 'high quality' zu 'great quality' geändert.


Qualitätsmodifikator	Bewertungskriterium
masterpiece	        > 95%
best quality	        > 85% & ≤ 95%
great quality	        > 75% & ≤ 85%
good quality	        > 50% & ≤ 75%
normal quality	        > 25% & ≤ 50%
low quality	        > 10% & ≤ 25%
worst quality	        ≤ 10%

Bewertungsmodifikatoren

Wir haben unsere Bewertungstags ebenfalls vereinfacht und klarer gestaltet, um globale Regeln zu schaffen, die modellübergreifend anwendbar sind. Beispielsweise lautet der Tag 'rating: general' jetzt einfach 'general' und 'rating: sensitive' wurde zu 'sensitive' verkürzt.


Bewertungsmodifikator	Bewertungskriterium
safe	            Allgemein
sensitive	    Sensibel
nsfw	            Fragwürdig
explicit, nsfw	    Explizit

Jahresmodifikator

Der Jahresbereich wurde neu definiert, um Ergebnisse gezielter in Richtung moderner oder Vintage-Anime-Kunststile zu lenken. Dieses Update vereinfacht den Bereich mit Fokus auf Relevanz zu aktuellen und vergangenen Epochen.


Jahrestag	Jahresbereich
newest	        2021 bis 2024
recent	        2018 bis 2020
mid	        2015 bis 2017
early	        2011 bis 2014
oldest	        2005 bis 2010

Ästhetische Tags

Unser Tagging-System wurde um ästhetische Tags erweitert, um die Inhaltskategorisierung basierend auf visueller Attraktivität zu verfeinern. Diese Tags stammen von einem spezialisierten ViT (Vision Transformer)-Bildklassifizierungsmodell, das speziell auf Anime-Daten trainiert wurde. Zu diesem Zweck verwendeten wir das Modell shadowlilac/aesthetic-shadow-v2, das den ästhetischen Wert von Inhalten vor dem Training bewertet. Dies stellt sicher, dass jeder Inhalt nicht nur relevant und genau, sondern auch visuell ansprechend ist.


Ästhetik-Tag	       Bewertungsbereich
very aesthetic	       > 0.71
aesthetic	       > 0.45 & < 0.71
displeasing	       > 0.27 & < 0.45
very displeasing       ≤ 0.27

Empfohlene Einstellungen

Um das Modell zur Erzeugung ästhetisch hochwertiger Bilder zu lenken, verwenden Sie Negative Prompts wie:

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

Für bessere Qualität fügen Sie den Prompts folgende Präfixe hinzu:

masterpiece, best quality, very aesthetic, absurdres

Es wird empfohlen, den Classifier-Free Guidance (CFG Scale) Wert auf etwa 5-7 zu setzen, Sampling-Schritte unter 30 zu verwenden und Euler Ancestral (Euler a) als Sampler zu wählen.

Multi-Aspect-Auflösung

Dieses Modell unterstützt die Bildgenerierung in folgenden Dimensionen:

Dimensionen	Seitenverhältnis
1024 x 1024	1:1 Quadrat
1152 x 896	9:7
896 x 1152	7:9
1216 x 832	19:13
832 x 1216	13:19
1344 x 768	7:4 Querformat
768 x 1344	4:7 Hochformat
1536 x 640	12:5 Querformat
640 x 1536	5:12 Hochformat

Danksagungen

Die Entwicklung und Veröffentlichung von Animagine XL 3.1 wäre ohne die unschätzbare Unterstützung und Beiträge der folgenden Personen und Organisationen nicht möglich gewesen:

  • SeaArt.ai: Unser Kooperationspartner und Sponsor.

  • Shadow Lilac: Für die Bereitstellung des ästhetischen Klassifizierungsmodells, aesthetic-shadow-v2.

  • Derrian Distro: Für ihren benutzerdefinierten Lernraten-Scheduler, adaptiert von LoRA Easy Training Scripts.

  • Kohya SS: Für ihre umfassenden Trainingsskripte.

  • Cagliostrolab Kollaborateure: Für ihr Engagement in Modelltraining, Projektmanagement und Datenaufbereitung.

  • Frühe Tester: Für ihr wertvolles Feedback und Qualitätssicherung.

  • NovelAI: Für ihren innovativen Ansatz bei der ästhetischen Tagging-Implementierung, der uns als Inspiration diente.

Danke an alle für ihre Unterstützung und Expertise, die Grenzen der Anime-Bilderzeugung zu erweitern.

Beschränkungen

Obwohl Animagine XL 3.1 einen bedeutenden Fortschritt in der Anime-Bildgenerierung darstellt, sollten folgende Einschränkungen beachtet werden:

  1. Anime-Fokus: Dieses Modell ist speziell für die Erzeugung von Anime-Stil Bildern konzipiert und eignet sich nicht für die Erstellung realistischer Fotos.

  2. Prompt-Komplexität: Das Modell ist möglicherweise nicht geeignet für Nutzer, die bei kurzen oder einfachen Prompts hochwertige Ergebnisse erwarten. Der Fokus des Trainings lag auf Konzeptverständnis und nicht auf ästhetischer Verfeinerung, was detailliertere und spezifischere Prompts für bessere Ergebnisse erfordert.

  3. Prompt-Format: Animagine XL 3.1 ist für Danbooru-Stil Tags optimiert und weniger für natürliche Sprachprompts. Für beste Ergebnisse wird empfohlen, die passende Tag- und Syntaxstruktur zu verwenden.

  4. Anatomie und Handdarstellung: Trotz Verbesserungen kann das Modell in diesen Bereichen noch suboptimale Ergebnisse produzieren.

  5. Datensatzgröße: Der Trainingsdatensatz umfasst ca. 870.000 Bilder. Zusammen mit dem Datensatz der vorherigen Version (1,2 Millionen) beträgt die Gesamtdatenmenge etwa 2,1 Millionen Bilder. Obwohl umfangreich, kann diese Datenmenge für ein "ultimatives" Anime-Modell noch als begrenzt angesehen werden.

  6. NSFW-Inhalte: Animagine XL 3.1 wurde so gestaltet, dass NSFW-Inhalte ausgewogener generiert werden. Dennoch kann das Modell weiterhin NSFW-Bilder erzeugen, auch ohne explizite Aufforderung.

Wir geben diese Beschränkungen offen an, um Nutzern realistische Erwartungen zu ermöglichen. Trotz dieser Limitationen stellt das Modell einen bedeutenden Schritt in der Anime-Bildgenerierung dar und bietet Künstlern, Designern und Enthusiasten ein leistungsfähiges Werkzeug.

Lizenz

Basierend auf Animagine XL 3.0 fällt Animagine XL 3.1 unter die Fair AI Public License 1.0-SD, welche kompatibel mit den Lizenzen von Stable Diffusion Modellen ist. Wesentliche Punkte:

  1. Änderungen teilen: Wenn Sie Animagine XL 3.1 modifizieren, müssen Sie sowohl Ihre Änderungen als auch die Original-Lizenz weitergeben.

  2. Quellcodezugang: Bei netzwerkzugänglichen modifizierten Versionen muss ein Zugang (z.B. Downloadlink) zum Quellcode bereitgestellt werden. Dies gilt auch für abgeleitete Modelle.

  3. Vertriebskonditionen: Jede Verbreitung muss unter dieser oder einer ähnlich geregelten Lizenz erfolgen.

  4. Einhaltung: Nicht-Einhaltung ist innerhalb von 30 Tagen zu beheben, um Lizenzaufhebung zu vermeiden, zur Förderung von Transparenz und Open-Source-Werten.

Diese Lizenzwahl soll Animagine XL 3.1 offen und modifizierbar halten und den Geist der Open-Source-Community fördern. Sie schützt Mitwirkende und Nutzer und fördert eine kollaborative sowie ethische Open-Source-Gemeinschaft. So profitiert das Modell nicht nur von gemeinschaftlichem Input, sondern respektiert auch die Freiheiten der Open-Source-Entwicklung.

Zum Schluss ist der Cagliostro Lab Server öffentlich erreichbar unter https://discord.gg/cqh9tZgbGc

Fühlen Sie sich frei, unserem Discord-Server beizutreten.
Wenn Sie spenden oder uns einen Kaffee kaufen möchten, können Sie hier spenden.

Vielen Dank ^_^

Zurück
Cybernetic Robots - v1.0
Weiter
✨ Lazy Embeddings für ALLE illustrious NoobAI Pony SDXL Modelle LazyPositive LazyNegative (Positiv und Negativ plus mehr!) - lazyhand

Modell-Details

Modelltyp

Checkpoint

Basismodell

SDXL 1.0

Modellversion

v3.1

Modell-Hash

e3c47aedb0

Ersteller

Diskussion

Bitte log in um einen Kommentar zu hinterlassen.

Bilder von Animagine XL V3.1 - v3.1

Bilder mit Anime

Bilder mit Basismodell