modelli/Animagine XL V3.1 - v3.1

Animagine XL V3.1 - v3.1

Luca Bianchi

7/21/2025

1:38:13 PM

| Discussion

Parole Chiave e Tag Correlati

anime,personaggi anime,generazione di immagini anime,modello base,checkpoint,sdxl 1.0,stable diffusion xl,v3.1

Ritratto di una donna con capelli rosso fuoco e occhi rossi luminosi circondati da fiamme vorticosi, busto visibile con spalle scoperte.

Vista a figura intera di uno studente maschio in uniforme gakuran nera con camicia verde, in piedi all'aperto su un marciapiede coperto di foglie d'autunno, guarda verso l'alto, tiene una borsa, accompagnato da un gatto nero.

Una donna matura bionda con capelli multicolore e occhi ardenti luminosi, che indossa occhiali senza montatura e un completo da lavoro nero con camicia e cravatta rossa, circondata da fiamme e braci vorticosi.

Asuka Langley, un personaggio anime, posa con sicurezza in una brillante tuta rossa con lunghi capelli castani, sorridendo tra edifici urbani in rovina sotto un cielo azzurro.

Primo piano di una ragazza anime con orecchie da lupo, capelli neri e arancioni fluenti, occhi rossi, che indossa un abito nero scollato in piedi su una strada urbana piovosa.

Uno schizzo rosso e nero di un drago che incombe su una persona sotto la pioggia di notte.

Colorata ragazza cyberpunk con capelli blu e arancioni che indossa una tuta vivace, rappresentata in uno stile fumetto dinamico con sfondo astratto.

Una bellissima panoramica paesaggistica con cielo azzurro, altopiano montano con campi verdi, circondato da nuvole e una valle distante.

Bellissimo schizzo dipinto a mano con inchiostro e acquerello di una ragazza dai capelli grigi con codini che tiene un tenero pollo, su uno sfondo con pioggia e nuvole gocciolanti.

Guerriera futuristica femminile in un esoscheletro con motivo miko che indossa una maschera antigas e brandisce una lama rossa luminosa, illuminata da luci cinematografiche in un paesaggio urbano notturno.

Un paesaggio futuristico illuminato al neon ispirato agli anime cyberpunk degli anni '90, con una figura solitaria che osserva grandi edifici coperti di neon tra colline al crepuscolo in Texas.

Primo piano di una ragazza con occhi arancioni intensi e capelli neri che indossa un top corto nero di paillettes e un abito blu, circondata da fiamme ardenti e effetti di illuminazione dettagliati.

Prompt Consigliati

masterpiece, best quality, very aesthetic, absurdres

outdoors, masterpiece, very aesthetic, best quality, absurdres

Prompt Negativi Consigliati

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

nsfw, worst quality, low quality

Parametri Consigliati

samplers

Euler Ancestral (Euler a), Euler a

steps

28 - 30

cfg

5 - 7

resolution

1024x1024, 1152x896, 896x1152, 1216x832, 832x1216, 1344x768, 768x1344, 1536x640, 640x1536, 896x1152, 1216x832

other models

animagine-xl-3.1 (9f86289b6a)

Parametri Consigliati per Alta Risoluzione

upscaler

Latent (nearest-exact), R-ESRGAN 4x+ Anime6B

upscale

1.5

steps

15 - 30

denoising strength

0.4 - 0.55

Suggerimenti

Usa il template di prompt strutturato: '1ragazza/1ragazzo, nome del personaggio, da quale serie, tutto il resto in qualsiasi ordine.'

Usa tag speciali per qualità, valutazione, anno ed estetica per indirizzare i risultati della generazione più accuratamente.

Il modello è ottimizzato per tag in stile Danbooru piuttosto che per prompt in linguaggio naturale.

Usa una scala CFG più bassa intorno a 5-7 e passi di campionamento inferiori a 30 per una qualità migliore.

I tag estetici derivano da un modello ViT specializzato per la classificazione delle immagini addestrato su dati anime.

Sponsor del Creatore

Unisciti al Discord del Cagliostro Lab Server: https://discord.gg/cqh9tZgbGc

Se vuoi fare una donazione o offrirci un caffè puoi donare qui

Grazie mille ^_^

Animagine XL 3.1 è un aggiornamento nella serie Animagine XL V3, migliorando la versione precedente, Animagine XL 3.0. Questo modello open source a tema anime per testo-immagine è stato migliorato per generare immagini in stile anime di qualità superiore. Include una gamma più ampia di personaggi da serie anime conosciute, un dataset ottimizzato e nuovi tag estetici per una migliore creazione delle immagini. Basato su Stable Diffusion XL, Animagine XL 3.1 mira a essere una risorsa preziosa per fan degli anime, artisti e creatori di contenuti, producendo rappresentazioni accurate e dettagliate dei personaggi anime.

Dettagli del Modello

Sviluppato da: Cagliostro Research Lab
In collaborazione con: SeaArt.ai
Tipo di modello: modello generativo testo-immagine basato su Diffusione
Descrizione del modello: Animagine XL 3.1 genera immagini anime di alta qualità da prompt testuali. Presenta anatomia della mano migliorata, comprensione avanzata del concetto e interpretazione avanzata dei prompt.
Licenza: Fair AI Public License 1.0-SD
Fine-tuning da: Animagine XL 3.0

Linee guida per l'uso

Ordinamento dei Tag

Per risultati ottimali, si consiglia di seguire lo schema strutturato del prompt perché il modello è stato addestrato così:

1ragazza/1ragazzo, nome del personaggio, da quale serie, tutto il resto in qualsiasi ordine.

Tag Speciali

Animagine XL 3.1 utilizza tag speciali per indirizzare il risultato verso qualità, valutazione, data di creazione ed estetica. Sebbene il modello possa generare immagini senza questi tag, il loro utilizzo aiuta a ottenere risultati migliori.

Modificatori di Qualità

I tag di qualità ora considerano sia i punteggi che le valutazioni dei post per garantire una distribuzione equilibrata della qualità. Abbiamo perfezionato le etichette per maggiore chiarezza, ad esempio cambiando 'high quality' in 'great quality'.


Modificatore di Qualità	Criterio di Punteggio
capolavoro	        > 95%
migliore qualità	        > 85% & ≤ 95%
gran qualità	        > 75% & ≤ 85%
buona qualità	        > 50% & ≤ 75%
qualità normale	        > 25% & ≤ 50%
bassa qualità	        > 10% & ≤ 25%
peggior qualità	        ≤ 10%

Modificatori di Valutazione

Abbiamo anche semplificato i nostri tag di valutazione per chiarezza e semplicità, puntando a stabilire regole globali applicabili a diversi modelli. Ad esempio, il tag 'rating: general' è ora semplicemente 'general', e 'rating: sensitive' è stato condensato in 'sensitive'.


Modificatore di Valutazione	    Criterio di Valutazione
sicuro	            Generale
sensibile	    Sensibile
nsfw	            Questionabile
esplicito, nsfw	    Esplicito

Modificatore Anno

Abbiamo ridefinito l'intervallo degli anni per indirizzare i risultati verso stili di arte anime moderni o vintage in modo più accurato. Questo aggiornamento semplifica l'intervallo, focalizzandosi sulla rilevanza per epoche passate e presenti.


Tag Anno	Intervallo Anni
più recente	        2021 a 2024
recente	        2018 a 2020
medio	        2015 a 2017
antico	        2011 a 2014
più vecchio	        2005 a 2010

Tag Estetici

Abbiamo migliorato il nostro sistema di tagging con tag estetici per rifinire la categorizzazione dei contenuti basata sull'appeal visivo. Questi tag derivano da valutazioni fatte da un modello specializzato ViT (Vision Transformer) per la classificazione delle immagini, specificamente addestrato su dati anime. A tal scopo, abbiamo utilizzato il modello shadowlilac/aesthetic-shadow-v2, che valuta il valore estetico del contenuto prima dell'addestramento. Questo assicura che ogni contenuto sia non solo pertinente e accurato ma anche visivamente gradevole.


Tag Estetico	       Intervallo di Punteggio
molto estetico	       > 0.71
estetico	       > 0.45 & < 0.71
spiacevole	       > 0.27 & < 0.45
molto spiacevole       ≤ 0.27

Impostazioni consigliate

Per guidare il modello verso la generazione di immagini ad alta estetica, utilizzare prompt negativi come:

nsfw, bassa risoluzione, (cattivo), testo, errore, meno, extra, mancante, peggior qualità, artefatti jpeg, bassa qualità, filigrana, incompleto, spiacevole, più vecchio, antico, aberrazione cromatica, firma, cifre extra, errore artistico, nome utente, scansione, [astratto]

Per risultati di qualità superiore, aggiungere ai prompt:

capolavoro, migliore qualità, molto estetico, assurdres

Si consiglia anche di utilizzare una scala di guida senza classificatore (CFG Scale) più bassa, intorno a 5-7, passi di campionamento inferiori a 30, e usare Euler Ancestral (Euler a) come sampler.

Risoluzione Multi Aspetto

Questo modello supporta la generazione di immagini alle seguenti dimensioni:

Dimensioni	Rapporto d'Aspetto
1024 x 1024	1:1 Quadrato
1152 x 896	9:7
896 x 1152	7:9
1216 x 832	19:13
832 x 1216	13:19
1344 x 768	7:4 Orizzontale
768 x 1344	4:7 Verticale
1536 x 640	12:5 Orizzontale
640 x 1536	5:12 Verticale

Ringraziamenti

Lo sviluppo e il rilascio di Animagine XL 3.1 non sarebbero stati possibili senza i preziosi contributi e il supporto dei seguenti individui e organizzazioni:

SeaArt.ai: nostro partner di collaborazione e sponsor.
Shadow Lilac: per aver fornito il modello di classificazione estetica, aesthetic-shadow-v2.
Derrian Distro: per il loro scheduler personalizzato del learning rate, adattato da LoRA Easy Training Scripts.
Kohya SS: per i loro script di allenamento completi.
Collaboratori di Cagliostrolab: per la loro dedizione all'addestramento del modello, gestione del progetto e cura dei dati.
Tester Precoce: per il loro prezioso feedback e gli sforzi di assicurazione qualità.
NovelAI: per il loro approccio innovativo al tagging estetico, che ha ispirato la nostra implementazione.

Grazie a tutti per il vostro supporto e competenza nel superare i limiti della generazione di immagini in stile anime.

Limitazioni

Pur rappresentando un notevole progresso nella generazione di immagini in stile anime, Animagine XL 3.1 presenta alcune limitazioni:

Focalizzato sugli Anime: Questo modello è progettato specificamente per generare immagini in stile anime e non è adatto alla creazione di foto realistiche.
Complessità del Prompt: Questo modello potrebbe non essere adatto agli utenti che si aspettano risultati di alta qualità da prompt brevi o semplici. L'addestramento si è concentrato sulla comprensione del concetto piuttosto che sul raffinamento estetico, potendo richiedere prompt più dettagliati e specifici per ottenere l'output desiderato.
Formato del Prompt: Animagine XL 3.1 è ottimizzato per tag in stile Danbooru piuttosto che per prompt in linguaggio naturale. Per risultati migliori, si consiglia agli utenti di formattare i propri prompt usando i tag e la sintassi appropriati.
Anatomia e Rendering della Mano: Nonostante i miglioramenti fatti in anatomia e rendering delle mani, potrebbero ancora verificarsi risultati subottimali in queste aree.
Dimensione del Dataset: Il dataset utilizzato per l'addestramento di Animagine XL 3.1 è composto da circa 870.000 immagini. Unito al dataset dell'iterazione precedente (1,2 milioni), il totale dei dati di training ammonta a circa 2,1 milioni di immagini. Sebbene consistente, la dimensione del dataset può essere considerata limitata per un modello "definitivo" di anime.
Contenuti NSFW: Animagine XL 3.1 è stato progettato per generare contenuti NSFW più bilanciati. Tuttavia, è importante notare che il modello potrebbe comunque produrre risultati NSFW, anche se non esplicitamente richiesto.

Riconoscendo queste limitazioni, intendiamo fornire trasparenza e stabilire aspettative realistiche per gli utenti di Animagine XL 3.1. Nonostante questi vincoli, crediamo che il modello rappresenti un passo significativo nella generazione di immagini in stile anime e offra uno strumento potente per artisti, designer e appassionati.

Licenza

Basato su Animagine XL 3.0, Animagine XL 3.1 è rilasciato sotto la licenza Fair AI Public License 1.0-SD, compatibile con la licenza dei modelli Stable Diffusion. Punti chiave:

Condivisione delle Modifiche: Se modifichi Animagine XL 3.1, devi condividere sia le tue modifiche sia la licenza originale.
Accessibilità del Codice Sorgente: Se la tua versione modificata è accessibile in rete, devi fornire un modo (come un link per il download) per permettere ad altri di ottenere il codice sorgente. Questo si applica anche ai modelli derivati.
Termini di Distribuzione: Qualsiasi distribuzione deve essere sotto questa licenza o un'altra con regole simili.
Conformità: La non conformità deve essere risolta entro 30 giorni per evitare la cessazione della licenza, enfatizzando trasparenza e adesione ai valori open source.

La scelta di questa licenza mira a mantenere Animagine XL 3.1 aperto e modificabile, in linea con lo spirito della comunità open source. Protegge contributori e utenti, incoraggiando una comunità collaborativa e etica. Ciò garantisce che il modello benefici non solo del contributo collettivo ma anche del rispetto delle libertà nello sviluppo open source.

Infine, il Server di Cagliostro Lab è aperto al pubblico https://discord.gg/cqh9tZgbGc

Sentitevi liberi di unirvi al nostro server discord.
Se volete fare una donazione o offrirci un caffè potete donare qui

Grazie mille ^_^

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

Robot Cibernetici - v1.0

Detailer IL - v2

Usa questo modello