Animagine XL V3.1 - v3.1
Prompt Consigliati
masterpiece, best quality, very aesthetic, absurdres
outdoors, masterpiece, very aesthetic, best quality, absurdres
Prompt Negativi Consigliati
nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]
nsfw, worst quality, low quality
Parametri Consigliati
samplers
steps
cfg
resolution
other models
Parametri Consigliati per Alta Risoluzione
upscaler
upscale
steps
denoising strength
Suggerimenti
Usa il template di prompt strutturato: '1ragazza/1ragazzo, nome del personaggio, da quale serie, tutto il resto in qualsiasi ordine.'
Usa tag speciali per qualità, valutazione, anno ed estetica per indirizzare i risultati della generazione più accuratamente.
Il modello è ottimizzato per tag in stile Danbooru piuttosto che per prompt in linguaggio naturale.
Usa una scala CFG più bassa intorno a 5-7 e passi di campionamento inferiori a 30 per una qualità migliore.
I tag estetici derivano da un modello ViT specializzato per la classificazione delle immagini addestrato su dati anime.
Sponsor del Creatore
Unisciti al Discord del Cagliostro Lab Server: https://discord.gg/cqh9tZgbGc
Se vuoi fare una donazione o offrirci un caffè puoi donare qui
Grazie mille ^_^
Animagine XL 3.1 è un aggiornamento nella serie Animagine XL V3, migliorando la versione precedente, Animagine XL 3.0. Questo modello open source a tema anime per testo-immagine è stato migliorato per generare immagini in stile anime di qualità superiore. Include una gamma più ampia di personaggi da serie anime conosciute, un dataset ottimizzato e nuovi tag estetici per una migliore creazione delle immagini. Basato su Stable Diffusion XL, Animagine XL 3.1 mira a essere una risorsa preziosa per fan degli anime, artisti e creatori di contenuti, producendo rappresentazioni accurate e dettagliate dei personaggi anime.
Dettagli del Modello
Sviluppato da: Cagliostro Research Lab
In collaborazione con: SeaArt.ai
Tipo di modello: modello generativo testo-immagine basato su Diffusione
Descrizione del modello: Animagine XL 3.1 genera immagini anime di alta qualità da prompt testuali. Presenta anatomia della mano migliorata, comprensione avanzata del concetto e interpretazione avanzata dei prompt.
Licenza: Fair AI Public License 1.0-SD
Fine-tuning da: Animagine XL 3.0
Linee guida per l'uso
Ordinamento dei Tag
Per risultati ottimali, si consiglia di seguire lo schema strutturato del prompt perché il modello è stato addestrato così:
1ragazza/1ragazzo, nome del personaggio, da quale serie, tutto il resto in qualsiasi ordine.
Tag Speciali
Animagine XL 3.1 utilizza tag speciali per indirizzare il risultato verso qualità, valutazione, data di creazione ed estetica. Sebbene il modello possa generare immagini senza questi tag, il loro utilizzo aiuta a ottenere risultati migliori.
Modificatori di Qualità
I tag di qualità ora considerano sia i punteggi che le valutazioni dei post per garantire una distribuzione equilibrata della qualità. Abbiamo perfezionato le etichette per maggiore chiarezza, ad esempio cambiando 'high quality' in 'great quality'.
Modificatore di Qualità Criterio di Punteggio
capolavoro > 95%
migliore qualità > 85% & ≤ 95%
gran qualità > 75% & ≤ 85%
buona qualità > 50% & ≤ 75%
qualità normale > 25% & ≤ 50%
bassa qualità > 10% & ≤ 25%
peggior qualità ≤ 10%Modificatori di Valutazione
Abbiamo anche semplificato i nostri tag di valutazione per chiarezza e semplicità, puntando a stabilire regole globali applicabili a diversi modelli. Ad esempio, il tag 'rating: general' è ora semplicemente 'general', e 'rating: sensitive' è stato condensato in 'sensitive'.
Modificatore di Valutazione Criterio di Valutazione
sicuro Generale
sensibile Sensibile
nsfw Questionabile
esplicito, nsfw EsplicitoModificatore Anno
Abbiamo ridefinito l'intervallo degli anni per indirizzare i risultati verso stili di arte anime moderni o vintage in modo più accurato. Questo aggiornamento semplifica l'intervallo, focalizzandosi sulla rilevanza per epoche passate e presenti.
Tag Anno Intervallo Anni
più recente 2021 a 2024
recente 2018 a 2020
medio 2015 a 2017
antico 2011 a 2014
più vecchio 2005 a 2010Tag Estetici
Abbiamo migliorato il nostro sistema di tagging con tag estetici per rifinire la categorizzazione dei contenuti basata sull'appeal visivo. Questi tag derivano da valutazioni fatte da un modello specializzato ViT (Vision Transformer) per la classificazione delle immagini, specificamente addestrato su dati anime. A tal scopo, abbiamo utilizzato il modello shadowlilac/aesthetic-shadow-v2, che valuta il valore estetico del contenuto prima dell'addestramento. Questo assicura che ogni contenuto sia non solo pertinente e accurato ma anche visivamente gradevole.
Tag Estetico Intervallo di Punteggio
molto estetico > 0.71
estetico > 0.45 & < 0.71
spiacevole > 0.27 & < 0.45
molto spiacevole ≤ 0.27Impostazioni consigliate
Per guidare il modello verso la generazione di immagini ad alta estetica, utilizzare prompt negativi come:
nsfw, bassa risoluzione, (cattivo), testo, errore, meno, extra, mancante, peggior qualità, artefatti jpeg, bassa qualità, filigrana, incompleto, spiacevole, più vecchio, antico, aberrazione cromatica, firma, cifre extra, errore artistico, nome utente, scansione, [astratto]
Per risultati di qualità superiore, aggiungere ai prompt:
capolavoro, migliore qualità, molto estetico, assurdres
Si consiglia anche di utilizzare una scala di guida senza classificatore (CFG Scale) più bassa, intorno a 5-7, passi di campionamento inferiori a 30, e usare Euler Ancestral (Euler a) come sampler.
Risoluzione Multi Aspetto
Questo modello supporta la generazione di immagini alle seguenti dimensioni:
Dimensioni Rapporto d'Aspetto
1024 x 1024 1:1 Quadrato
1152 x 896 9:7
896 x 1152 7:9
1216 x 832 19:13
832 x 1216 13:19
1344 x 768 7:4 Orizzontale
768 x 1344 4:7 Verticale
1536 x 640 12:5 Orizzontale
640 x 1536 5:12 VerticaleRingraziamenti
Lo sviluppo e il rilascio di Animagine XL 3.1 non sarebbero stati possibili senza i preziosi contributi e il supporto dei seguenti individui e organizzazioni:
SeaArt.ai: nostro partner di collaborazione e sponsor.
Shadow Lilac: per aver fornito il modello di classificazione estetica, aesthetic-shadow-v2.
Derrian Distro: per il loro scheduler personalizzato del learning rate, adattato da LoRA Easy Training Scripts.
Kohya SS: per i loro script di allenamento completi.
Collaboratori di Cagliostrolab: per la loro dedizione all'addestramento del modello, gestione del progetto e cura dei dati.
Tester Precoce: per il loro prezioso feedback e gli sforzi di assicurazione qualità.
NovelAI: per il loro approccio innovativo al tagging estetico, che ha ispirato la nostra implementazione.
Grazie a tutti per il vostro supporto e competenza nel superare i limiti della generazione di immagini in stile anime.
Limitazioni
Pur rappresentando un notevole progresso nella generazione di immagini in stile anime, Animagine XL 3.1 presenta alcune limitazioni:
Focalizzato sugli Anime: Questo modello è progettato specificamente per generare immagini in stile anime e non è adatto alla creazione di foto realistiche.
Complessità del Prompt: Questo modello potrebbe non essere adatto agli utenti che si aspettano risultati di alta qualità da prompt brevi o semplici. L'addestramento si è concentrato sulla comprensione del concetto piuttosto che sul raffinamento estetico, potendo richiedere prompt più dettagliati e specifici per ottenere l'output desiderato.
Formato del Prompt: Animagine XL 3.1 è ottimizzato per tag in stile Danbooru piuttosto che per prompt in linguaggio naturale. Per risultati migliori, si consiglia agli utenti di formattare i propri prompt usando i tag e la sintassi appropriati.
Anatomia e Rendering della Mano: Nonostante i miglioramenti fatti in anatomia e rendering delle mani, potrebbero ancora verificarsi risultati subottimali in queste aree.
Dimensione del Dataset: Il dataset utilizzato per l'addestramento di Animagine XL 3.1 è composto da circa 870.000 immagini. Unito al dataset dell'iterazione precedente (1,2 milioni), il totale dei dati di training ammonta a circa 2,1 milioni di immagini. Sebbene consistente, la dimensione del dataset può essere considerata limitata per un modello "definitivo" di anime.
Contenuti NSFW: Animagine XL 3.1 è stato progettato per generare contenuti NSFW più bilanciati. Tuttavia, è importante notare che il modello potrebbe comunque produrre risultati NSFW, anche se non esplicitamente richiesto.
Riconoscendo queste limitazioni, intendiamo fornire trasparenza e stabilire aspettative realistiche per gli utenti di Animagine XL 3.1. Nonostante questi vincoli, crediamo che il modello rappresenti un passo significativo nella generazione di immagini in stile anime e offra uno strumento potente per artisti, designer e appassionati.
Licenza
Basato su Animagine XL 3.0, Animagine XL 3.1 è rilasciato sotto la licenza Fair AI Public License 1.0-SD, compatibile con la licenza dei modelli Stable Diffusion. Punti chiave:
Condivisione delle Modifiche: Se modifichi Animagine XL 3.1, devi condividere sia le tue modifiche sia la licenza originale.
Accessibilità del Codice Sorgente: Se la tua versione modificata è accessibile in rete, devi fornire un modo (come un link per il download) per permettere ad altri di ottenere il codice sorgente. Questo si applica anche ai modelli derivati.
Termini di Distribuzione: Qualsiasi distribuzione deve essere sotto questa licenza o un'altra con regole simili.
Conformità: La non conformità deve essere risolta entro 30 giorni per evitare la cessazione della licenza, enfatizzando trasparenza e adesione ai valori open source.
La scelta di questa licenza mira a mantenere Animagine XL 3.1 aperto e modificabile, in linea con lo spirito della comunità open source. Protegge contributori e utenti, incoraggiando una comunità collaborativa e etica. Ciò garantisce che il modello benefici non solo del contributo collettivo ma anche del rispetto delle libertà nello sviluppo open source.
Infine, il Server di Cagliostro Lab è aperto al pubblico https://discord.gg/cqh9tZgbGc
Sentitevi liberi di unirvi al nostro server discord.
Se volete fare una donazione o offrirci un caffè potete donare qui
Grazie mille ^_^
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Creatore
Discussione
Per favore log in per lasciare un commento.
