Cameriera confusa che indossa occhiali, vestito scuro con grembiule bianco e copricapo da cameriera, in piedi contro uno sfondo psichedelico colorato vibrante con spirali e punti interrogativi.
Un ritratto digitale dettagliato di Luke Sullivan da Street Fighter 6 con lineamenti marcati, occhi verdi espressivi, capelli acconciati e una giacca stilizzata con motivi arancioni e blu.
Immagine a figura intera di una ragazza in stile pop art vibrante che indossa abiti colorati e si trova in una stanza semplice dai colori vivaci.
Rappresentazione elegante di Lara Croft in piedi davanti a un tramonto vibrante, raffigurata in stile arte a inchiostro dettagliato con tonalità audaci di rosso e arancione.
Interno accogliente di un negozio vintage con cancelleria e libreria giapponese retrò, divano vintage, scaffali in legno pieni di libri e oggetti da collezione, piante in vaso e illuminazione calda in stile metà secolo.

Prompt Consigliati

1girl, firefly (honkai: star rail), honkai (series), honkai: star rail, safe, casual, solo, looking at viewer, outdoors, smile, reaching towards viewer, night, masterpiece, high score, great score, absurdres

masterpiece, high score, great score, absurdres

1girl, sensitive, looking at viewer, solo, masterpiece, high score, great score, absurdres

Prompt Negativi Consigliati

lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry

lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry

Parametri Consigliati

samplers

Euler Ancestral (Euler a), Euler a

steps

25 - 28

cfg

4 - 7

resolution

2048x2048

Suggerimenti

Usa didascalie basate su tag con il metodo di ordinamento dei tag per risultati migliori: 1girl/1boy/1other, nome del personaggio, serie, rating, altri tag, poi miglioramento della qualità.

Aggiungi tag di miglioramento della qualità alla fine del prompt: masterpiece, high score, great score, absurdres.

Usa prompt negativi raccomandati per evitare artefatti ed errori indesiderati.

Scala CFG ottimale tra 4 e 7, consigliata a 5.

Passi di campionamento ottimali tra 25 e 28, con 28 consigliati.

Sampler preferito è Euler Ancestral (Euler a).

Nota le limitazioni del modello come difficoltà con anatomia complessa e rendering di testo.

Personaggi recenti potrebbero avere minore accuratezza a causa di dati di addestramento limitati.

Punti Salienti della Versione

Con il rilascio di Animagine XL 4.0 Opt (Ottimizzato), il modello è stato ulteriormente perfezionato con un dataset aggiuntivo, migliorando le prestazioni per l'uso generale. Questo aggiornamento apporta diversi miglioramenti:

  • Migliore stabilità per output più coerenti

  • Anatomia migliorata con proporzioni più precise

  • Riduzione di rumore e artefatti nelle generazioni

  • Risolti problemi di bassa saturazione, risultando in colori più vivi

  • Migliore accuratezza dei colori per risultati più piacevoli visivamente

Sponsor del Creatore

Sostieni lo sviluppo di Animagine XL

Si prega di leggere la nostra Guida dettagliata per il prompting su Blog di Cagliostrolab

Panoramica

Animagine XL 4.0, anche stilizzato come Anim4gine, è il modello SDXL finemente ottimizzato a tema anime definitivo e l'ultima versione della serie Animagine XL. Pur essendo una continuazione, il modello è stato riaddestrato partendo da Stable Diffusion XL 1.0 con un enorme dataset di 8,4 milioni di immagini in stile anime da varie fonti con cutoff di conoscenza al 7 gennaio 2025 e finemente ottimizzato per circa 2650 ore GPU. Come nella versione precedente, questo modello è stato addestrato utilizzando il metodo di ordinamento dei tag per l'identità e lo stile.

Con il rilascio di Animagine XL 4.0 Opt (Ottimizzato), il modello è stato ulteriormente migliorato con un dataset aggiuntivo, migliorando la stabilità, la precisione anatomica, la riduzione del rumore, la saturazione dei colori e la precisione complessiva dei colori. Questi miglioramenti rendono Animagine XL 4.0 Opt più coerente e visivamente accattivante, pur mantenendo la qualità distintiva della serie.

Registro delle modifiche

- 2025-02-13 – Aggiunti Animagine XL 4.0 Opt e Animagine XL 4.0 Zero

  • Migliore stabilità per output più coerenti

  • Anatomia migliorata con proporzioni più accurate

  • Riduzione di rumore e artefatti nelle generazioni

  • Risolti problemi di bassa saturazione, con colori più intensi

  • Migliorata precisione dei colori per risultati più gradevoli

- 2025-01-24 – Prima versione

Dettagli del modello

Linee guida per l'uso

Il riepilogo è visibile nell'immagine delle linee guida per il prompt.

1. Struttura del Prompt

Il modello è stato addestrato con didascalie basate su tag e il metodo di ordinamento dei tag. Usa questo schema strutturato:

1girl/1boy/1other, nome del personaggio, da quale serie, rating, tutto il resto in qualsiasi ordine e termina con miglioramento della qualità

2. Tag per il miglioramento della qualità

Aggiungi questi tag alla fine del prompt:

masterpiece, high score, great score, absurdres

lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry

4. Impostazioni ottimali

  • CFG Scale: 4-7 (consigliato 5)

  • Passi di campionamento: 25-28 (consigliato 28)

  • Sampler preferito: Euler Ancestral (Euler a)

6. Esempio di struttura finale del prompt

1girl, firefly \(honkai: star rail\), honkai \(series\), honkai: star rail, safe, casual, solo, looking at viewer, outdoors, smile, reaching towards viewer, night, masterpiece, high score, great score, absurdres

Tag Speciali

Il modello supporta vari tag speciali che possono essere utilizzati per controllare diversi aspetti del processo di generazione dell’immagine. Questi tag sono attentamente ponderati e testati per fornire risultati coerenti attraverso prompt diversi.

Tag di qualità

I tag di qualità sono controlli fondamentali che influenzano direttamente la qualità generale e il livello di dettaglio dell’immagine. Tag di qualità disponibili:

  • masterpiece

  • best quality

  • low quality

  • worst quality

Tag di punteggio

I tag di punteggio offrono un controllo più sfumato sulla qualità dell’immagine rispetto ai tag di qualità di base. Hanno un impatto più forte nel guidare la qualità dell’output in questo modello. Tag di punteggio disponibili:

  • high score

  • great score

  • good score

  • average score

  • bad score

  • low score

Tag Temporali

I tag temporali permettono di influenzare lo stile artistico basato su specifici periodi temporali o anni. Possono essere utili per generare immagini con caratteristiche artistiche specifiche di un’epoca. Tag anni supportati:

  • year 2005

  • year {n}

  • year 2025

Tag di valutazione

I tag di valutazione aiutano a controllare il livello di sicurezza del contenuto delle immagini generate. Questi tag devono essere usati responsabilmente e in conformità con le leggi e le politiche della piattaforma. Valutazioni supportate:

  • safe

  • sensitive

  • nsfw

  • explicit

Informazioni sull’addestramento

Il modello è stato addestrato utilizzando hardware all’avanguardia e iperparametri ottimizzati per garantire l’output di massima qualità. Di seguito le specifiche tecniche dettagliate e i parametri usati durante il processo di addestramento:

Ringraziamenti

Questo progetto a lungo termine non sarebbe stato possibile senza il lavoro pionieristico, i contributi innovativi e la documentazione completa forniti da Stability AI, Novel AI e Waifu Diffusion Team. Siamo particolarmente grati per il grant iniziale di Main che ci ha permesso di progredire oltre la V2. Per questa iterazione desideriamo esprimere sincera gratitudine a tutta la community per il supporto continuo, in particolare:

  1. Moescape AI: nostro partner prezioso nella distribuzione e testing del modello

  2. Lesser Rabbit: per i finanziamenti essenziali a supporto di calcoli e ricerca

  3. Kohya SS: per lo sviluppo del completo framework open-source di addestramento

  4. discus0434: per la creazione del noto open-source Aesthetic Predictor 2.5

  5. Tester iniziali: per la dedizione nel fornire feedback critici e assicurazione qualità approfondita

Contributori

Estendiamo il nostro sentito ringraziamento ai membri del team dedicati che hanno contribuito significativamente a questo progetto, inclusi ma non limitati a:

Modello

Gradio

Relazioni, finanza e assicurazione qualità

Dati

Le raccolte fondi sono riaperte!

Siamo entusiasti di introdurre nuovi metodi di raccolta fondi tramite GitHub Sponsors per supportare l’addestramento, la ricerca e lo sviluppo del modello. Il tuo supporto ci aiuta a spingere i limiti di ciò che è possibile con l’IA.

Puoi aiutarci con:

  • Donazioni: Contribuisci tramite ETH o USDT all'indirizzo sottostante.

  • Condivisione: Diffondi la voce sui nostri modelli e condividi le tue creazioni!

  • Feedback: Dicci come possiamo migliorare.

Indirizzo per donazioni:

ETH/USDT/USDC(e): 0xd8A1dA94BA7E6feCe8CfEacc1327f498fCcBFC0C

GitHub Sponsor: https://github.com/sponsors/cagliostrolab/

Perché usiamo le criptovalute?
Quando abbiamo inizialmente aperto la raccolta fondi tramite Ko-fi e l’uso di PayPal come metodo di prelievo, il nostro account PayPal è stato segnalato e infine bannato, nonostante i nostri sforzi per spiegare lo scopo del progetto. Sfortunatamente, questo ci ha costretto a rimborsare tutte le donazioni e ci ha lasciati senza un modo affidabile per ricevere supporto. Per evitare questi problemi e garantire trasparenza, abbiamo ora adottato le criptovalute come metodo di raccolta fondi.

Vuoi donare in valuta non cripto?
Sebbene abbiamo avuto una brutta esperienza con PayPal e tu voglia supportarci preferendo non usare criptovalute, sentiti libero di contattarci tramite Discord Server per metodi alternativi di donazione.

Unisciti al nostro Discord Server

Sentiti libero di unirti al nostro server Discord: https://discord.gg/cqh9tZgbGc

Limitazioni

  • Formato del prompt: Limitato a prompt testuali basati su tag; input in linguaggio naturale potrebbe non essere efficace

  • Anatomia: Può avere difficoltà con dettagli anatomici complessi, in particolare pose delle mani e conteggio delle dita

  • Generazione di testo: Rendering di testo nelle immagini attualmente non supportato e non raccomandato

  • Personaggi nuovi: Personaggi recenti potrebbero avere minore accuratezza dovuta a dati di addestramento limitati disponibili

  • Più personaggi: Scene con più personaggi potrebbero richiedere un’accurata progettazione del prompt

  • Risoluzione: Risoluzioni più alte (es. 1536x1536) potrebbero mostrare degradazione poiché l’addestramento ha usato la risoluzione originale di SDXL

  • Coerenza dello stile: Potrebbe richiedere tag specifici dello stile perché l’addestramento si è concentrato più sulla preservazione dell’identità che sulla coerenza stilistica

Licenza

Questo modello adotta la licenza originale CreativeML Open RAIL++-M License di Stability AI senza modifiche o restrizioni aggiuntive. I termini della licenza rimangono esattamente come specificato nella licenza SDXL originale, che include:

  • Permessi: Uso commerciale, modifiche, distribuzioni, uso privato

  • Proibizioni: Attività illegali, generazione di contenuti dannosi, discriminazione, sfruttamento

  • ⚠️ Requisiti: Includere copia della licenza, dichiarare modifiche, preservare avvisi

  • 📝 Garanzia: Fornita "COSÌ COM’È" senza garanzie

Si prega di fare riferimento alla licenza SDXL originale per i termini e le condizioni completi e autorevoli.

Precedente
Flux 1 Krea Dev FP8 - FP8_e4m3fn
Successivo
Alondra Vicious - Alondra Vicious

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

SDXL 1.0

Versione del modello

v4 Opt

Hash del modello

6327eca98b

Discussione

Per favore log in per lasciare un commento.

Immagini di Animagine XL 4.0 - v4 Opt

Immagini con anime

Immagini con modello base

Immagini con sdxl