modelli/AlbedoBase XL - v3.1-Large

AlbedoBase XL - v3.1-Large

7/27/2025

1:17:16 AM

Parole Chiave e Tag Correlati

2d,3d,albedobase xl,tutto in uno,anime,modello base,checkpoint,cinematografico,gioco,modello di generazione immagini,loras unificati,fotorealistico,sdxl,sdxl 1.0,stable diffusion xl

Vista della campagna italiana soleggiata con colline ondulate, fattorie, un caratteristico villaggio con tetti in terracotta e nuvole drammatiche sotto un cielo azzurro brillante.

Ritratto inciso in stile grunge in bianco e nero in primo piano estremo di un volto con texture dettagliate e linee espressive, ispirato a Richard Hambleton.

Ritratto astratto scuro di una figura femminile con sagoma nera e vividi schizzi di vernice rossa su sfondo chiaro, ispirato allo stile di Richard Hambleton.

Città futuristica con alte torri cilindriche in vetro situata in un paesaggio montano innevato sotto un cielo drammatico al tramonto.

Uomo cartoon con espressione sconvolta, capelli selvaggi e ricci, occhiali e barba corta che indossa una camicia gialla a quadri con cravatta rossa e bretelle blu su uno sfondo verde testurizzato.

Una miniatura di alpaca bianco e soffice con grandi occhi neri che sta accanto a una piccola casa marrone stampata in 3D.

Un'arte digitale vettoriale vibrante in stile William Wray che mostra un elefante rilassato a forma di mongolfiera colorata con un pinguino stravagante in cima, circondati da palloncini multicolori contro uno sfondo di cielo.

Acquaforte impressionista con silhouette di una donna in abito e cappello in piedi vicino a un fiume, che guarda un piccolo cane, con un classico ponte di Londra e Big Ben sullo sfondo.

Una sagoma in stile carta tagliata di una donna che balla il tango, finemente realizzata in arte in acciaio con influenza kirigami, circondata da forme astratte ondeggianti.

Prompt Consigliati

(incredibly ultra lifelike, perfect professional precise, masterpiece, extremely beautiful, light and shadow

Prompt Negativi Consigliati

strabismus

(worst quality, normal quality, score_3, score_4

Parametri Consigliati

samplers

Euler a, DPM++ 2M SDE Heun

steps

24 - 72

cfg

3 - 9.5

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Suggerimenti

Se la generazione dell'immagine non produce risultati, prova a passare a CLIP SKIP 2 o modifica leggermente il prompt cambiando l'ordine o il testo.

L'uso di prompt in forma di frase tende a migliorare più la qualità delle immagini rispetto all'uso di liste di tag.

Lasciare il campo prompt negativo vuoto spesso produce risultati migliori nelle immagini.

Controlla la griglia caratteristiche per impostazioni ottimali prima di usare il modello.

Sperimenta con alcuni prompt negativi specifici come 'strabismo' per risolvere problemi come occhi asimmetrici o pixelazione.

Punti Salienti della Versione

• Fusi oltre 50 delle versioni più recenti selezionate dei modelli SDXL usando lo script ricorsivo impiegato nella V3.

Sponsor del Creatore

Se hai trovato valore nel modello, considera di offrirci il tuo supporto. Il tuo contributo sarà interamente dedicato all'avanzamento della comunità SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquista ㅤ|ㅤ 🌱 dona

Se hai trovato valore nel modello, considera di offrirci il tuo supporto. Il tuo contributo sarà interamente dedicato all'avanzamento della comunità SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquistaㅤ |ㅤ 🌱 dona

AlbedoBase XL (SFW&NSFW)

Il refiner non è necessario e il VAE è incluso.

OBIETTIVO

Stable Diffusion XL possiede 3,5 miliardi di parametri (escluso il Refiner), circa 3,6 volte in più della versione SD v1.5. Credo che questo non sia solo un numero, ma un valore in grado di portare a un significativo miglioramento delle prestazioni.

È passato un po' di tempo da quando abbiamo constatato che le performance complessive di SD v1.5 sono migliorate oltre ogni immaginazione grazie ai contributi esplosivi della nostra comunità. Pertanto, sto lavorando a completare questo modello AlbedoBase XL per replicare ottimamente il miglioramento di prestazioni avvenuto in v1.5 anche in questa versione XL.

Il mio obiettivo è testare direttamente le prestazioni di tutti i Checkpoint e LoRA pubblicamente caricati su Civitai, e unire solo le risorse giudicate ottimali dopo vari filtri. Questo supererà le performance delle AI di generazione immagini di aziende come Midjourney.

Ad oggi, AlbedoBase XL v3.1 Large ha fuso circa 200 checkpoint selezionati e 251 LoRA.

LOG

v3.1-Large

• Fusi oltre 50 delle versioni più recenti selezionate dei modelli SDXL usando lo script ricorsivo impiegato nella V3.

La griglia caratteristiche(370.7 MB): download

v3-mini

Mi scuso sinceramente per il lungo tempo di attesa.

Ho avuto a che fare con questioni personali e, mentre lavoravo alla nuova versione, ho anche affrontato problemi di salute. Anche mentre scrivo questo testo, sto ancora lottando con queste sfide.

Ho ritenuto che non bastasse fornire un rapido aggiornamento, quindi chiedo gentilmente comprensione mentre condivido questo messaggio più dettagliato.

Dal rilascio della versione 2.0, mi sono dedicato allo studio indipendente del deep learning. Non ho una laurea formale, e oltre a una modesta predisposizione per la programmazione, ho solo un background artistico. Di conseguenza, mi manca la base matematica e scientifica per compiere grandi scoperte, dato il tempo e l'impegno investiti. Nonostante ciò, l'esperienza di immergermi in questo studio e ricerca autodiretti è stato un tesoro inestimabile nella mia vita.

Recentemente, ho incontrato un'idea che potrebbe essere una svolta significativa. Dopo aver rielaborato centinaia di formule e metodi dalla versione 2.0, sono riuscito a sviluppare un algoritmo piuttosto interessante e di successo. Il processo di fusione dei modelli si basava su SDXL1.0 e SD1.5, insieme ad altri modelli accuratamente selezionati. Questi sono stati categorizzati in cinque classificazioni principali: “ANIME,” “REALISMO,” “ARTISTICO,” “NSFW,” e “BASE,” e alimentati nell'algoritmo di fusione come set di dati. Questo approccio ha prodotto risultati affascinanti.

Tuttavia, per quanto lo sviluppo dell'algoritmo sia stato sfidante, nulla è stato tanto arduo quanto la fase di test delle prestazioni. La mia salute fisica e mentale è peggiorata significativamente in questo periodo, al punto che ho realizzato di non poter continuare questo lavoro da solo. Questo è ciò che mi ha portato a decidere di rilasciare questa versione.

Ora, sono entusiasta di annunciare il rilascio della tanto attesa versione AlbedoBaseXL V3 Mini. Pur essendo una fusione su scala ridotta, non è limitata a nessun ambito specifico e offre prestazioni notevoli in vari domini. Ha il potenziale di essere una nuova base di modello per SDXL1.0. (Per riferimento, il mio algoritmo di fusione non è un “merge lineare,” quindi può essere considerato essenzialmente un nuovo modello fine-tuned.)

Questo modello, insieme agli esistenti modelli AlbedoBase, è versatile e supera tutte le versioni precedenti sotto ogni aspetto. (Il contenuto NSFW, pur non essendo estremo, offre una gamma espressiva più ampia rispetto alle versioni precedenti come la v2.1. Un modello di fusione NSFW dedicato sarà rilasciato in futuro.)

Inoltre, ho notato che molti modelli condivisi hanno recentemente adottato licenze che vietano la fusione o la commercializzazione esterna. Questo è stato deludente, poiché mi ha impedito di utilizzare alcuni modelli davvero eccellenti per la fusione.

Desidero esprimere la mia sincera gratitudine agli sviluppatori di modelli che hanno fornito licenze gratuite, permettendo che i loro modelli di alta qualità—prodotti di notevole tempo e impegno—possano essere usati per la fusione.

Tornerò presto.

Attendo con impazienza i vostri test delle prestazioni su un’ampia gamma di aree, tra cui ANIME, REALISMO, ARTISTICO, 2.5D, 3D e NSFW.

Come sviluppatori di modelli, seminiamo solo i semi. Sarete infine voi, utenti e artisti, a coltivarli e far fiorire i frutti.

Grazie, come sempre.

Per chi desidera sostenere il mio lavoro con un piccolo contributo economico, consideri gentilmente di utilizzare i link sottostanti. Attualmente non riesco a trovare un impiego e affronto un futuro incerto per il mio sostentamento.

🌱 dona

La griglia caratteristiche(380.5 MB): download

v2.1
Rifusione e regolazione da v0.1 a 2.0 usando il nuovo algoritmo e formula di fusione.

La griglia caratteristiche(424.5 MB): download

v2.0

Vorrei ringraziare tutti coloro che mi hanno aiutato nel progetto AlbedoBase XL Pre. Senza di voi, la data di rilascio sarebbe stata probabilmente molto più tardiva. Grazie mille!

Ho scritto uno script personalizzato per fondere i modelli esistenti AlbedoBase XL in uno solo, allineando meticolosamente i pesi di righe e colonne di tutti i blocchi U-NET e CLIP secondo una formula unica mia.
Se riscontri un bug nella generazione dell'immagine (se non viene generato nulla), prova a passare a CLIP SKIP 2 o modifica leggermente il prompt! Potrebbero esserci combinazioni di prompt non riconosciute da CLIP. In tal caso, puoi cambiare l'ordine delle parole, usare parole diverse o, più semplicemente, modificare il CLIP SKIP. Gradualmente lavorerò per risolvere questi problemi in futuro come in v1.3.

La griglia caratteristiche(403.5 MB): download

v1.3

Per illustrare la qualità legata alla casualità del modello, ho standardizzato il valore seed a '9' per tutte le immagini di esempio destinate al campionamento e ne ho proceduto alla generazione immediata.
Soprattutto con questa versione, a causa dell'effetto significativo dei prompt negativi, lasciare il campo prompt negativo vuoto produce probabilmente la migliore qualità.

La griglia caratteristiche(438.7 MB): download

Come puoi vedere, all’aumentare dei Steps, diventa disponibile per tutti i sampler, e migliora anche la qualità.
Grazie all’effetto delle LoRA da me sviluppate e fuse, come descritto sotto, usare prompt in forma di frase piuttosto che liste di tag è direttamente correlato al miglioramento della qualità.

Ho fuso 45 checkpoint e 7 LoRA. Dopodiché, ho fuso AlbedoBase v0.4 e v0.3 in ordine, meno del 0~5%, per risvegliare i modelli fusi diluiti ormai obsoleti.
Tra le 7 LoRA, una è stata creata da me. Coinvolge l'analisi e l'annotazione di didascalie per un totale di 174 foto pittoriche di alta qualità usando GPT4-V. La fusione di questa LoRA ha prodotto immagini sorprendentemente nitide e una comprensione molto elevata dei prompt.

Le mie LoRA create personalmente sono esclusivamente disponibili all'acquisto per i miei sostenitori Ko-fi al livello Creative o superiore.

v1.2

Fusi gli ultimi 22 checkpoint.

La griglia caratteristiche(565.6 MB): download

v1.1

Stabilizzato.
Piu dettagliato.
Se ti consideri un utente avanzato, raccomando la versione 1.0. Se la versione 1.0 trova le impostazioni giuste, può produrre opere molto più vivide.

La griglia caratteristiche(349.7 MB): download

v1.0

Fusi 106 LoRA.
Fusi 19 Checkpoint.

Il modello può produrre risultati diversi a seconda delle impostazioni scelte, quindi è importante controllare la griglia caratteristiche prima di usarlo.
- Ho scoperto che usare alcuni specifici prompt negativi può aiutare a risolvere problemi come occhi asimmetrici o immagini pixelate. La Griglia Caratteristiche può variare a seconda del dispositivo CPU o GPU, quindi usala come riferimento generale. Prova con qualche prompt negativo per migliorare la qualità (es: strabismo). Ho notato che è difficile soddisfare tutte le impostazioni allo stesso modo con l'aumentare delle LoRA fuse. Tuttavia, vorrei che ti concentrassi su questo vantaggio nella versione 1.0, poiché può produrre opere di qualità sorprendente in molti aspetti con le impostazioni corrette. Tornerò in futuro con una versione più stabile.
Puoi trovare valori di impostazione utili nelle showcase o cercando tra altri utenti.
Come sempre, è meglio lasciare il prompt negativo vuoto per i migliori risultati.
Questa v1.0 ha richiesto molto lavoro, quindi mi prendo una pausa. Spero che ti piaccia usare il modello e, se lo fonderai, condividilo gratuitamente su Civitai. Così potremo continuare a migliorarlo tutti insieme.

La griglia caratteristiche(479.4 MB): download

v0.4

Fusi 132 LoRA.
Fusi 4 Checkpoint.

La griglia caratteristiche: download

v0.3

Miglioramenti in tutti i sampler.
Realismo vivo raggiunto.
Stabilizzato.

La griglia caratteristiche: download

v0.2

Miglioramenti significativi in chiarezza e dettagli.
Migliorata implementazione di mani e piedi.
Importanti miglioramenti estetici; composizione, astrazione, flusso, luce e colore, ecc.

v0.1

Dopo un appropriato fine-tuning sul modello SDXL1.0, fuso meticolosamente e con uno scopo oltre 40 modelli di alta qualità disponibili pubblicamente su Civitai.
I test si sono concentrati soprattutto nell'assicurare la massima qualità usando il minimo numero di token nel prompt, e non è stato confermato quanto la qualità possa migliorare usando un gran numero di token. (Per favore esegui i tuoi test e condividi i risultati)
Solitamente, i risultati più belli si ottengono a metà strada tra realtà e animazione.
Tuttavia, usando un prompt appropriato, generalmente non c'è nulla che non possa esprimere. (Afferma di possedere un valore abbondante come modello base superiore ad altri nella fusione. Tuttavia, considera che questa è attualmente la v0.1)

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

Shuttle 3 Diffusion - bf16

WaduStyle - V1

Usa questo modello