modelli/AlbedoBase XL - v1.1

AlbedoBase XL - v1.1

Luca Bianchi

7/29/2025

2:21:24 AM

| Discussion|

Parole Chiave e Tag Correlati

Ritratto subacqueo di una donna montserratiana dai capelli bianchi con occhi chiusi e un'espressione stanca, circondata da grandi carpe arancioni e bianche che nuotano con grazia.

Vista laterale ravvicinata di una lucertola colorata con squame vivaci che prende il sole su un ceppo, catturata con fotografia macro.

Primo piano di un martin pescatore appollaiato su corteccia muschiosa vicino a acqua blu profonda con nebbia mattutina e luce dell'alba

Prompt Negativi Consigliati

strabismus

inconsiderate details

Parametri Consigliati

samplers

DPM++ 3M SDE Karras

steps

cfg

resolution

768x1008, 1024x1024, 768x1024

vae

included VAE

Parametri Consigliati per Alta Risoluzione

upscaler

4x-UltraSharp

upscale

1.35

steps

denoising strength

0.45 - 0.52

Suggerimenti

Se la generazione dell'immagine non produce risultati, prova a passare a CLIP SKIP 2 o modifica leggermente il prompt cambiando l'ordine o la formulazione.

L'uso di prompt in forma di frase tende a migliorare la qualità dell'immagine più dei prompt a lista di tag.

Lasciare vuoto il campo del prompt negativo spesso porta a risultati d'immagine migliori.

Controlla la spec grid per le impostazioni ottimali prima dell'uso.

Sperimenta con alcuni specifici prompt negativi come 'strabismo' per risolvere problemi quali occhi asimmetrici o pixelatura.

Punti Salienti della Versione

v1.1

Stabilizzato.
Più dettagliato.
Se ti consideri un utente avanzato, consiglio la versione 1.0. Se in versione 1.0 trovi le impostazioni giuste, può produrre lavori molto più vividi.

La spec grid(349.7 MB): scarica

Sponsor del Creatore

Se hai trovato valore nel modello, considera di offrire il tuo supporto. Il tuo contributo sarà interamente dedicato a far progredire la comunità SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquista ㅤ|ㅤ 🌱 dona

Se hai trovato valore nel modello, considera di offrire il tuo supporto. Il tuo contributo sarà interamente dedicato a far progredire la comunità SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquistaㅤ |ㅤ 🌱 dona

AlbedoBase XL (SFW&NSFW)

Il refiner non è necessario e il VAE è incluso.

OBIETTIVO

Stable Diffusion XL ha 3,5 miliardi di parametri (escluso il Refiner), circa 3,6 volte di più rispetto alla versione SD v1.5. Credo che si tratti non solo di un numero, ma di un numero che può portare a un significativo miglioramento delle prestazioni.

È passato un po' di tempo da quando abbiamo capito che la prestazione complessiva di SD v1.5 è migliorata oltre ogni immaginazione grazie ai contributi esplosivi della nostra comunità. Perciò sto lavorando al completamento di questo modello AlbedoBase XL per riprodurre in modo ottimale il miglioramento delle prestazioni avvenuto in v1.5 anche in questa versione XL.

Il mio obiettivo è testare direttamente le prestazioni di tutti i Checkpoint e Le LoRA caricati pubblicamente su Civitai, unendo solo le risorse ritenute ottimali dopo diversi filtri. Questo supererà le prestazioni delle AI di generazione immagini di aziende come Midjourney.

Al momento, AlbedoBase XL v3.1 Large ha unito circa 200 checkpoint selezionati e 251 LoRA.

LOG

v3.1-Large

• Unito oltre 50 versioni selezionate più recenti di modelli SDXL usando lo script ricorsivo impiegato in V3.

La spec grid(370.7 MB): scarica

v3-mini

Mi scuso sinceramente per averti fatto aspettare così a lungo.

Ho avuto a che fare con questioni personali e, mentre lavoravo alla nuova versione, ho anche affrontato problemi di salute. Anche mentre scrivo, sto ancora lottando con queste sfide.

Ho sentito che non sarebbe stato sufficiente fornire solo un breve aggiornamento, quindi chiedo gentilmente la tua comprensione mentre condivido questo messaggio più dettagliato.

Da quando è uscita la versione 2.0, mi sono dedicato allo studio del deep learning in modo indipendente. Non ho una laurea formale e, a parte una modesta attitudine alla programmazione, il mio background è solo nelle arti. Di conseguenza, mi manca la base matematica e scientifica per ottenere grandi progressi, dato il tempo e lo sforzo investiti. Nonostante ciò, l'esperienza di immergermi in questo studio e ricerca autodiretti è stato un tesoro inestimabile nella mia vita.

Recentemente, ho trovato un'idea che potrebbe essere una svolta importante. Dopo aver rivisto centinaia di formule e metodi dalla versione 2.0, sono riuscito a sviluppare un algoritmo piuttosto intrigante e di successo. Il processo di fusione del modello si basava su SDXL1.0 e SD1.5, insieme ad altri modelli accuratamente selezionati. Questi sono stati categorizzati in cinque classificazioni principali: “ANIME,” “REALISMO,” “ARTISTICO,” “NSFW,” e “BASE,” ed inseriti nell'algoritmo di fusione come dataset. Questo approccio ha prodotto risultati affascinanti.

Tuttavia, per quanto lo sviluppo dell'algoritmo sia stato impegnativo, nulla è stato così arduo come la fase di test delle prestazioni. La mia salute fisica e mentale è peggiorata significativamente in questo periodo, fino al punto in cui ho capito che non potevo continuare questo lavoro da solo. Questo mi ha portato alla decisione di rilasciare questa versione.

Ora sono entusiasta di annunciare il rilascio della tanto attesa versione AlbedoBaseXL V3 Mini. Sebbene questo modello sia una fusione su scala più piccola, non è limitato a nessun ambito specifico e funziona remarquabilmente bene in vari domini. Ha il potenziale per servire come nuovo modello base per SDXL1.0. (Per riferimento, il mio algoritmo di fusione non è una “fusione lineare,” quindi può essere considerato essenzialmente un nuovo modello fine-tuned.)

Questo modello, insieme ai modelli AlbedoBase esistenti, è versatile e supera tutte le versioni precedenti in ogni aspetto. (Il contenuto NSFW, pur non essendo estremo, offre una gamma più ampia di espressioni rispetto alle versioni precedenti come la v2.1. Un modello di fusione NSFW dedicato sarà rilasciato in futuro.)

Ho inoltre notato che molti modelli condivisi recentemente hanno adottato licenze che vietano la fusione o la commercializzazione esterna. Questo è stato una delusione, poiché mi ha impedito di usare per la fusione alcuni modelli davvero eccellenti.

Vorrei esprimere la mia sincera gratitudine agli sviluppatori di modelli che hanno fornito licenze gratuite, permettendo ai loro modelli di alta qualità—frutto di considerevole tempo e impegno—di essere usati per la fusione.

Tornerò presto.

Attendo con ansia i vostri test di prestazioni in un'ampia gamma di ambiti, tra cui ANIME, REALISMO, ARTISTICO, 2.5D, 3D e NSFW.

Come sviluppatori di modelli, noi piantiamo solo i semi. Spetta a voi, utenti e artisti dei modelli, coltivarli e far fiorire i frutti.

Grazie, come sempre.

Per chi desidera supportare il mio lavoro con un piccolo contributo finanziario, considerate l'uso dei link qui sotto. Al momento non posso trovare un impiego e affronto un futuro incerto riguardo al mio sostentamento.

🌱 dona

La spec grid(380.5 MB): scarica

v2.1
Rifusione e adeguamento della v0.1 alla 2.0 utilizzando il nuovo algoritmo e formula di fusione.

La spec grid(424.5 MB): scarica

v2.0

Vorrei ringraziare tutti coloro che mi hanno aiutato nella fase AlbedoBase XL Pre. Senza di voi, la data di rilascio sarebbe probabilmente stata molto più tardi. Grazie infinite!

Ho scritto uno script personalizzato per fondere gli esistenti modelli AlbedoBase XL in uno solo, allineando in modo accurato i pesi delle righe e colonne di tutti i blocchi U-NET e CLIP secondo una mia formula unica.
Se riscontri problemi nella generazione di immagini (nessun risultato), prova a passare a CLIP SKIP 2 o modifica leggermente il prompt! Ci potrebbero essere combinazioni di prompt che CLIP non riconosce. In tal caso, puoi cambiare l’ordine delle parole, usare parole diverse o, più semplicemente, cambiare il CLIP SKIP. Lavorerò gradualmente per risolvere questi problemi in futuro come in v1.3.

La spec grid(403.5 MB): scarica

v1.3

Per illustrare la qualità associata alla casualità del modello, ho standardizzato il valore del seed a '9' per tutte le immagini di esempio destinate al sampling ed ho proceduto alla generazione immediata.
Soprattutto con questa versione, a causa dell'impatto significativo dei prompt negativi, lasciare il campo del prompt negativo vuoto è probabilmente la scelta per una qualità migliore.

La spec grid(438.7 MB): scarica

Come puoi vedere, all'aumentare dei Steps, il modello diventa disponibile per tutti i campionatori e la qualità migliora.
Grazie all'effetto della LoRA che ho sviluppato e unito, come descritto sotto, l'uso di prompt in forma di frase invece che di tag (lista di parole) è direttamente collegato al miglioramento della qualità.

Ho unito 45 checkpoint e 7 LoRA. Successivamente, ho fuso in ordine AlbedoBase v0.4 e v0.3 con una percentuale inferiore allo 0~5%, per risvegliare i modelli fusi sbiaditi e datati.
Tra le 7 LoRA, una è stata creata da me. Questa coinvolge l'analisi e annotazione delle didascalie per un totale di 174 foto pittoriche di alta qualità utilizzando GPT4-V. La fusione di questa LoRA ha portato a immagini sorprendentemente nitide e a una comprensione eccellente dei prompt.

Le mie LoRA autoprodotte sono esclusivamente disponibili per l'acquisto ai sostenitori Ko-fi di livello Creative o superiore.

v1.2

Fusione degli ultimi 22 checkpoint.

La spec grid(565.6 MB): scarica

v1.1

Stabilizzato.
Più dettagliato.
Se ti consideri un utente avanzato, consiglio la versione 1.0. Se in versione 1.0 trovi le impostazioni giuste, può produrre lavori molto più vividi.

La spec grid(349.7 MB): scarica

v1.0

Unito 106 LoRA.
Uniti 19 Checkpoint.

Il modello può produrre risultati diversi in base alle impostazioni scelte, quindi è importante controllare la spec grid prima di usarlo.
- Ho constatato che usare alcuni prompt negativi specifici può aiutare a risolvere problemi come occhi asimmetrici o immagini pixelate. La Spec Grid può variare a seconda della CPU o GPU, quindi usala come riferimento generale. Sperimenta con alcuni prompt negativi per migliorare la qualità (es; strabismo). Ho notato che è difficile soddisfare tutte le impostazioni allo stesso modo man mano che il numero di LoRA uniti aumenta. Tuttavia, vorrei che ti concentrassi su questo vantaggio nella versione 1.0, poiché può produrre lavori di qualità sorprendente in vari aspetti con le impostazioni giuste. Tornerò con una versione più stabile in futuro.
Puoi trovare valori utili delle impostazioni nelle showcase o cercando altri utenti.
Come sempre, è meglio lasciare il prompt negativo vuoto per i migliori risultati.
Questa v1.0 è stata un lavoro intenso, quindi farò una pausa. Spero che ti divertirai ad usarlo e, se lo fonderai, condividilo su Civitai gratuitamente. In questo modo possiamo continuare a migliorarlo tutti insieme.

La spec grid(479.4 MB): scarica

v0.4

Fusi 132 LoRA.
Fusi 4 Checkpoint.

La spec grid: scarica

v0.3

Migliorato tutti i campionatori.
Raggiunto realismo vivido.
Stabilizzato.

La spec grid: scarica

v0.2

Miglioramenti significativi in chiarezza e dettagli.
Migliorate implementazioni di mani e piedi.
Importanti migliorie estetiche; composizione, astrazione, flusso, luce e colore, ecc.

v0.1

Dopo un fine-tuning appropriato sul modello SDXL1.0, unito meticolosamente e con uno scopo oltre 40+ modelli di alta qualità disponibili pubblicamente su Civitai.
I test si sono concentrati principalmente nel garantire la qualità massima con il numero minimo di token nel prompt, e non è stato confermato quanto possa migliorare la qualità usando un gran numero di token. (Si prega di effettuare test propri e condividere i risultati)
Generalmente, i risultati più belli si ottengono a metà strada tra realtà e animazione.
Tuttavia, usando un prompt appropriato, generalmente non c'è nulla che non possa esprimere. (Afferma di possedere un valore abbondante come modello di base che supera gli altri in fusione. Tuttavia, tieni presente che questa è attualmente la v0.1)

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

Sasha Vicious - Sasha Vicious

CyberRealistic XL - v5.6

Usa questo modello