modelli/AlbedoBase XL - v1.3

AlbedoBase XL - v1.3

Luca Bianchi

7/22/2025

1:35:14 PM

| Discussion|

Parole Chiave e Tag Correlati

Ritratto iperrealistico di una donna anziana che somiglia a Amelia Earhart, vestita in moda anni '70, che fa l'occhiolino alla fotocamera mentre tiene una tazza di caffè bianca in un ambiente interno accogliente.

Una giovane cheerleader bruna che balla con gonna verde e top bianco con rifiniture rosse su un campo di uno stadio di calcio, atmosfera vibrante

Giovane cheerleader bruna che danza con un vivace completo sportivo blu e rosso in uno stadio di calcio con la folla sullo sfondo

Una cheerleader con una maglia sportiva rossa e una gonna plissettata bianca danza su un campo da calcio con una folla nello stadio sullo sfondo.

Dipinto realistico di una giovane donna con capelli lunghi che indossa una minigonna bianca e una maglia azzurro chiaro, in piedi in una sala da bowling con bocce ai lati.

Prompt Negativi Consigliati

strabismus

Parametri Consigliati

samplers

DPM++ 2M SDE Heun Exponential

steps

cfg

resolution

720x1280, 1024x1024

vae

included VAE

Suggerimenti

Se la generazione dell'immagine non produce risultati, prova a passare a CLIP SKIP 2 o modifica leggermente il prompt cambiando ordine o parole.

L'uso di prompt in forma di frasi tende a migliorare la qualità delle immagini più rispetto ai prompt con lista di tag.

Lasciare il campo del prompt negativo vuoto spesso dà risultati migliori.

Controlla la griglia delle specifiche per le impostazioni ottimali prima di usare il modello.

Sperimenta con alcuni prompt negativi specifici come 'strabismo' per risolvere problemi come occhi asimmetrici o pixelazione.

Punti Salienti della Versione

v1.3

Per illustrare la qualità legata alla casualità del modello, ho standardizzato il valore seed a '9' per tutte le immagini di demo destinate al campionamento e ne ho generato immediatamente.
Soprattutto con questa versione, a causa dell'impatto significativo dei prompt negativi, lasciare il campo prompt negativo vuoto dovrebbe produrre la migliore qualità.

La griglia delle specifiche(438,7 MB): scarica

Come puoi vedere, all'aumentare del numero di Steps, diventa disponibile per tutti i sampler e la qualità migliora.
Grazie all'effetto del LoRA che ho sviluppato e fuso, come descritto di seguito, usare prompt in forma di frasi anziché tag (lista di parole) è direttamente correlato al miglioramento della qualità.

Ho fuso 45 checkpoint e 7 LoRA. Successivamente ho fuso AlbedoBase v0.4 e v0.3 in ordine, meno del 0~5%, per risvegliare i modelli fusi diluiti diventati obsoleti.
Tra le 7 LoRA, una è creata da me. Consiste nell'analizzare e annotare didascalie per un totale di 174 foto pittoriche di alta qualità usando GPT4-V. La fusione di questa LoRA ha prodotto immagini sorprendentemente chiare e una comprensione impressionante dei prompt.

Le mie LoRA auto-create sono disponibili esclusivamente all'acquisto per i miei supporter Ko-fi al livello Creative o superiore. Prevedo di rilasciare sempre più aggiornamenti in futuro. I prezzi variano da 10 a 50 dollari.

Sponsor del Creatore

Se hai trovato valore nel modello, considera di offrire il tuo supporto. Il tuo contributo sarà interamente dedicato all'avanzamento della comunità SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquista ㅤ|ㅤ 🌱 dona

Se hai trovato valore nel modello, considera di offrire il tuo supporto. Il tuo contributo sarà interamente dedicato all'avanzamento della comunità SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquistaㅤ |ㅤ 🌱 dona

AlbedoBase XL (SFW&NSFW)

Il refiner non è necessario e il VAE è incluso.

OBIETTIVO

Stable Diffusion XL ha 3,5 miliardi di parametri (escludendo il Refiner), circa 3,6 volte più di SD v1.5. Credo che questo non sia solo un numero, ma un valore che può portare a un miglioramento significativo delle prestazioni.

È da tempo che abbiamo realizzato che le prestazioni complessive di SD v1.5 sono migliorate oltre ogni immaginazione grazie ai contributi esplosivi della nostra comunità. Perciò sto lavorando per completare questo modello AlbedoBase XL per riprodurre in modo ottimale il miglioramento delle prestazioni avvenuto in v1.5 anche in questa versione XL.

Il mio obiettivo è testare direttamente le prestazioni di tutti i Checkpoint e LoRA pubblicamente caricati su Civitai e unire solo le risorse giudicate ottimali dopo diversi filtri. Questo supererà le prestazioni dell'AI di generazione immagini di aziende come Midjourney.

Al momento, AlbedoBase XL v3.1 Large ha fuso circa 200 checkpoint selezionati e 251 LoRA.

LOG

v3.1-Large

• Fusi oltre 50 ultime versioni selezionate di modelli SDXL usando lo script ricorsivo impiegato in V3.

La griglia delle specifiche(370,7 MB): scarica

v3-mini

Mi scuso sinceramente per avervi fatto aspettare così a lungo.

Ho affrontato questioni personali e, mentre lavoravo sulla nuova versione, ho anche avuto problemi di salute. Ancora ora, mentre scrivo, sto combattendo con queste difficoltà.

Ho sentito che una breve aggiornamento non sarebbe stato sufficiente, quindi vi chiedo comprensione mentre condivido questo messaggio più dettagliato.

Da quando è uscita la versione 2.0, mi sto dedicando allo studio del deep learning in modo indipendente. Non ho una laurea formale e, a parte una modesta attitudine alla programmazione, il mio background è nelle arti. Di conseguenza, mi manca la base matematica e scientifica per ottenere grandi progressi, dato il tempo e lo sforzo investiti. Tuttavia, questa esperienza di studio e ricerca autonoma è stata un tesoro inestimabile nella mia vita.

Recentemente ho avuto un'idea che potrebbe essere una svolta significativa. Dopo aver rielaborato centinaia di formule e metodi dalla versione 2.0, sono riuscito a sviluppare un algoritmo piuttosto interessante e di successo. Il processo di fusione dei modelli si è basato su SDXL1.0 e SD1.5, insieme ad altri modelli accuratamente selezionati. Questi sono stati categorizzati in cinque classificazioni principali: “ANIME,” “REALISMO,” “ARTISTICO,” “NSFW,” e “BASE,” e alimentati nell'algoritmo di fusione come dataset. Questo approccio ha prodotto risultati affascinanti.

Tuttavia, tanto impegnativo quanto è stato sviluppare l'algoritmo, nulla è stato più arduo della fase di test delle prestazioni. La mia salute fisica e mentale si è deteriorata notevolmente durante questo periodo, fino a capire che non potevo continuare da solo. Questo mi ha spinto a decidere di rilasciare questa versione.

Sono quindi entusiasta di annunciare il rilascio della tanto attesa versione AlbedoBaseXL V3 Mini. Sebbene questo modello fuso sia su scala più piccola, non è limitato a nessun ambito specifico e funziona egregiamente in vari domini. Ha il potenziale per servire come nuovo modello base per SDXL1.0. (Per riferimento, il mio algoritmo di fusione non è una “fusione lineare,” quindi può essere considerato essenzialmente un nuovo modello fine-tuned.)

Questo modello, insieme ai modelli AlbedoBase esistenti, è versatile e supera tutte le versioni precedenti in ogni aspetto. (I contenuti NSFW, pur non essendo estremi, offrono una gamma più ampia di espressioni rispetto alle versioni precedenti come la v2.1. Un modello dedicato per la fusione NSFW sarà rilasciato in futuro.)

Da un altro punto di vista, ho notato che molti modelli condivisi hanno iniziato recentemente ad adottare licenze che vietano la fusione o la commercializzazione esterna. Questo è stato deludente, perché mi ha impedito di utilizzare alcuni modelli veramente eccellenti per la fusione.

Vorrei esprimere la mia profonda gratitudine agli sviluppatori di modelli che hanno fornito licenze gratuite, permettendo così che i loro modelli di alta qualità—frutto di notevoli tempi e sforzi—possano essere usati per la fusione.

Tornerò presto.

Attendo con ansia i vostri test delle prestazioni in un'ampia gamma di aree, inclusi ANIME, REALISMO, ARTISTICO, 2.5D, 3D e NSFW.

Come sviluppatori di modelli, noi piantiamo solo i semi. Siete voi, utenti e artisti dei modelli, a coltivarli e far fiorire i frutti.

Grazie, come sempre.

Per chi desidera supportare il mio lavoro con un piccolo contributo finanziario, considerate i link seguenti. Attualmente non posso assicurarmi un impiego e il mio futuro economico è incerto.

🌱 dona

La griglia delle specifiche(380,5 MB): scarica

v2.1
Rifusione e aggiustamento da v0.1 a 2.0 usando il nuovo algoritmo di fusione e formula.

La griglia delle specifiche(424,5 MB): scarica

v2.0

Vorrei ringraziare tutti coloro che mi hanno aiutato nel progetto AlbedoBase XL Pre. Senza di voi, la data di rilascio sarebbe probabilmente stata molto più tardiva. Grazie di cuore!

Ho scritto uno script personalizzato per convergere insieme i modelli AlbedoBase XL esistenti. Allineando accuratamente i pesi di riga e colonna di tutti i blocchi U-NET e CLIP secondo una formula unica sviluppata da me.
Se incontri un bug nella generazione delle immagini (se non viene generato nulla), prova a passare a CLIP SKIP 2 o modifica leggermente il prompt! Potrebbero esserci combinazioni di prompt non riconosciute da CLIP. In tal caso, puoi cambiare l'ordine delle parole, usare parole diverse o, più semplicemente, modificare il CLIP SKIP. Lavorerò gradualmente per risolvere questi problemi in futuro come in v1.3.

La griglia delle specifiche(403,5 MB): scarica

v1.3

Per illustrare la qualità legata alla casualità del modello, ho standardizzato il valore seed a '9' per tutte le immagini di demo destinate al campionamento e ne ho generato immediatamente.
Soprattutto con questa versione, a causa dell'impatto significativo dei prompt negativi, lasciare il campo prompt negativo vuoto dovrebbe produrre la migliore qualità.

La griglia delle specifiche(438,7 MB): scarica

Come puoi vedere, all'aumentare del numero di Steps, diventa disponibile per tutti i sampler e la qualità migliora.
Grazie all'effetto del LoRA che ho sviluppato e fuso, come descritto di seguito, usare prompt in forma di frasi anziché tag (lista di parole) è direttamente correlato al miglioramento della qualità.

Ho fuso 45 checkpoint e 7 LoRA. Successivamente ho fuso AlbedoBase v0.4 e v0.3 in ordine, meno del 0~5%, per risvegliare i modelli fusi diluiti diventati obsoleti.
Tra le 7 LoRA, una è creata da me. Consiste nell'analizzare e annotare didascalie per un totale di 174 foto pittoriche di alta qualità usando GPT4-V. La fusione di questa LoRA ha prodotto immagini sorprendentemente chiare e una comprensione impressionante dei prompt.

Le mie LoRA auto-create sono disponibili esclusivamente all'acquisto per i miei supporter Ko-fi al livello Creative o superiore. Prevedo di rilasciare sempre più aggiornamenti in futuro. I prezzi variano da 10 a 50 dollari.

v1.2

Fusi gli ultimi 22 checkpoint.

La griglia delle specifiche(565,6 MB): scarica

v1.1

Stabilizzato.
Più dettagliato.
Se pensi di essere un utente avanzato, ti consiglio la versione 1.0. Se la versione 1.0 trova le impostazioni giuste, può produrre lavori molto più vividi.

La griglia delle specifiche(349,7 MB): scarica

v1.0

Fusi 106 LoRA.
Fusi 19 Checkpoint.

Il modello può produrre risultati diversi a seconda delle impostazioni scelte, quindi è importante controllare la griglia delle specifiche prima di usarlo.
- Ho scoperto che l'uso di alcuni prompt negativi specifici può aiutare a risolvere problemi come occhi asimmetrici o immagini pixelate. La griglia delle specifiche può variare a seconda del tuo dispositivo CPU o GPU, quindi usala come riferimento generale. Sperimenta con alcuni prompt negativi per migliorare la qualità (es: strabismo). Ho trovato difficile soddisfare tutte le impostazioni allo stesso modo con l'aumento delle LoRA fuse. Tuttavia, vorrei che ti concentrassi su questo vantaggio nella versione 1.0, poiché può produrre lavori di qualità sorprendente in vari aspetti con le impostazioni giuste. Tornerò con una versione più stabile in futuro.
Puoi trovare valori utili per le impostazioni nelle demo o cercando altri.
Come sempre, è meglio lasciare il prompt negativo vuoto per ottenere i migliori risultati.
Questa v1.0 è stata molto lavoro, quindi sto prendendo una pausa. Spero ti piaccia usare il modello e, se lo fonde, condividilo su Civitai gratuitamente. Così potremo continuare a migliorarlo insieme.

La griglia delle specifiche(479,4 MB): scarica

v0.4

Fusi 132 LoRA.
Fusi 4 Checkpoint.

La griglia delle specifiche: scarica

v0.3

Migliorato in tutti i sampler.
Raggiunto realismo vivido.
Stabilizzato.

La griglia delle specifiche: scarica

v0.2

Miglioramenti significativi nella chiarezza e nei dettagli.
Migliorata l'implementazione di mani e piedi.
Miglioramenti estetici maggiori; composizione, astrazione, flusso, luce e colore, ecc.

v0.1

Dopo un fine-tuning appropriato sul modello SDXL1.0, ho meticolosamente e intenzionalmente fuso oltre 40 modelli di alta qualità pubblicamente disponibili su Civitai.
I test si sono concentrati principalmente sull'assicurare la massima qualità con il minimo numero di token nel prompt, e non è stato confermato quanto la qualità possa migliorare usando molti token. (Ti invito a fare i tuoi test e condividere i risultati)
Tipicamente, i risultati più belli si ottengono a metà strada tra realtà e animazione.
Tuttavia, usando un prompt appropriato, in generale non c’è nulla che non possa esprimere. (Affermo che possiede un grande valore come modello base che supera altri modelli in fusione. Comunque, tieni presente che questa è attualmente la v0.1)

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

🥂🎆SDXL FaeTastic🎆🥂 - v24

Photo Factory - V1

Usa questo modello