modelli/AlbedoBase XL - v2.0

AlbedoBase XL - v2.0

7/31/2025

1:21:18 PM

Parole Chiave e Tag Correlati

2d,3d,albedobase xl,albedobond,tutto in uno,anime,modello base,checkpoint,cinematografico,gioco,lora,fusione dei modelli,fotorealistico,sdxl 1.0,sdxl1.0,stable diffusion xl,definitivo,unificare,v2.0

Un nucleo bioluminescente luminoso all'interno dei detriti di un pianeta distrutto che fluttua inquietante sopra un paesaggio roccioso scuro nello spazio.

Una figura fotorealistica che somiglia a un fungo amanita muscaria con un grande cappello rosso in piedi in una foresta magica al tramonto blu, circondata da funghi più piccoli e fogliame vibrante.

Una donna in tuta spaziale blu si trova all'interno di una stazione spaziale, le sue mani sollevate espressivamente vicino a una grande finestra che mostra la Terra sullo sfondo, catturata con colori profondi e una grana sottile.

Robot endoscheletro T800 che indossa una maglietta bianca strappata e pantaloni della tuta blu che tiene un cesto contenente pelle umana in una lavanderia interna con illuminazione cinematografica e alto dettaglio.

Foresta esotica vibrante in stile LEGO con un fiume d'acqua cristallina che scorre, sotto cieli azzurri brillanti e bagliore solare, dettagliata con verdeggianti piante LEGO.

Prompt Negativi Consigliati

strabismus,asymmetrical eyes,pixelated images

amateur quality, vague shapes, vague texture, wrong perspective, ugly, dowdy style

Parametri Consigliati

samplers

DPM++ 2M SDE Heun Karras

steps

cfg

clip skip

resolution

1024x1024, 720x1280

vae

Included VAE - default

Suggerimenti

Se incontri un bug in cui non viene generato nulla, passa a CLIP SKIP 2 o modifica leggermente il prompt.

Usare prompt in forma di frase anziché una lista di tag migliora la qualità dell'immagine.

Lasciare il campo del prompt negativo vuoto spesso produce le immagini di migliore qualità.

Controlla la griglia spec per le impostazioni consigliate prima dell'uso.

Sperimenta con alcuni prompt negativi per risolvere problemi come occhi asimmetrici o pixel.

Punti Salienti della Versione

Ho scritto uno script personalizzato per far convergere gli esistenti modelli AlbedoBase XL in uno solo. Allineando finemente i pesi di riga e colonna di tutti i blocchi U-NET e CLIP secondo una mia formula unica.

Sponsor del Creatore

Se hai trovato valore nel modello, ti preghiamo di considerare di offrire il tuo supporto. Il tuo contributo sarà interamente dedicato all'avanzamento della comunità SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquistaㅤ |ㅤ 🌱 dona

Se hai trovato valore nel modello, ti preghiamo di considerare di offrire il tuo supporto. Il tuo contributo sarà interamente dedicato all'avanzamento della comunità SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquistaㅤ |ㅤ 🌱 dona

AlbedoBase XL (SFW&NSFW)

Il refiner non è necessario e il VAE è incluso.

OBIETTIVO

Stable Diffusion XL ha 3,5 miliardi di parametri (escluso il Refiner), circa 3,6 volte più della versione SD v1.5. Credo che non sia solo un numero, ma un numero che può portare a un notevole miglioramento delle prestazioni.

È passato del tempo da quando ci siamo resi conto che le prestazioni complessive di SD v1.5 sono migliorate oltre ogni immaginazione grazie ai contributi esplosivi della nostra comunità. Pertanto, sto lavorando per completare questo modello AlbedoBase XL al fine di riprodurre in modo ottimale il miglioramento delle prestazioni avvenuto in v1.5 anche in questa versione XL.

Il mio obiettivo è testare direttamente le prestazioni di tutti i Checkpoint e LoRA pubblicamente caricati su Civitai, e fondere solo le risorse giudicate ottimali dopo diversi filtri. Questo supererà le prestazioni delle AI generatrici di immagini di aziende come Midjourney.

Ad oggi, AlbedoBase XL v3.1 Large ha fuso circa 200 checkpoint selezionati e 251 LoRA.

LOG

v3.1-Large

• Fusi oltre 50 ultimi modelli SDXL selezionati usando lo script ricorsivo impiegato in V3.

La griglia spec(370.7 MB): scarica

v3-mini

Mi scuso sinceramente per averti fatto aspettare così a lungo.

Ho avuto alcune questioni personali, e mentre lavoravo alla nuova versione, ho anche affrontato problemi di salute. Anche mentre scrivo questo, sto ancora combattendo con queste sfide.

Ho sentito che non sarebbe stato sufficiente fornire solo un breve aggiornamento, quindi chiedo gentilmente la vostra comprensione mentre condivido questo messaggio più dettagliato.

Dal rilascio della versione 2.0, mi sono dedicato allo studio indipendente del deep learning. Non ho una laurea formale, e a parte una modesta attitudine alla programmazione, il mio background è nelle arti. Di conseguenza, mi manca una solida base matematica e scientifica per ottenere importanti progressi, dato il tempo e l'impegno investiti. Nonostante ciò, l'esperienza di immergermi in questo studio autonomo e nella ricerca è stato un tesoro inestimabile nella mia vita.

Recentemente, ho scoperto un'idea che potrebbe essere una svolta significativa. Dopo aver rielaborato centinaia di formule e metodi dalla versione 2.0, sono riuscito a sviluppare un algoritmo piuttosto interessante e di successo. Il processo di fusione dei modelli si è basato su SDXL1.0 e SD1.5, insieme ad altri modelli accuratamente selezionati. Questi sono stati categorizzati in cinque principali classi: “ANIME,” “REALISMO,” “ARTISTICO,” “NSFW,” e “BASE,” e inseriti nell'algoritmo di fusione come set di dati. Questo approccio ha prodotto risultati affascinanti.

Tuttavia, per quanto difficile sia stato lo sviluppo dell'algoritmo, nulla è stato tanto impegnativo quanto la fase di test delle prestazioni. La mia salute fisica e mentale è peggiorata notevolmente in questo periodo, fino al punto in cui ho capito di non poter continuare questo lavoro da solo. Questo mi ha portato a decidere di rilasciare questa versione.

Ora sono entusiasta di annunciare il rilascio della tanto attesa versione AlbedoBaseXL V3 Mini. Sebbene questo modello sia una fusione su scala più piccola, non è limitato ad alcun settore specifico e funziona molto bene in vari ambiti. Ha il potenziale per fungere da nuovo modello base per SDXL1.0. (Per riferimento, il mio algoritmo di fusione non è una “fusione lineare”, quindi può essere considerato essenzialmente un nuovo modello fine-tuned.)

Questo modello, insieme agli AlbedoBase esistenti, è versatile e supera tutte le versioni precedenti in ogni aspetto. (I contenuti NSFW, pur non essendo estremi, offrono una gamma espressiva più ampia rispetto alle versioni precedenti come la v2.1. Una versione dedicata alla fusione NSFW sarà rilasciata in futuro.)

Inoltre, ho notato che molti modelli condivisi hanno recentemente adottato licenze che vietano la fusione o la commercializzazione esterna. Questo è stato deludente, poiché mi ha impedito di utilizzare alcuni modelli davvero eccellenti per la fusione.

Vorrei esprimere la mia sincera gratitudine agli sviluppatori di modelli che hanno fornito licenze gratuite, permettendo che i loro modelli di alta qualità, frutto di notevole tempo e sforzo, siano utilizzati per la fusione.

Tornerò presto.

Attendo con ansia i vostri test di prestazione in un'ampia gamma di ambiti, inclusi ANIME, REALISMO, ARTISTICO, 2.5D, 3D e NSFW.

Come sviluppatori di modelli, noi piantiamo solo i semi. Siete voi, utenti e artisti dei modelli, a coltivarli e far nascere fiori e frutti.

Grazie, come sempre.

Per chi desidera supportare il mio lavoro con un piccolo contributo finanziario, si prega di considerare l'uso dei link sottostanti. Attualmente non riesco a trovare un impiego e affronto un futuro incerto per il mio sostentamento.

🌱 dona

La griglia spec(380.5 MB): scarica

v2.1
Rifusione e regolazione da v0.1 a 2.0 usando il nuovo algoritmo e formula di fusione.

La griglia spec(424.5 MB): scarica

v2.0

Vorrei ringraziare tutti coloro che mi hanno aiutato sul lato AlbedoBase XL Pre. Senza di voi, la data di rilascio sarebbe probabilmente stata molto più lontana. Grazie mille!

Ho scritto uno script personalizzato per far convergere gli esistenti modelli AlbedoBase XL in uno solo. Allineando finemente i pesi di riga e colonna di tutti i blocchi U-NET e CLIP secondo una mia formula unica.
Se incontri un bug nella generazione delle immagini (se non viene generato nulla), passa a CLIP SKIP 2 o modifica leggermente il prompt! Potrebbero esserci combinazioni di prompt che CLIP non riconosce. In tal caso, puoi cambiare l'ordine delle parole, usare parole diverse o, molto semplicemente, cambiare il CLIP SKIP. Lavorerò gradualmente per risolvere questi problemi in futuro come fatto in v1.3.

La griglia spec(403.5 MB): scarica

v1.3

Per illustrare la qualità legata alla casualità del modello, ho standardizzato il valore del seed a '9' per tutte le immagini di showcase destinate al campionamento e ho proceduto alla loro immediata generazione.
Soprattutto con questa versione, a causa dell'impatto significativo dei prompt negativi, lasciare il campo del prompt negativo vuoto probabilmente produce la migliore qualità.

La griglia spec(438.7 MB): scarica

Come puoi vedere, all'aumentare dei Steps, diventa disponibile per tutti i sampler, e la qualità migliora.
Grazie all'effetto delle LoRA che ho sviluppato e fuso, come descritto sotto, utilizzare prompt in forma di frase piuttosto che una lista di tag direttamente migliora la qualità.

Ho fuso 45 checkpoint e 7 LoRA. Dopo di che, ho fuso AlbedoBase v0.4 e v0.3 in ordine, meno del 0~5%, per risvegliare i modelli fusi diluiti che erano diventati obsoleti.
Tra le 7 LoRA, una è creata da me. Coinvolge l'analisi e annotazione di didascalie per un totale di 174 foto figurative di alta qualità usando GPT4-V. La fusione di questa LoRA ha prodotto immagini sorprendentemente chiare e un'impressionante comprensione dei prompt.

Le mie LoRA auto-create sono disponibili esclusivamente per l'acquisto ai miei sostenitori Ko-fi al livello Creative o superiore.

v1.2

Fusi gli ultimi 22 checkpoint.

La griglia spec(565.6 MB): scarica

v1.1

Stabilizzato.
Più dettagliato.
Se ti consideri un utente avanzato, raccomando la versione 1.0. Se la versione 1.0 trova le impostazioni giuste, può produrre lavori molto più vividi.

La griglia spec(349.7 MB): scarica

v1.0

Fusi 106 LoRA.
Fusi 19 Checkpoint.

Il modello può produrre risultati diversi a seconda delle impostazioni che scegli, quindi è importante controllare la griglia spec prima di usarlo.
- Ho scoperto che usare alcuni prompt negativi specifici può aiutare a risolvere il problema degli occhi asimmetrici o delle immagini pixellate. La griglia Spec può variare in base alla CPU o GPU che usi, quindi usala come riferimento generale. Prova qualche prompt negativo per migliorare la qualità (es: strabismo). Ho notato che è difficile soddisfare tutte le impostazioni allo stesso modo con l'aumento delle LoRA fuse. Tuttavia, ti invito a concentrarti su questo vantaggio nella versione 1.0, poiché con le impostazioni giuste può produrre lavori di qualità sorprendente in vari aspetti. Tornerò con una versione più stabile in futuro.
Puoi trovare valori di impostazione utili nello showcase o cercando altri utenti.
Come sempre, è meglio lasciare il prompt negativo vuoto per i migliori risultati.
Questa versione v1.0 è stata un lavoro impegnativo, quindi mi prendo una pausa. Spero che ti piaccia usare il modello e, se lo fondi, per favore condividilo gratuitamente su Civitai. In questo modo, tutti possiamo continuare a migliorarlo.

La griglia spec(479.4 MB): scarica

v0.4

Fusi 132 LoRA.
Fusi 4 Checkpoint.

La griglia spec: scarica

v0.3

Migliorato in tutti i sampler.
Raggiunto realismo vivido.
Stabilizzato.

La griglia spec: scarica

v0.2

Notevoli miglioramenti in chiarezza e dettaglio.
Migliorata l'implementazione di mani e piedi.
Grandi miglioramenti estetici; composizione, astrazione, flusso, luce e colore, ecc.

v0.1

Dopo un appropriato fine-tuning sul modello SDXL1.0, unisce meticolosamente e volutamente oltre 40 modelli di alta qualità disponibili pubblicamente su Civitai.
I test si sono concentrati principalmente sull'assicurare la massima qualità con il numero minimo di token del prompt, e non è stato confermato quanto la qualità possa migliorare usando un gran numero di token. (Si prega di condurre i propri test e condividere i risultati)
In genere, i risultati più belli si ottengono a metà strada tra realtà e animazione.
Nonostante ciò, con un prompt appropriato, generalmente non c'è nulla che non possa esprimere. (Afferma di possedere un valore abbondante come modello base che supera altri nella fusione. Tuttavia, tieni presente che questa è attualmente la versione v0.1)

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

SocaRealism XL - 1.3

Foto Stock Realistica - v2.0

Usa questo modello