modelli/AlbedoBase XL - v2.1

AlbedoBase XL - v2.1

Luca Bianchi

7/7/2025

1:53:51 PM

| Discussion|

Parole Chiave e Tag Correlati

Illustrazione dettagliata di un tornado che vortica su un paesaggio rurale con case e un pickup, raffigurato su pergamena invecchiata con schizzi di inchiostro ed effetti di texture.

Figura di hacker digitalizzato con cappuccio in stile cyberpunk con cavi meccanici e abbigliamento futuristico scuro

Una figura misteriosa e pallida con un lungo cappotto nero fluente che tiene in mano una pistola, si trova su una strada nebbiosa e buia della città con un'auto retrò e un lampione sullo sfondo in stile neo-noir.

Una scena fantasy kawaii con una ragazza dai capelli rossi in un vestito bianco seduta davanti a una grande creatura verde con una bocca larga e dentata, circondata da diversi piccoli animali carini simili a conigli.

Barche e palme in silhouette su un fiume al tramonto con un cielo arancione infuocato in stile collagraph di William Wray.

Due persone in silhouette su una barca da pesca su acqua calma con riflessi di luce solare intensa, opera in stile collagraph di William Wray

Un'anatra antropomorfa con occhiali oldschool e giacca di pelle che guida una moto con un'anatra bianca seduta davanti.

Ritratto di una giovane donna bella con capelli fluenti e look di moda sexy, posata in un cortile di una villa toscana illuminato dal sole con colori vivaci e abbigliamento haute couture.

Veicolo da corsa monoruota retrofuturista con un pilota con casco e giacca di pelle, rappresentato nello stile di una collagrafia di William Wray

Sagoma nera di un uomo in piedi con capelli a punte e giacca, su uno sfondo astratto beige e bianco a schizzi in stile street art.

Tre individui punk con capelli a spillo e tatuaggi vestiti in abbigliamento preppy su sfondo giallo, illustrati con stile spatola ispirato a Dave McKean.

Un'opera collagrafica di William Wray che mostra edifici urbani colorati e quattro persone in piedi su un marciapiede con riflessi sul pavimento bagnato.

Prompt Negativi Consigliati

strabismus

lowres

Parametri Consigliati

samplers

DPM++ 2M SDE Heun Karras

steps

24 - 60

cfg

7.5 - 8

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Suggerimenti

Se la generazione dell'immagine non produce nulla, prova a passare a CLIP SKIP 2 o modifica leggermente il prompt cambiando l'ordine delle parole o usando parole diverse.

Lasciare il campo del prompt negativo vuoto può produrre immagini di buona qualità, specialmente nella versione 1.3.

Usare prompt in forma di frase piuttosto che tag (lista di parole) può migliorare la qualità dell'immagine grazie agli effetti del LoRA.

Controlla la griglia specifiche prima di usare il modello per impostazioni ottimali, disponibile tramite i link di download forniti.

Punti Salienti della Versione

Unione e regolazione da v0.1 a 2.0 usando nuovo algoritmo e formula di fusione.

Sponsor del Creatore

Se hai trovato valore in questo modello, considera di offrire il tuo supporto. Il tuo contributo sarà interamente dedicato all'avanzamento della community SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquista ㅤ|ㅤ 🌱 dona

Se hai trovato valore in questo modello, considera di offrire il tuo supporto. Il tuo contributo sarà interamente dedicato all'avanzamento della community SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquistaㅤ |ㅤ 🌱 dona

AlbedoBase XL (SFW&NSFW)

Il refiner non è necessario e il VAE è incluso.

OBIETTIVO

Stable Diffusion XL ha 3,5 miliardi di parametri (escluso il Refiner), circa 3,6 volte più della versione SD v1.5. Credo che questo non sia solo un numero, ma un dato che può portare a un miglioramento significativo delle prestazioni.

È passato un po' di tempo da quando abbiamo realizzato che la performance complessiva di SD v1.5 è migliorata oltre ogni immaginazione grazie ai contributi esplosivi della nostra comunità. Perciò sto lavorando per completare questo modello AlbedoBase XL per riprodurre in modo ottimale il miglioramento delle prestazioni avvenuto in v1.5 anche in questa versione XL.

Il mio obiettivo è testare direttamente le prestazioni di tutti i Checkpoint e LoRA pubblicamente caricati su Civitai, e unire solo le risorse giudicate ottimali dopo averle fatte passare attraverso vari filtri. Questo supererà le prestazioni delle AI di generazione immagini di aziende come Midjourney.

Ad oggi, AlbedoBase XL v3.1 Large ha unito circa 200 checkpoint selezionati e 251 LoRA.

REGISTRO

v3.1-Large

• Unito oltre 50 versioni selezionate delle ultime versioni dei modelli SDXL usando lo script ricorsivo impiegato in V3.

La griglia specifiche(370.7 MB): scarica

v3-mini

Mi scuso sinceramente per averti fatto attendere così a lungo.

Ho affrontato alcune questioni personali e, mentre lavoravo alla nuova versione, ho avuto anche problemi di salute. Anche mentre scrivo questo, sto ancora lottando con queste difficoltà.

Ho sentito che non sarebbe stato sufficiente fornire un semplice aggiornamento, quindi chiedo la tua comprensione mentre condivido questo messaggio più dettagliato.

Da quando è stata rilasciata la versione 2.0, mi sono dedicato allo studio indipendente del deep learning. Non ho una laurea formale, e a parte una modesta attitudine alla programmazione, il mio background è solo nelle arti. Di conseguenza, mi manca la base matematica e scientifica per ottenere grandi progressi, dato il tempo e l'impegno investiti. Nonostante ciò, l'esperienza di immergermi in questo studio autonomo e ricerca è stata un tesoro inestimabile nella mia vita.

Recentemente ho avuto un’idea che potrebbe rappresentare una svolta significativa. Dopo aver rielaborato centinaia di formule e metodi dalla versione 2.0, sono riuscito a sviluppare un algoritmo piuttosto intrigante e di successo. Il processo di fusione del modello si basava su SDXL1.0 e SD1.5, insieme ad altri modelli accuratamente selezionati. Questi sono stati categorizzati in cinque classificazioni principali: “ANIME”, “REALISMO”, “ARTISTICO”, “NSFW” e “BASE”, e forniti come dataset all'algoritmo di fusione. Questo approccio ha prodotto risultati affascinanti.

Tuttavia, per quanto fosse complesso lo sviluppo dell'algoritmo, nulla è stato così impegnativo come la fase di test delle prestazioni. La mia salute fisica e mentale è peggiorata significativamente in questo periodo, al punto che mi sono reso conto di non poter continuare questo lavoro da solo. Questo è ciò che alla fine mi ha spinto a decidere di rilasciare questa versione.

Ora sono entusiasta di annunciare il rilascio della tanto attesa versione AlbedoBaseXL V3 Mini. Sebbene questo modello sia una fusione su scala minore, non è limitato a un’area specifica e offre prestazioni notevoli in vari domini. Ha il potenziale per servire come nuova base per SDXL1.0. (Per riferimento, il mio algoritmo di fusione non è una “fusione lineare”, quindi può essere considerato essenzialmente un nuovo modello fine-tuned.)

Questo modello, insieme ai modelli AlbedoBase esistenti, è versatile e supera tutte le versioni precedenti in ogni aspetto. (Il contenuto NSFW, pur non essendo estremo, offre una gamma di espressione più ampia rispetto alle versioni precedenti come la v2.1. Un modello dedicato alla fusione NSFW sarà rilasciato in futuro.)

Inoltre, ho notato che molti modelli condivisi recentemente hanno adottato licenze che proibiscono la fusione o la commercializzazione esterna. Questo è stato deludente, poiché mi ha impedito di utilizzare modelli davvero eccellenti per la fusione.

Vorrei esprimere la mia sincera gratitudine agli sviluppatori di modelli che hanno fornito licenze gratuite, permettendo ai loro modelli di alta qualità — frutto di molto tempo e sforzi — di essere utilizzati per la fusione.

Tornerò presto.

Attendo con impazienza i vostri test sulle prestazioni in un ampio spettro di aree, inclusi ANIME, REALISMO, ARTISTICO, 2.5D, 3D e NSFW.

Come sviluppatori di modelli, piantiamo solo i semi. Sarete voi, utenti del modello e artisti, a coltivarli e farli fiorire e fruttificare.

Grazie, come sempre.

Per chi desidera supportare il mio lavoro con un piccolo contributo economico, considera di usare i link sottostanti. Attualmente non riesco a trovare un impiego e affronto un futuro incerto riguardo al mio sostentamento.

🌱 dona

La griglia specifiche(380.5 MB): scarica

v2.1
Nuova fusione e regolazione da v0.1 a 2.0 usando un nuovo algoritmo e formula di fusione.

La griglia specifiche(424.5 MB): scarica

v2.0

Vorrei ringraziare tutti coloro che mi hanno aiutato sul lato AlbedoBase XL Pre. Senza di voi, la data di rilascio sarebbe stata probabilmente molto più tarda. Grazie mille!

Ho scritto uno script personalizzato per convergere i modelli esistenti AlbedoBase XL in uno solo. Allineando meticolosamente i pesi di riga e colonna di tutti i blocchi U-NET e CLIP secondo una formula unica da me sviluppata.
Se incontri un bug nella generazione dell'immagine (se non viene generato nulla), prova a passare a CLIP SKIP 2 o modifica leggermente il prompt! Potrebbero esserci combinazioni di prompt che CLIP non riconosce. In quel caso, puoi cambiare l'ordine delle parole, usare parole diverse o, più semplicemente, cambiare il CLIP SKIP. Continuerò progressivamente a risolvere questi problemi in futuro come in v1.3.

La griglia specifiche(403.5 MB): scarica

v1.3

Per illustrare la qualità associata alla casualità del modello, ho standardizzato il valore del seed a '9' per tutte le immagini di showcase destinate al campionamento e ne ho proceduto alla generazione immediata.
Specialmente con questa versione, a causa dell'impatto significativo dei prompt negativi, lasciare il campo del prompt negativo vuoto probabilmente produrrà qualità ottima.

La griglia specifiche(438.7 MB): scarica

Come puoi vedere, all'aumentare dei Steps, diventa compatibile con tutti i sampler e anche la qualità migliora.
Grazie all’effetto del LoRA che ho sviluppato e unito, come descritto sotto, utilizzare prompt in forma di frase anziché tag (lista di parole) è direttamente collegato al miglioramento della qualità.

Ho unito 45 checkpoint e 7 LoRA. Successivamente, ho unito nell’ordine AlbedoBase v0.4 e v0.3 per meno del 0~5%, per riattivare i modelli uniti che si erano diluiti e diventati obsoleti.
Tra i 7 LoRA, uno è stato creato da me. Coinvolge l’analisi e annotazione di didascalie per un totale di 174 foto pittoriche di alta qualità usando GPT4-V. Unire questa LoRA ha prodotto immagini sorprendenti e un’eccellente comprensione dei prompt.

Le mie LoRA create personalmente sono disponibili esclusivamente per l'acquisto dai miei sostenitori Ko-fi al livello Creative o superiore.

v1.2

Uniti gli ultimi 22 checkpoint.

La griglia specifiche(565.6 MB): scarica

v1.1

Stabilizzato.
Più dettagliato.
Se ti consideri un utente avanzato, ti consiglio la versione 1.0. Se la versione 1.0 trova le impostazioni giuste, può produrre opere molto più vivide.

La griglia specifiche(349.7 MB): scarica

v1.0

Uniti 106 LoRA.
Uniti 19 Checkpoint.

Il modello può produrre risultati diversi a seconda delle impostazioni scelte, quindi è importante controllare la griglia specifiche prima di usarlo.
- Ho scoperto che usare alcuni prompt negativi specifici può aiutare a risolvere il problema di occhi asimmetrici o immagini pixelate. La griglia specifiche può variare a seconda del tuo dispositivo CPU o GPU, quindi usala come riferimento generale. Sperimenta con alcuni prompt negativi per migliorare la qualità (es; strabismo). Ho trovato difficile soddisfare tutte le impostazioni allo stesso modo con l'aumentare del numero di LoRA uniti. Tuttavia, vorrei che ti concentrassi su questo vantaggio nella versione 1.0, poiché può produrre opere di qualità straordinaria in vari aspetti con le impostazioni giuste. Tornerò con una versione più stabile in futuro.
Puoi trovare valori di impostazioni utili nel showcase o cercando altri.
Come sempre, è meglio lasciare il prompt negativo vuoto per i migliori risultati.
Questa v1.0 è stata molto impegnativa, quindi prendo una pausa per un po'. Spero che ti divertirai a usare il modello, e se lo unisci, condividilo su Civitai gratuitamente. In questo modo possiamo migliorarla continuamente tutti insieme.

La griglia specifiche(479.4 MB): scarica

v0.4

Uniti 132 LoRA.
Uniti 4 Checkpoint.

La griglia specifiche: scarica

v0.3

Migliorato in tutti i sampler.
Realismo vivido raggiunto.
Stabilizzato.

La griglia specifiche: scarica

v0.2

Miglioramenti significativi in chiarezza e dettaglio.
Migliorata l'implementazione di mani e piedi.
Maggiori miglioramenti estetici; composizione, astrazione, flusso, luce e colore, ecc.

v0.1

Dopo un appropriato fine-tuning sul modello SDXL1.0, unisce meticolosamente e intenzionalmente oltre 40 modelli di alta qualità resi pubblici su Civitai.
I test si sono concentrati principalmente sull'assicurare la massima qualità con il minimo numero di token nel prompt, e non è stato confermato quanto la qualità possa migliorare usando molti token. (Si prega di condurre i propri test e condividere i risultati)
Tipicamente, i risultati più belli si ottengono a metà tra realtà e animazione.
Tuttavia, usando un prompt appropriato, generalmente non c'è nulla che non possa esprimere. (Afferisco che possiede un valore abbondante come modello base che supera altri nella fusione. Tuttavia, tieni presente che attualmente è v0.1)

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

Fluxartis - Opus I

Embeddings Negative & Positive di Stable Yogi - v1.0

Usa questo modello