Vista della campagna italiana soleggiata con colline ondulate, fattorie, un caratteristico villaggio con tetti in terracotta e nuvole drammatiche sotto un cielo azzurro brillante.
Ritratto inciso in stile grunge in bianco e nero in primo piano estremo di un volto con texture dettagliate e linee espressive, ispirato a Richard Hambleton.
Ritratto astratto scuro di una figura femminile con sagoma nera e vividi schizzi di vernice rossa su sfondo chiaro, ispirato allo stile di Richard Hambleton.
Città futuristica con alte torri cilindriche in vetro situata in un paesaggio montano innevato sotto un cielo drammatico al tramonto.
Uomo cartoon con espressione sconvolta, capelli selvaggi e ricci, occhiali e barba corta che indossa una camicia gialla a quadri con cravatta rossa e bretelle blu su uno sfondo verde testurizzato.
Una miniatura di alpaca bianco e soffice con grandi occhi neri che sta accanto a una piccola casa marrone stampata in 3D.
Un'arte digitale vettoriale vibrante in stile William Wray che mostra un elefante rilassato a forma di mongolfiera colorata con un pinguino stravagante in cima, circondati da palloncini multicolori contro uno sfondo di cielo.
Acquaforte impressionista con silhouette di una donna in abito e cappello in piedi vicino a un fiume, che guarda un piccolo cane, con un classico ponte di Londra e Big Ben sullo sfondo.
Una sagoma in stile carta tagliata di una donna che balla il tango, finemente realizzata in arte in acciaio con influenza kirigami, circondata da forme astratte ondeggianti.

Prompt Consigliati

(incredibly ultra lifelike, perfect professional precise, masterpiece, extremely beautiful, light and shadow

Prompt Negativi Consigliati

strabismus

(worst quality, normal quality, score_3, score_4

Parametri Consigliati

samplers

Euler a, DPM++ 2M SDE Heun

steps

24 - 72

cfg

3 - 9.5

resolution

720x1280, 1024x1024, 1216x832

vae

included VAE

Suggerimenti

Se la generazione dell'immagine non produce risultati, prova a passare a CLIP SKIP 2 o modifica leggermente il prompt cambiando l'ordine o il testo.

L'uso di prompt in forma di frase tende a migliorare più la qualità delle immagini rispetto all'uso di liste di tag.

Lasciare il campo prompt negativo vuoto spesso produce risultati migliori nelle immagini.

Controlla la griglia caratteristiche per impostazioni ottimali prima di usare il modello.

Sperimenta con alcuni prompt negativi specifici come 'strabismo' per risolvere problemi come occhi asimmetrici o pixelazione.

Punti Salienti della Versione

• Fusi oltre 50 delle versioni più recenti selezionate dei modelli SDXL usando lo script ricorsivo impiegato nella V3.

Sponsor del Creatore

Se hai trovato valore nel modello, considera di offrirci il tuo supporto. Il tuo contributo sarà interamente dedicato all'avanzamento della comunità SDXL.

🙋🏼‍♂️ unisciti a noi (discord) ㅤ|ㅤ 🛒 acquista ㅤ|ㅤ 🌱 dona


Se hai trovato valore nel modello, considera di offrirci il tuo supporto. Il tuo contributo sarà interamente dedicato all'avanzamento della comunità SDXL.

🙋🏼‍♂️ unisciti a noi (discord)|ㅤ 🛒 acquistaㅤ |ㅤ 🌱 dona


AlbedoBase XL (SFW&NSFW)

Il refiner non è necessario e il VAE è incluso.


OBIETTIVO

Stable Diffusion XL possiede 3,5 miliardi di parametri (escluso il Refiner), circa 3,6 volte in più della versione SD v1.5. Credo che questo non sia solo un numero, ma un valore in grado di portare a un significativo miglioramento delle prestazioni.

È passato un po' di tempo da quando abbiamo constatato che le performance complessive di SD v1.5 sono migliorate oltre ogni immaginazione grazie ai contributi esplosivi della nostra comunità. Pertanto, sto lavorando a completare questo modello AlbedoBase XL per replicare ottimamente il miglioramento di prestazioni avvenuto in v1.5 anche in questa versione XL.

Il mio obiettivo è testare direttamente le prestazioni di tutti i Checkpoint e LoRA pubblicamente caricati su Civitai, e unire solo le risorse giudicate ottimali dopo vari filtri. Questo supererà le performance delle AI di generazione immagini di aziende come Midjourney.

Ad oggi, AlbedoBase XL v3.1 Large ha fuso circa 200 checkpoint selezionati e 251 LoRA.


LOG

v3.1-Large

• Fusi oltre 50 delle versioni più recenti selezionate dei modelli SDXL usando lo script ricorsivo impiegato nella V3.

La griglia caratteristiche(370.7 MB): download


v3-mini

Mi scuso sinceramente per il lungo tempo di attesa.

Ho avuto a che fare con questioni personali e, mentre lavoravo alla nuova versione, ho anche affrontato problemi di salute. Anche mentre scrivo questo testo, sto ancora lottando con queste sfide.

Ho ritenuto che non bastasse fornire un rapido aggiornamento, quindi chiedo gentilmente comprensione mentre condivido questo messaggio più dettagliato.

Dal rilascio della versione 2.0, mi sono dedicato allo studio indipendente del deep learning. Non ho una laurea formale, e oltre a una modesta predisposizione per la programmazione, ho solo un background artistico. Di conseguenza, mi manca la base matematica e scientifica per compiere grandi scoperte, dato il tempo e l'impegno investiti. Nonostante ciò, l'esperienza di immergermi in questo studio e ricerca autodiretti è stato un tesoro inestimabile nella mia vita.

Recentemente, ho incontrato un'idea che potrebbe essere una svolta significativa. Dopo aver rielaborato centinaia di formule e metodi dalla versione 2.0, sono riuscito a sviluppare un algoritmo piuttosto interessante e di successo. Il processo di fusione dei modelli si basava su SDXL1.0 e SD1.5, insieme ad altri modelli accuratamente selezionati. Questi sono stati categorizzati in cinque classificazioni principali: “ANIME,” “REALISMO,” “ARTISTICO,” “NSFW,” e “BASE,” e alimentati nell'algoritmo di fusione come set di dati. Questo approccio ha prodotto risultati affascinanti.

Tuttavia, per quanto lo sviluppo dell'algoritmo sia stato sfidante, nulla è stato tanto arduo quanto la fase di test delle prestazioni. La mia salute fisica e mentale è peggiorata significativamente in questo periodo, al punto che ho realizzato di non poter continuare questo lavoro da solo. Questo è ciò che mi ha portato a decidere di rilasciare questa versione.

Ora, sono entusiasta di annunciare il rilascio della tanto attesa versione AlbedoBaseXL V3 Mini. Pur essendo una fusione su scala ridotta, non è limitata a nessun ambito specifico e offre prestazioni notevoli in vari domini. Ha il potenziale di essere una nuova base di modello per SDXL1.0. (Per riferimento, il mio algoritmo di fusione non è un “merge lineare,” quindi può essere considerato essenzialmente un nuovo modello fine-tuned.)

Questo modello, insieme agli esistenti modelli AlbedoBase, è versatile e supera tutte le versioni precedenti sotto ogni aspetto. (Il contenuto NSFW, pur non essendo estremo, offre una gamma espressiva più ampia rispetto alle versioni precedenti come la v2.1. Un modello di fusione NSFW dedicato sarà rilasciato in futuro.)

Inoltre, ho notato che molti modelli condivisi hanno recentemente adottato licenze che vietano la fusione o la commercializzazione esterna. Questo è stato deludente, poiché mi ha impedito di utilizzare alcuni modelli davvero eccellenti per la fusione.

Desidero esprimere la mia sincera gratitudine agli sviluppatori di modelli che hanno fornito licenze gratuite, permettendo che i loro modelli di alta qualità—prodotti di notevole tempo e impegno—possano essere usati per la fusione.

Tornerò presto.

Attendo con impazienza i vostri test delle prestazioni su un’ampia gamma di aree, tra cui ANIME, REALISMO, ARTISTICO, 2.5D, 3D e NSFW.

Come sviluppatori di modelli, seminiamo solo i semi. Sarete infine voi, utenti e artisti, a coltivarli e far fiorire i frutti.

Grazie, come sempre.


Per chi desidera sostenere il mio lavoro con un piccolo contributo economico, consideri gentilmente di utilizzare i link sottostanti. Attualmente non riesco a trovare un impiego e affronto un futuro incerto per il mio sostentamento.

🌱 dona

La griglia caratteristiche(380.5 MB): download


v2.1
Rifusione e regolazione da v0.1 a 2.0 usando il nuovo algoritmo e formula di fusione.

La griglia caratteristiche(424.5 MB): download

v2.0

Vorrei ringraziare tutti coloro che mi hanno aiutato nel progetto AlbedoBase XL Pre. Senza di voi, la data di rilascio sarebbe stata probabilmente molto più tardiva. Grazie mille!

  • Ho scritto uno script personalizzato per fondere i modelli esistenti AlbedoBase XL in uno solo, allineando meticolosamente i pesi di righe e colonne di tutti i blocchi U-NET e CLIP secondo una formula unica mia.

  • Se riscontri un bug nella generazione dell'immagine (se non viene generato nulla), prova a passare a CLIP SKIP 2 o modifica leggermente il prompt! Potrebbero esserci combinazioni di prompt non riconosciute da CLIP. In tal caso, puoi cambiare l'ordine delle parole, usare parole diverse o, più semplicemente, modificare il CLIP SKIP. Gradualmente lavorerò per risolvere questi problemi in futuro come in v1.3.

La griglia caratteristiche(403.5 MB): download

v1.3

  • Per illustrare la qualità legata alla casualità del modello, ho standardizzato il valore seed a '9' per tutte le immagini di esempio destinate al campionamento e ne ho proceduto alla generazione immediata.

  • Soprattutto con questa versione, a causa dell'effetto significativo dei prompt negativi, lasciare il campo prompt negativo vuoto produce probabilmente la migliore qualità.

La griglia caratteristiche(438.7 MB): download

  • Come puoi vedere, all’aumentare dei Steps, diventa disponibile per tutti i sampler, e migliora anche la qualità.

  • Grazie all’effetto delle LoRA da me sviluppate e fuse, come descritto sotto, usare prompt in forma di frase piuttosto che liste di tag è direttamente correlato al miglioramento della qualità.

  • Ho fuso 45 checkpoint e 7 LoRA. Dopodiché, ho fuso AlbedoBase v0.4 e v0.3 in ordine, meno del 0~5%, per risvegliare i modelli fusi diluiti ormai obsoleti. 

  • Tra le 7 LoRA, una è stata creata da me. Coinvolge l'analisi e l'annotazione di didascalie per un totale di 174 foto pittoriche di alta qualità usando GPT4-V. La fusione di questa LoRA ha prodotto immagini sorprendentemente nitide e una comprensione molto elevata dei prompt.

  • Le mie LoRA create personalmente sono esclusivamente disponibili all'acquisto per i miei sostenitori Ko-fi al livello Creative o superiore.


v1.2

  • Fusi gli ultimi 22 checkpoint.

La griglia caratteristiche(565.6 MB): download

v1.1

  • Stabilizzato.

  • Piu dettagliato.

  • Se ti consideri un utente avanzato, raccomando la versione 1.0. Se la versione 1.0 trova le impostazioni giuste, può produrre opere molto più vivide.

La griglia caratteristiche(349.7 MB): download

v1.0

  • Fusi 106 LoRA.

  • Fusi 19 Checkpoint.

  1. Il modello può produrre risultati diversi a seconda delle impostazioni scelte, quindi è importante controllare la griglia caratteristiche prima di usarlo.

    • Ho scoperto che usare alcuni specifici prompt negativi può aiutare a risolvere problemi come occhi asimmetrici o immagini pixelate. La Griglia Caratteristiche può variare a seconda del dispositivo CPU o GPU, quindi usala come riferimento generale. Prova con qualche prompt negativo per migliorare la qualità (es: strabismo). Ho notato che è difficile soddisfare tutte le impostazioni allo stesso modo con l'aumentare delle LoRA fuse. Tuttavia, vorrei che ti concentrassi su questo vantaggio nella versione 1.0, poiché può produrre opere di qualità sorprendente in molti aspetti con le impostazioni corrette. Tornerò in futuro con una versione più stabile.

  2. Puoi trovare valori di impostazione utili nelle showcase o cercando tra altri utenti.

  3. Come sempre, è meglio lasciare il prompt negativo vuoto per i migliori risultati.

  4. Questa v1.0 ha richiesto molto lavoro, quindi mi prendo una pausa. Spero che ti piaccia usare il modello e, se lo fonderai, condividilo gratuitamente su Civitai. Così potremo continuare a migliorarlo tutti insieme.

La griglia caratteristiche(479.4 MB): download

v0.4

  • Fusi 132 LoRA.

  • Fusi 4 Checkpoint.

La griglia caratteristiche: download

v0.3

  • Miglioramenti in tutti i sampler.

  • Realismo vivo raggiunto.

  • Stabilizzato.

La griglia caratteristiche: download

v0.2

  • Miglioramenti significativi in chiarezza e dettagli.

  • Migliorata implementazione di mani e piedi.

  • Importanti miglioramenti estetici; composizione, astrazione, flusso, luce e colore, ecc.

v0.1

  • Dopo un appropriato fine-tuning sul modello SDXL1.0, fuso meticolosamente e con uno scopo oltre 40 modelli di alta qualità disponibili pubblicamente su Civitai.

  • I test si sono concentrati soprattutto nell'assicurare la massima qualità usando il minimo numero di token nel prompt, e non è stato confermato quanto la qualità possa migliorare usando un gran numero di token. (Per favore esegui i tuoi test e condividi i risultati)

  • Solitamente, i risultati più belli si ottengono a metà strada tra realtà e animazione.

  • Tuttavia, usando un prompt appropriato, generalmente non c'è nulla che non possa esprimere. (Afferma di possedere un valore abbondante come modello base superiore ad altri nella fusione. Tuttavia, considera che questa è attualmente la v0.1)


Precedente
Shuttle 3 Diffusion - bf16
Successivo
WaduStyle - V1

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

SDXL 1.0

Versione del modello

v3.1-Large

Hash del modello

c379d154eb

Creatore

Discussione

Per favore log in per lasciare un commento.

Immagini di AlbedoBase XL - v3.1-Large

Vista della campagna italiana soleggiata con colline ondulate, fattorie, un caratteristico villaggio con tetti in terracotta e nuvole drammatiche sotto un cielo azzurro brillante.
Ritratto inciso in stile grunge in bianco e nero in primo piano estremo di un volto con texture dettagliate e linee espressive, ispirato a Richard Hambleton.
Ritratto astratto scuro di una figura femminile con sagoma nera e vividi schizzi di vernice rossa su sfondo chiaro, ispirato allo stile di Richard Hambleton.
Città futuristica con alte torri cilindriche in vetro situata in un paesaggio montano innevato sotto un cielo drammatico al tramonto.
Uomo cartoon con espressione sconvolta, capelli selvaggi e ricci, occhiali e barba corta che indossa una camicia gialla a quadri con cravatta rossa e bretelle blu su uno sfondo verde testurizzato.
Una miniatura di alpaca bianco e soffice con grandi occhi neri che sta accanto a una piccola casa marrone stampata in 3D.
Un'arte digitale vettoriale vibrante in stile William Wray che mostra un elefante rilassato a forma di mongolfiera colorata con un pinguino stravagante in cima, circondati da palloncini multicolori contro uno sfondo di cielo.
Acquaforte impressionista con silhouette di una donna in abito e cappello in piedi vicino a un fiume, che guarda un piccolo cane, con un classico ponte di Londra e Big Ben sullo sfondo.
Una sagoma in stile carta tagliata di una donna che balla il tango, finemente realizzata in arte in acciaio con influenza kirigami, circondata da forme astratte ondeggianti.

Immagini con 3d

Primo piano fotorealistico di una ragazza hipster stilosa con trucco scuro, linea della mascella definita e una collana seducente.
Immagine 3D realistica di Tifa Lockhart seduta con una gamba sollevata, che indossa un reggiseno sportivo bianco e pantaloni della tuta neri, mostrando pelle lucida e sudore su uno sfondo bianco semplice.
Una tartaruga altamente dettagliata che indossa un jetpack, che vola sopra un vivace canale cittadino circondato da edifici colorati sotto un cielo azzurro.
Una vibrante auto classica gialla che corre velocemente su una strada urbana bagnata con una grande esplosione sullo sfondo sotto un cielo nuvoloso.
Loona da Helluva Boss seduta su una sedia da gaming con grandi occhi rossi tristi, che tiene un cartello infuocato con scritto 'Need Buzz to generate more Loona' all'interno di una stanza da gioco.
Camera da letto futuristica compatta con design metallico e industriale, con un letto in disordine vicino a una grande finestra panoramica che si affaccia su uno skyline cittadino cyberpunk illuminato al neon di notte.
Un'immagine fotorealistica di una donna elegante in un abito rosso acceso e occhiali da sole, che posa con sicurezza in un terminal aeroportuale circondata da una montagna caotica e imponente di valigie colorate su un carrello per bagagli.
Una ragazza falena 3D realistica con capelli bicolore nero e bianco, occhi rossi ampi e un'espressione stupita con bava, chinata su una lampadina luminosa su un tavolo di legno.
Un'arbaletrista medievale femminile renderizzata in 3D con capelli castani intrecciati, occhi marroni, abbigliamento medievale marrone chiaro e armatura in pelle, che tiene una balestra con uno sguardo serio di lato.
Arte digitale 3D di un gatto pirata giallo con occhi azzurri brillanti, un grande cappello da pirata blu navy adornato con un emblema a teschio, un dettagliato mantello blu navy fissato da catene d'oro e un cappotto marrone che posa con sicurezza davanti a uno sfondo di vetrata colorata.

Immagini con tutto in uno

Una suora anime carina con capelli biondi intrecciati, grandi occhi azzurri e un’espressione gioiosa. È vestita con l'abito tradizionale da suora, velo nero e fascia bianca, con le mani in posa di preghiera. Questa immagine è generata da AI usando Stable Diffusion.
Ragazza in stile anime con lunghi capelli blu raccolti in una ponytail, che impugna una spada katana, in piedi sotto alberi di sakura in fiore. Creato con AI usando Stable Diffusion.
Ragazza anime con lunghi capelli blu-grigi, abito ornato e accessori dettagliati, immagine generata da AI utilizzando Stable Diffusion.

Immagini con anime

Un dipinto digitale dettagliato di una ragazza anime con capelli biondi e occhi blu sorprendenti, illuminato da una luce soffusa e onirica in stile CGI.
Primo piano di Dio Brando con capelli biondi e fascia verde, circondato da effetti scintillanti sotto un cielo azzurro brillante.
Un bar cyberpunk che brilla con luci al neon violette, pieno di avventori futuristici che indossano caschi e equipaggiamento cibernetico, con schermi olografici e un'atmosfera high-tech.
Una ragazza anime dettagliata con capelli biondi che indossa abiti bianchi e rossi mentre cammina attraverso un ruscello di foresta circondata da meduse arancioni luminescenti al crepuscolo.
Ritratto di una ragazza elfo con lunghe codine bianche, occhi blu, orecchie appuntite, che indossa una mantellina bianca con rifiniture dorate e gioielli su sfondo nero.
Ragazza elfa in stile anime con lunghi codini argentati e occhi verdi, che sta in un campo di fiori blu, indossando un mantellino bianco, camicia a righe e calze nere.
Una giovane donna anime con occhi azzurri e capelli castani si trova davanti a uno sfondo floreale mosaico blu cobalto con estetica da sogno.
Illustrazione digitale in stile anime che mostra una grande struttura piramidale di pietra triangolare appuntita su terreno desolato con rocce sparse sotto un cielo pieno di stelle e un pianeta con anelli arancioni.
Guerriera in stile anime dettagliata con abito in pelle nera, che assume una posa dinamica con effetti colorati blu e arancioni vorticosi sullo sfondo.
Un ritratto dettagliato di un cyborg con lunghi capelli bianchi, occhi azzurri e armatura robotica intricata che si erge in un paesaggio urbano cyberpunk futuristico di notte.

Immagini con modello base

Scena fotorealistica di personaggi non morti tra zombie e scheletri che camminano attraverso un cimitero spettrale illuminato da jack-o'-lantern luminosi sotto un cielo scuro e minaccioso.

Immagini con fotorealistico

Sagoma di un uomo cibernetico con ali e gambe lunghe e sottili riempita con un collage misto fotorealistico di paesaggi urbani e edifici sotto illuminazione cinematografica.
Immagine futuristica in bianco e nero con linee metalliche che si estendono dall'alto, fogliame sfumato di rosso che incornicia la scena e un diamante blu pulsante al centro.
Immagine fotorealistica di un robot cameriera sdraiato sul pavimento della foresta con foliage intrecciato nei capelli e parti del corpo robotiche, vestita con un abito da cameriera bianco.
Supermodella fantasy con bellezza eterea che indossa un abito avant-garde vibrante e colorato, adornato con gioielli intricati, su uno sfondo vorticoso e multicolore vivido.
Giovane barista donna in piedi dietro un bancone rustico di un caffè indossando una camicia nera con bottoni e un grembiule nero, sorridendo dolcemente con trucco naturale e capelli raccolti.
Tre donne che indossano maglioni in stile nautico e pantaloni in piedi insieme sul ponte di uno yacht di lusso di notte con lo sfondo dell'oceano caraibico.
Scena fotorealistica di una giovane donna giapponese con un vestito estivo colorato che fluisce mentre cammina lungo un sentiero forestale circondato da meduse luminose e fluttuanti sotto illuminazione naturale.
Una ragazza carina seduta comodamente in una biblioteca accogliente, che studia alla luce della candela con un'illuminazione d'atmosfera calda e un libro aperto davanti a lei.
Un'illustrazione vettoriale 2D dettagliata di una donna adornata con fiori di orchidea nera e intricati motivi floreali in stile barocco.
Primo piano di un giovane uomo con pizzetto biondo corto e occhiali, illuminato a metà dal sole mattutino, con un gatto tigrato che riposa sulla sua spalla.