modelli/HelloWorld XL di LEOSAM - HW5.0_Euler_a_Lightning

HelloWorld XL di LEOSAM - HW5.0_Euler_a_Lightning

11/30/2025

12:46:48 PM

Parole Chiave e Tag Correlati

modello base,checkpoint,helloworld 5.0 gpt4v,helloworld 6.0,helloworld 7.0,modello helloworld SDXL,hw5.0_euler_a_lightning,leosam,helloworld xl di leosam,foto,fotorealistico,real,realistico,sdxl lightning,sdxl-lightning,spo lora,stable diffusion,donna

Primo piano di una guerriera dalla pelle scura con capelli corti che indossa un'armatura d'argento e un mantello rosso, in piedi in una foresta all'alba.

Prompt Consigliati

film grain texture,analog photography aesthetic,studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still

film grain texture, analog photography aesthetic

Prompt Negativi Consigliati

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

(worst quality, low resolution, bad hands), distorted, twisted, watermark, open mouth

Parametri Consigliati

samplers

DPM++ 2M Karras, Euler a

steps

6 - 25

cfg

1 - 10

resolution

1024x1024, 832x1248, 896x1152, 1248x832, 1360x768, 768x1360, 900x1200

Parametri Consigliati per Alta Risoluzione

upscaler

ESRGAN 4x, 8x_NMKD-Faces_160000_G

upscale

1.5

steps

denoising strength

0.3

Suggerimenti

Usa la parola trigger "leogirl" con HelloWorld 1.0 per risultati stabili.

Per scatti full-body, usa il plugin ADetailer e la riparazione ad alta risoluzione 1.5x per migliorare i dettagli.

I prompt in linguaggio naturale migliorano i risultati delle foto realistiche AI.

Fai attenzione ai toni caldi in HelloWorld 5.0 dovuti a texture film rinforzate; aggiungi "luce da studio" o "fuoco nitido" al prompt per toni della pelle migliori.

Evita prompt di stile animato se non desiderato, poiché in versione 5.0 sono stati aggiunti alcuni dataset di illustrazioni.

Usa prompt negativi consigliati per migliorare la precisione di arti e mani e la qualità complessiva dell'immagine.

Punti Salienti della Versione

Questo modello è una versione accelerata del modello base HelloWorld SDXL che incorpora tecnologie SDXL-Lightning. Dotato del sampler Euler a e CFG 1, è in grado di generare immagini in 6-8 passaggi, tre volte più veloce della versione SDXL originale. Inoltre, rispetto alle versioni LCM o Turbo, i suoi risultati sono superiori, ed è caldamente raccomandato a tutti di testarlo e usarlo.

I parametri consigliati per generare immagini con questo modello sono:

Sampler: Euler a (Importante! Il modello è specificamente adattato a Euler a, altri sampler potrebbero non dare risultati altrettanto validi)

Scala CFG: 1

Passaggi di campionamento: 8 passaggi (6~8 passaggi sono accettabili)

Algoritmo Hires: ESRGAN 4x / 8x_NMKD-Faces_160000_G

Fattore ingrandimento Hires: 1,5x

Passaggi Hires: 8 passaggi

Forza denoising Hires: 0,3

Sponsor del Creatore

🖥️Benvenuti a provare il GPT4V-Image-Captioner open-source, sviluppato da un mio amico ed io. Offre un'installazione con un clic e integra funzionalità di pre-compressione immagini, tagging e statistiche dei tag.

Recentemente abbiamo lanciato la versione plugin webui di questo strumento, aperta a tutti!

🖥️Benvenuti a provare il GPT4V-Image-Captioner open-source, sviluppato da un mio amico ed io. Offre un'installazione con un clic e integra diverse funzionalità tra cui pre-compressione immagini, tagging delle immagini e statistiche dei tag. Recentemente abbiamo anche lanciato la versione plugin webui di questo strumento, aperta a tutti!

🌍Benvenuti a unirvi ai gruppi QQ "兔狲·AIGC梦工北厂", numero gruppo: 780132897; "兔狲·AIGC梦工南厂", numero gruppo: 835297318 (Risposta d'ingresso: 兔狲). Gruppo Telegram “兔狲的SDXL百老汇”, link: https://t.me/+KkflmfLTAdwzMzI1

📖Aggiornamento HelloWorld 7.0 - 13 giugno 2024

Riassunto in una frase: HelloWorld 7.0 è una versione ottimizzata iterativamente, con la migliore resa corporea dell'intera serie e un ulteriore ampliamento dell'ambito concettuale e della ricchezza di dettagli.

Dettagli aggiornamento:

Aggiungendo immagini negative per l'addestramento, rafforzando il training sulle pose e ottimizzando il modello clip, la precisione di arti e mani è migliorata rispetto alle versioni precedenti. Le parole negative consigliate sono: "bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality".
Estratto il LoRA fine-tuned dal modello ufficiale SPO e integrato in HelloWorld 7.0. SPO è un miglioramento del metodo DPO. Il modello base SPO offre prestazioni superiori rispetto al modello base DPO XL e al modello base SDXL originale. LoRA SPO migliora dettagli e contrasto delle immagini e le abbellisce. Grazie al team tecnico di SPO.
Continuato ad ampliare l'ambito concettuale del set di addestramento, pur ottimizzando e snellendo il dataset (il fine-tuning su dataset grandi è molto costoso, e H800 è difficile da affittare di recente, il tempo locale di addestramento è limitato). Attualmente il set totale è di 20.821 immagini. La distribuzione delle risoluzioni è la seguente, consigliando l'uso di più risoluzioni con più immagini per l'output:
```
(832, 1248) - Numero: 7128
(896,1152) - Numero: 6250
(1248,832) - Numero: 2402
(1024,1024) - Numero: 1639
(1360,768) - Numero: 928
(1152,896) - Numero: 870
(768,1360) - Numero: 432
(960,1088) - Numero: 506
(992,1056) - Numero: 162
(1088,960) - Numero: 140
(704,1472) - Numero: 120
(1056,992) - Numero: 122
(1472,704) - Numero: 115
(1632,640) - Numero: 75
(640,1632) - Numero: 12
```
Utilizzato GPT4O per rietichettare tutti i dataset. Questa volta è stato usato un metodo strutturato: "descrizione riassuntiva in una frase + più tag di elementi dell'immagine + ispirato da XXX + descrizioni della qualità estetica". Le parole di qualità estetica sono divise in cinque livelli: worst quality, low quality, average quality, best quality e masterpiece. Un esempio tipico di etichettatura è:
```
arte concettuale che presenta una mano umana avvolta da nastri rossi e beige, isolata su uno sfondo chiaro e semplice, stile realistico, schema di colori minimalista, texture lisce, estetica allungata e surreale, ispirato alle opere surrealiste di Salvador Dalí, capolavoro
```

La "Lista delle Parole Tag ad Alta Frequenza" e la "Lista degli Stili d'Arte ad Alta Frequenza" coinvolte nella sezione ispirata a XXX per la versione 7.0 di HelloWorld sarà fornita solo agli utenti con licenza commerciale. I partner che hanno acquistato l'autorizzazione per la serie Helloworld XL, possono contattarmi in caso di omissioni per ottenerla gratuitamente.

I giocatori possono fare riferimento alla Lista delle Parole Tag ad Alta Frequenza di HelloWorld 6.0. Inoltre, ho fornito più di 150 immagini esemplari di alta qualità di HelloWorld 7.0 nella galleria come riferimento per tutti. Creare modelli non è facile, grazie per la comprensione e la pazienza!

📖Aggiornamento HelloWorld 6.0 - 20 aprile 2024

LEOSAM HelloWorld 6.0 Lista Top 250 Parole Tag ad Alta Frequenza

Grazie per la pazienza. Sono stato alla ricerca di lavoro ultimamente, il che ha causato alcuni ritardi negli aggiornamenti di HelloWorld. Ecco i principali aggiornamenti in versione 6.0:

HelloWorld 6.0 è un miglioramento iterativo basato su versione 5.0. Dai miei test la resa realistica non differisce molto dalla 5.0. Il vantaggio principale di 6.0 è una copertura concettuale più ampia nel set di addestramento. Dai riscontri si segnalano migliorie in temi come surrealismo, boudoir, foto di gruppo, maschere, origami, rendering 3D, auto, draghi e fotografia maternità. Alcuni esempi figurano nelle illustrazioni.
HelloWorld 6.0 include intenzionalmente alcune immagini di bassa qualità nell'allenamento per migliorare la risposta del modello ai prompt negativi. Si consiglia di usare nei prompt negativi questi termini: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".
Il nucleo del set di addestramento HelloWorld 6.0 usa il tagging GPT4v. Per immagini non etichettabili da GPT4v si usa il cogVQA con guida blip2-opt-6.7b. Lo stile linguistico di questi modelli multimodali differisce dal tradizionale WD1.4. Per facilitare un trigger più accurato dei concetti, ho compilato la lista top 250 parole tag ad alta frequenza del set HelloWorld 6.0, disponibile in questo documento.

Infine, anche se SD3 sta per essere rilasciato, continuerò ad aggiornare HelloWorld XL 7.0, sperando in significativi miglioramenti nella versione 7.0!

📖Presentazione 22.2.2024 "HW5.0_Euler_a_Lightning"

Questo modello è una versione accelerata del modello base HelloWorld SDXL, che incorpora tecnologie SDXL-Lightning. Dotato del sampler Euler a e CFG 1, è capace di generare immagini in 6-8 passaggi, tre volte più veloce della versione SDXL originale. Inoltre, a confronto, i suoi risultati sono superiori alle versioni LCM o Turbo.

I parametri raccomandati per generare immagini con questo modello sono:

Sampler: Euler a (Importante! Il modello è specificamente adattato a Euler a, altri sampler potrebbero non dare risultati altrettanto validi)

Scala CFG: 1

Passaggi di campionamento: 8 passaggi (da 6 a 8 sono accettabili)

Algoritmo Hires: ESRGAN 4x / 8x_NMKD-Faces_160000_G

Fattore ingrandimento Hires: 1,5x

Passaggi Hires: 8 passaggi

Forza denoising Hires: 0,3

📖Presentazione 11.2.2024 "HelloWorld 5.0 GPT4V"

HelloWorld 5.0 è l'aggiornamento più sostanziale nella storia della serie HelloWorld, con tagging GPT-4v e significativi affinamenti in campi come fantascienza, animali, architettura e illustrazioni.

I test comparativi mostrano che i miglioramenti includono:

1. Pose e composizioni di personaggi più varie e dinamiche per immagini visivamente coinvolgenti;

2. Il dataset cinematografico è stato estensivamente addestrato. Sebbene la texture cinematografica fosse debole dalle versioni 2.0 a 4.0, molti fan sentivano la mancanza dello stile leogirl della versione 1.0. Questo aggiornamento ha rafforzato specificamente la texture filmica senza compromettere altre qualità fotografiche. La texture cinematografica può essere attivata con frasi come texture grana film e estetica fotografia analogica;

3. Maggiore espressività in temi come fantascienza, thriller e animali, con mecha e altri soggetti più progettati. Animali come leopardo delle nevi, panda rosso, panda gigante, tigre, gatto delle Pallas, e gatti e cani domestici sono più realistici;

4. Grazie al tagging GPT, l'aderenza al prompt e la precisione concettuale sono ulteriormente migliorate.

Tuttavia, gli svantaggi sono:

1. Essendo un aggiornamento sostanziale, il tasso di errore per arti e simili può leggermente aumentare, un fenomeno normale spostandosi fuori dalla zona di comfort verso nuove ottimizzazioni. Le versioni precedenti hanno avuto molto tempo di test su arti, mentre questa versione meno. Comunque, la precisione è almeno migliore della 1.0 e migliorerà in futuro.

2. A causa della texture film rinforzata, anche se il tagging GPT è il più accurato possibile, può esserci un tono caldo implicito nelle immagini. Tuttavia, si possono usare prompt come luce da studio o fuoco nitido per produrre immagini in studio ad alta definizione, con toni della pelle e resa visiva migliori.

3. Questa versione include più immagini full-body per migliorare l'effetto corpo intero, quindi potrebbe generare scene ampie senza specifiche sulla composizione. Attualmente i dettagli facciali in full-body a risoluzione 1024 sono meno nitidi rispetto a mezzi busti o primi piani, ma si può migliorare con adetailer e 1.5x Hires a intensità 0.3, o usando prompt per evitare full body.

4. Poiché sono stati aggiunti alcuni dataset di illustrazioni di alta qualità, talvolta prompt relativi a stili animati possono produrre immagini animate. Se questo è un problema, regolare i prompt.

Questi sono i principali aggiornamenti. Addestrare il modello base SDXL è impegnativo; con dataset intorno a 10.000 immagini, costo per tagging e training supera i 300 USD. Invito tutti a usare il modello e apprezzerei molto un feedback! Se il modello vi soddisfa, vi sarei grato se ne pubblicizzaste l'uso.

📖Presentazione 31.1.2024 "HelloWorld 4.0"

HelloWorld4.0 è una versione di transizione progressiva dal tagging con blip+clip al tagging con GPT4V. Ho addestrato inizialmente un modello solo con tagging GPT4V, poi fuso con una buona parte della versione HelloWorld3.2 e una piccola proporzione (0.05) di Juggernaut XL (per regolare il tono della pelle). La nuova versione mostra miglioramenti nell'aderenza al prompt e nella copertura concettuale rispetto alla 3.2.

Il nuovo set di addestramento con tagging GPT4V è raddoppiato da 4000 a 8000 immagini, coprendo non solo ritratti ma anche animali, architettura, natura, cibo, illustrazioni, ecc. Tuttavia la versione pure GPT4V ha incontrato un problema di overfitting, attribuito preliminarmente al raddoppio delle immagini. Uno step successivo sarà trovare un modo per includere molti concetti non-ritratto garantendo comunque sufficiente training su ritratti. Per ora si usa una fusione tra la versione nuova e quella vecchia per assicurare una transizione dolce, per cui i vantaggi del concetto ampliato e del tagging GPT4V non sono ancora molto visibili, ma lo saranno nelle versioni 5 e 6.

📖Presentazione 5.1.2024 "HelloWorld 3.2"

La versione 3.2 è un'iterazione ottimizzata con tecnologia DPO, e rispetto alla 3.0 presenta ottimizzazioni nel tono della pelle e nella precisione degli arti, ma i miglioramenti non sono significativi. Per questo è denominata 3.2 e non 4.0.

📖Presentazione 15.12.2023 "HelloWorld 3.0"

La nuova versione ha ampliato il set di addestramento, migliorando la capacità del modello di esprimersi in diversi stili artistici, inclusi fantascienza e arte.
Ha integrato un LoCon di auto-miglioramento della qualità (creato con tecnologia slider) per migliorare la texture delle immagini e alleviare distorsioni di dita e arti.

📖Presentazione 17.11.2023 "HelloWorld 2.0"

Grazie per la pazienza. Dopo varie sfide, la versione HelloWorld 2.0 è finalmente pronta e soddisfa le mie aspettative. Le principali differenze con la 1.0 sono:

HelloWorld 2.0 non richiede più parole trigger e i risultati sono comparabili in qualità con la 1.0 che le richiedeva. La parola trigger "leogirl" nella 1.0 era fortemente associata a persone dell'Est Asiatico. Dopo la rimozione della parola trigger, termini come "1girl" tenderanno ancora a generare ritratti est asiatici se la razza non è specificata, ma ora si può specificare usando parole chiave come nazionalità, colore della pelle ecc. Ad esempio, gli effetti trigger di parole come "Chinese", "Russian", "Iranian", "Jamaican", "Kenyan", "dark-skinned", "pale-skinned" ecc. sono indicati sotto.
Si possono anche ottenere stili di personaggi diversi inserendo nel prompt nomi di persone di varie nazionalità e generi, come Han Meimei (Cina), Sophie Martin (Francia), Priya Patel (India), Fatima Al-Hassan (Arabo), Wanjiru Mwangi (Kenya). Questi sono esempi, tante altre combinazioni esistono e siete invitati a esplorarle e condividerle.
HelloWorld 2.0 ha bilanciato qualità e colore e offre più opzioni di stile. La 1.0 con "leogirl" tendeva a produrre immagini con forte texture filmica. HelloWorld 2.0 non è più legato a tale texture e può essere personalizzato con prompt relativi alla qualità. Alcuni prompt testati e funzionanti includono:
servizio fotografico di moda di alta gamma, foto introduttiva prodotto, trucco coreano popolare, aegyo sal, Foto nitida di alta qualità, luce da studio, foto medio formato, fotografia Mamiya, film analogico, Ritratto Medio con luce soffusa, immagine reale, fotografia editoriale raffinata, foto raw, foto reale, foto scannerizzata, fermo immagine film
Gli effetti cromatici di questi prompt sono:
Il set di addestramento di HelloWorld 2.0 ha significativamente aumentato la proporzione di foto full-body per migliorare gli effetti SDXL nel generare ritratti a figura intera e inquadrature a distanza. Anche se è migliorato rispetto a 1.0, è comunque fortemente consigliato usare "adetailer" durante la generazione di foto a figura intera. Inoltre, per chi ha abbastanza memoria video (24g), consigliato effettuare riparazione 1.5x ad alta risoluzione per migliorare dettagli facciali.

📖Presentazione 29.8.2023 modello base "HelloWorld" SDXL

Promemoria speciale: Quando si usa il modello HelloWorld 1.0, ricordarsi di aggiungere la parola trigger "leogirl".

Diversamente dal modello base SD1.5 “MoonFilm”, “HelloWorld” è una nuova serie di modelli base SDXL realistici. Per permettere più utenti di scoprire HelloWorld, ho mantenuto il link originale di Moonfilm. Può essere considerato una continuazione spirituale di Moonfilm sulla nuova piattaforma SDXL, ma HelloWorld punta a ottenere più della sola ricerca di realismo e qualità filmica nei ritratti. Grazie alle molto superiori capacità di informazione e comprensione testuale di SDXL rispetto a SD1.5, HelloWorld è un modello base che mira a rappresentare realisticamente tutte le cose, o detto in altro modo, spero di costruire gradualmente un mondo di fotografia virtuale usando HelloWorld.

Il modello base realistico SD1.5 si è evoluto fino a uno stadio maturo e difficilmente avrà miglioramenti significativi. A meno di tecnologie rivoluzionarie per SD1.5, le serie Moonfilm & MoonMix smetteranno di aggiornarsi. Dedicherò la mia energia principale allo sviluppo del modello HelloWorld SDXL grande. La versione 1.0 è ora disponibile per il download, la 2.0 è in sviluppo e sarà aggiornata a settembre.

Come nuovo modello SDXL, HelloWorld presenta tre differenze dai tradizionali modelli SD1.5:

A differenza di modelli base SD1.5, che solitamente non richiedono parole trigger, ricordarsi di usare la parola trigger "leogirl" con HelloWorld 1.0. Ciò assicura che il modello SDXL attivi più stabilmente l'effetto del set di addestramento.
Il modello HelloWorld supporta output diretti a risoluzione 1024*1024 pixel, eliminando la necessità di ingrandimenti ad alta risoluzione. La qualità di ritratti ravvicinati usciti direttamente non è inferiore alla versione SD1.5, ma ci sono difetti con ritratti distanti diretti. Pertanto si suggerisce di usare il plugin ADetailer che corregge efficacemente problemi di volti distanti.
SDXL ora permette output più facile usando prompt in linguaggio naturale semplice. Si consiglia di provare più prompt in linguaggio naturale per migliori risultati in foto realistiche AI.

Dopo vari test, i parametri suggeriti sono:

Passaggi ≥ 25
Sampler: DPM++ 2M Karras
Scala CFG: 10
Dimensione ≥ 1024x1024
ADetailer: attivo

Tutti sono invitati a provare HelloWorld e fornire feedback. I vostri preziosi suggerimenti sono molto importanti per migliorare il modello!

Dichiarazione di Copyright:

La serie di modelli HelloWorld (di seguito "il Modello") è stata creata da me (di seguito "il Proprietario") con l’assistenza della piattaforma LiblibAI. La ripubblicazione del Modello su piattaforme diverse da LiblibAI e Civitai non è autorizzata dal Proprietario.

Il Proprietario consente l'uso gratuito delle immagini generate dal Modello per scopi educativi o informativi non commerciali, a condizione che:

- Gli utenti rispettino le leggi applicabili e non violino diritti del Modello o di terzi.

- Sia chiaramente indicato l'attributo "creato con il modello base HelloWorld di LEOSAM" per le immagini.

Per qualsiasi utilizzo commerciale è richiesta una licenza commerciale preventiva con il Proprietario. Per richieste relative a licenze commerciali o personalizzazioni, contattare il Proprietario tramite le informazioni disponibili sulla sua homepage.

Lo sviluppo e la distribuzione gratuita del modello SDXL rappresentano impegni significativi. Il Proprietario si impegna ad aggiornamenti gratuiti continui di HelloWorld per gli appassionati individuali come segno di apprezzamento verso la comunità open-source. Collaborazioni commerciali sono fondamentali per l’avanzamento e il perfezionamento del Modello. Il Proprietario ringrazia ogni utente per la comprensione e il supporto.

L'uso non autorizzato può violare leggi applicabili e comportare conseguenze legali. Il Proprietario mantiene diritti esclusivi di interpretazione di questa dichiarazione, regolati da leggi vigenti.

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

Big Centaur Lora XL - 0.5

Akira Mizutani Growth Academy (GA) [FLUX, Pony XL, SD 1.5] - v0.96

Usa questo modello