modelli/LEOSAMs HelloWorld XL - HelloWorld XL 70

LEOSAMs HelloWorld XL - HelloWorld XL 70

|
5/20/2025
|
1:41:34 PM
| Discussion

Prompt Consigliati

conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic

film grain texture

analog photography aesthetic

Prompt Negativi Consigliati

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality

Parametri Consigliati

samplers

Restart

steps

30

cfg

7

resolution

832x1248

other models

LeosamHelloWorldV7 (573f4a7d35)

Suggerimenti

Usa ADetailer per correggere i volti distanti.

Usa prompt semplici in linguaggio naturale per foto AI realistiche migliori.

I ritratti di alta qualità possono essere migliorati con ADetailer e con un Hires 1.5x fix a intensità 0.3.

Punti Salienti della Versione

Aggiornamento HelloWorld 7.0 - 13 giugno 2024

Riassunto in una frase: HelloWorld 7.0 è una versione ottimizzata iterativamente, con la migliore resa corporea dell'intera serie e un ulteriore ampliamento dell'ambito concettuale e della ricchezza dei dettagli.

Dettagli aggiornamento:

  1. Aggiungendo immagini negative di training, rafforzando l'addestramento delle pose e ottimizzando il modello clip, la precisione degli arti e delle mani è migliorata rispetto alle versioni precedenti. Le parole consigliate per i prompt negativi sono: "bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality".

  2. Estratto il LoRA perfezionato dal modello ufficiale SPO e incorporato in HelloWorld 7.0. SPO è un ulteriore miglioramento del metodo DPO. Il modello base SPO è usato per prestazioni migliori rispetto al modello base DPO XL e al modello base SDXL originale. LoRA SPO può migliorare dettagli & contrasto delle immagini e abbellirle. Grazie al team tecnico dietro SPO.

  3. Continua l'espansione dell'ambito concettuale del set di training, ma ottimizzato e snellito (il fine-tuning di un set di training grande è troppo costoso, e recentemente H800 è difficile da noleggiare, non posso permettermi il tempo di training locale). Il set di training attuale comprende 20.821 immagini. La distribuzione delle risoluzioni è la seguente, si consiglia di usare più risoluzioni con un maggior numero di immagini per l'output:

    (832, 1248) - Conteggio: 7128
    (896, 1152) - Conteggio: 6250
    (1248, 832) - Conteggio: 2402
    (1024, 1024) - Conteggio: 1639
    (1360, 768) - Conteggio: 928
    (1152, 896) - Conteggio: 870
    (768, 1360) - Conteggio: 432
    (960, 1088) - Conteggio: 506
    (992, 1056) - Conteggio: 162
    (1088, 960) - Conteggio: 140
    (704, 1472) - Conteggio: 120
    (1056, 992) - Conteggio: 122
    (1472, 704) - Conteggio: 115
    (1632, 640) - Conteggio: 75
    (640, 1632) - Conteggio: 12
  4. Usato GPT4O per rietichettare tutti i dataset. Questa volta è stato usato un metodo di etichettatura strutturata, con la struttura specifica: "descrizione riassuntiva in una frase + multipli tag elementi immagine + ispirato da XXX + parole descrittive di qualità estetica", dove le parole di qualità estetica sono divise in cinque livelli: worst quality, low quality, average quality, best quality e masterpiece. Un esempio tipico di etichettatura è:

    arte concettuale con una mano umana avvolta in nastri rossi e beige, isolata su uno sfondo chiaro e semplice, stile realistico, schema colori minimalista, texture lisce, estetica allungata e surreale, ispirato dalle opere surrealiste di salvador dalí, masterpiece

La "Lista parole tag ad alta frequenza" e la "Lista stili artistici ad alta frequenza" incluse in "ispirato da XXX" per la versione HelloWorld 7.0 saranno fornite solo agli utenti con licenza commerciale. I partner che hanno acquistato l'autorizzazione per la serie Helloworld XL, per favore contattatemi se ci sono omissioni per ottenerla gratuitamente.

I giocatori possono fare riferimento alla Lista parole tag ad alta frequenza di HelloWorld 6.0. Inoltre, ho fornito più di 150 immagini di alta qualità di HelloWorld 7.0 nella galleria, che possono essere usate come riferimento per le vostre creazioni. Realizzare modelli non è facile, grazie a tutti gli utenti per la comprensione e la pazienza!

Sponsor del Creatore

🖥️Benvenuti a provare l'open-source GPT4V-Image-Captioner, sviluppato da me e il mio amico. Offre un'installazione con un clic ed è integrato con molte funzionalità, tra cui pre-compressione delle immagini, tagging delle immagini e statistiche sui tag. Recentemente, abbiamo anche lanciato la versione plugin webui di questo strumento, aperta a tutti!

🌍Benvenuti a unirvi ai gruppi QQ '兔狲·AIGC梦工北厂', numero del gruppo: 780132897; '兔狲·AIGC梦工南厂', numero del gruppo: 835297318 (parola d'ingresso: 兔狲). Chat Telegram “兔狲的SDXL百老汇”, link:https://t.me/+KkflmfLTAdwzMzI1

🖥️Benvenuti a provare l'open-source GPT4V-Image-Captioner, sviluppato da me e il mio amico. Offre un'installazione con un clic ed è integrato con molte funzionalità, tra cui pre-compressione delle immagini, tagging delle immagini e statistiche sui tag. Recentemente, abbiamo anche lanciato la versione plugin webui di questo strumento, aperta a tutti!

🌍Benvenuti a unirvi ai gruppi QQ "兔狲·AIGC梦工北厂", numero del gruppo: 780132897; "兔狲·AIGC梦工南厂", numero del gruppo: 835297318 (parola d'ingresso: 兔狲). Chat Telegram “兔狲的SDXL百老汇”, link: https://t.me/+KkflmfLTAdwzMzI1

📖Aggiornamento HelloWorld 7.0 - 13 giugno 2024

Riassunto in una frase: HelloWorld 7.0 è una versione ottimizzata iterativamente, con la migliore resa corporea dell'intera serie e un ulteriore ampliamento dell'ambito concettuale e della ricchezza dei dettagli.

Dettagli aggiornamento:

  1. Aggiungendo immagini negative di training, rafforzando l'addestramento delle pose e ottimizzando il modello clip, la precisione degli arti e delle mani è migliorata rispetto alle versioni precedenti. Le parole consigliate per i prompt negativi sono: "bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality".

  2. Estratto il LoRA perfezionato dal modello ufficiale SPO e incorporato in HelloWorld 7.0. SPO è un ulteriore miglioramento del metodo DPO. Il modello base SPO è usato per prestazioni migliori rispetto al modello base DPO XL e al modello base SDXL originale. LoRA SPO può migliorare dettagli & contrasto delle immagini e abbellirle. Grazie al team tecnico dietro SPO.

  3. Continua l'espansione dell'ambito concettuale del set di training, ma ottimizzato e snellito (il fine-tuning di un set di training grande è troppo costoso, e recentemente H800 è difficile da noleggiare, non posso permettermi il tempo di training locale). Il set di training attuale comprende 20.821 immagini. La distribuzione delle risoluzioni è la seguente, si consiglia di usare più risoluzioni con un maggior numero di immagini per l'output:

    (832, 1248) - Conteggio: 7128
    (896, 1152) - Conteggio: 6250
    (1248, 832) - Conteggio: 2402
    (1024, 1024) - Conteggio: 1639
    (1360, 768) - Conteggio: 928
    (1152, 896) - Conteggio: 870
    (768, 1360) - Conteggio: 432
    (960, 1088) - Conteggio: 506
    (992, 1056) - Conteggio: 162
    (1088, 960) - Conteggio: 140
    (704, 1472) - Conteggio: 120
    (1056, 992) - Conteggio: 122
    (1472, 704) - Conteggio: 115
    (1632, 640) - Conteggio: 75
    (640, 1632) - Conteggio: 12
  4. Usato GPT4O per rietichettare tutti i dataset. Questa volta è stato usato un metodo di etichettatura strutturata, con la struttura specifica: "descrizione riassuntiva in una frase + multipli tag elementi immagine + ispirato da XXX + parole descrittive di qualità estetica", dove le parole di qualità estetica sono divise in cinque livelli: worst quality, low quality, average quality, best quality e masterpiece. Un esempio tipico di etichettatura è:

    arte concettuale con una mano umana avvolta in nastri rossi e beige, isolata su uno sfondo chiaro e semplice, stile realistico, schema colori minimalista, texture lisce, estetica allungata e surreale, ispirato dalle opere surrealiste di salvador dalí, masterpiece

La "Lista parole tag ad alta frequenza" e la "Lista stili artistici ad alta frequenza" incluse in "ispirato da XXX" per la versione HelloWorld 7.0 saranno fornite solo agli utenti con licenza commerciale. I partner che hanno acquistato l'autorizzazione per la serie Helloworld XL, per favore contattatemi se ci sono omissioni per ottenerla gratuitamente.

I giocatori possono fare riferimento alla Lista parole tag ad alta frequenza di HelloWorld 6.0. Inoltre, ho fornito più di 150 immagini di alta qualità di HelloWorld 7.0 nella galleria, che possono essere usate come riferimento per le vostre creazioni. Realizzare modelli non è facile, grazie a tutti gli utenti per la comprensione e la pazienza!

📖Aggiornamento HelloWorld 6.0 - 20 aprile 2024

LEOSAM HelloWorld 6.0 - Le 250 parole tag più frequenti

Grazie per la vostra pazienza. Ultimamente ho cercato lavoro, il che ha causato qualche ritardo negli aggiornamenti di HelloWorld. Ecco i principali aggiornamenti della versione 6.0:

  • HelloWorld 6.0 è un miglioramento iterativo basato sulla versione 5.0. Dai miei test, l'effetto di realismo non differisce significativamente dalla versione 5.0. Il vantaggio principale di 6.0 è una copertura più ampia di concetti nel set di training. Secondo i feedback, sono stati potenziati temi come surrealismo, boudoir, foto di gruppo, maschere, origami, rendering 3D, automobili, draghi e fotografia maternità. Alcuni esempi sono nelle illustrazioni.

  • HelloWorld 6.0 include intenzionalmente alcune immagini di bassa qualità nel training per migliorare la risposta del modello ai prompt negativi. Si consiglia di usare termini come "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality" nei prompt negativi.

  • La maggior parte del set di training HelloWorld 6.0 utilizza il tagging GPT4v. Per le immagini che GPT4v non può taggare, viene utilizzato cogVQA guidato da blip2-opt-6.7b. Lo stile del tagging di questi modelli multimodali è differente dal tradizionale tagger WD1.4. Per facilitare un triggering più accurato dei diversi concetti, ho compilato le 250 parole tag più frequenti del set HelloWorld 6.0. Potete visualizzarle in questo documento.

Infine, sebbene SD3 sia in uscita, continuerò ad aggiornare HelloWorld XL 7.0, sperando di ottenere maggiori miglioramenti nella versione 7.0!

📖22.2.2024 Presentazione di "HW5.0_Euler_a_Lightning"

Questo modello è una versione accelerata del modello base HelloWorld SDXL, che incorpora le tecnologie SDXL-Lightning. Dotato del campionatore Eular a e CFG 1, è capace di generare immagini in 6-8 passi, tre volte più veloce della versione originale SDXL. Inoltre, a confronto, i risultati sono superiori a quelli delle versioni LCM o Turbo.

I parametri consigliati per generare immagini con questo modello sono:

Campionatore: Eular a (Importante! Il modello è specificamente adattato a Eular a, altri campionatori potrebbero non dare risultati altrettanto buoni)

Scala CFG: 1

Passaggi di campionatura: 8 passi (6~8 passi sono accettabili)

Algoritmo Hires: ESRGAN 4x / 8x_NMKD-Faces_160000_G

Fattore di ingrandimento Hires: 1.5x

Passaggi Hires: 8 passi

Forza di denoising Hires: 0.3

📖11.2.2024 Presentazione di "HelloWorld 5.0 GPT4V"

HelloWorld 5.0 è l'aggiornamento più sostanziale della serie HelloWorld, taggato GPT-4v e ha subito un fine-tuning significativo in campi come fantascienza, animali, architettura e illustrazione.

I test comparativi mostrano miglioramenti quali:

1. Pose di personaggi e composizioni d'immagine più varie e dinamiche, che creano immagini visivamente coinvolgenti;

2. Dataset film estensivamente allenato. Mentre la texture film era debole dalla versione 2.0 alla 4.0, molti fan rimpiangevano lo stile leogirl della versione 1.0. Quindi questo aggiornamento ha potenziato la texture film senza sacrificare altre qualità fotografiche. La texture film si attiva con frasi come film grain texture e analog photography aesthetic;

3. Maggiore espressività in temi come fantascienza, thriller e animali, con mech e altri soggetti più disegnati. Animali come leopardo delle nevi, panda rosso, panda gigante, tigre, gatto di Pallas e cani e gatti domestici più realistici;

4. Grazie al tagging GPT, l'aderenza ai prompt e la precisione concettuale sono migliorate ulteriormente.

Tuttavia, gli svantaggi sono:

1. Essendo un aggiornamento di fine-tuning pesante, il tasso di errore per arti e simili può leggermente aumentare, fenomeno normale quando si esce da una zona di comfort in nuove ottimizzazioni. Le versioni precedenti avevano estesi test sugli arti mentre questa nuova versione ha avuto meno tempo per miglioramenti. Comunque la precisione degli arti in questa versione è superiore alla 1.0 e continuerò a migliorare negli aggiornamenti futuri.

2. A causa della texture film potenziata, anche se il tagging GPT è il più preciso possibile, può esserci un tono caldo predefinito inevitabile. Si possono usare prompt come studio light o sharp focus per immagini ad alta definizione di qualità studio, e con un uso appropriato i toni della pelle e l'aspetto visivo risultano migliori delle versioni precedenti.

3. Questa versione include più immagini di personaggi a figura intera per migliorare l'effetto corpo intero, quindi il modello potrebbe produrre scene più ampie rispetto a prima se non si indica una composizione specifica. Attualmente, i dettagli facciali in risoluzione 1024 per scatti corpo intero potrebbero essere meno nitidi rispetto a scatti a mezzo busto o primi piani; ciò può essere migliorato con adetailer e un Hires 1.5x con fix a intensità 0.3, o usando prompt che specificano composizione per evitare immagini corpo intero.

4. Poiché sono stati aggiunti pochi dataset illustrazione di alta qualità, alcuni prompt legati a stili animati possono produrre immagini animate. Se questo è un problema, regolate i prompt di conseguenza.

Questi sono i principali aggiornamenti di questa versione. Allenare il modello base SDXL è sfidante, e con set di training di quasi diecimila immagini il costo per tagging e training supera i 300 USD per modello. Invito a usare il modello e apprezzo ogni feedback! Se vi piace il modello, sarei molto grato se poteste diffonderlo.

📖31.1.2024 Presentazione di "HelloWorld 4.0"

HelloWorld4.0 è una versione di transizione progressiva dal tagging blip+clip al tagging con GPT4V. Ho inizialmente addestrato un modello di tagging GPT4V puro, poi l'ho fuso con gran parte della versione HelloWorld3.2 e una proporzione 0.05 di Juggernaut XL (per regolare il tono della pelle). La nuova versione mostra miglioramenti nella conformità ai prompt e nella copertura concettuale rispetto alla 3.2.

Il nuovo set di training con tagging GPT4V è raddoppiato, da 4000 immagini della serie helloworld3 a 8000, coprendo ritratti, animali, architettura, natura, cibo, illustrazioni e altro. Tuttavia, la versione GPT4V pura ha incontrato un problema di overfitting, attribuibile preliminarmente al raddoppio del numero di immagini. Il passo successivo nell'ottimizzazione iterativa è trovare come includere il maggior numero possibile di concetti non ritratto assicurando sufficiente training sui ritratti. Per ora è stata usata una fusione tra versione nuova e vecchia per un fine-tuning che garantisca una transizione morbida, quindi i vantaggi del set espanso e del tagging GPT4V non sono ancora molto evidenti; diventeranno più visibili nelle generazioni 5 e 6 del modello.

📖5.1.2024 Presentazione di "HelloWorld 3.2"

La versione 3.2 è un'iterazione ottimizzata con la tecnologia DPO, e rispetto alla 3.0, ha ottimizzazioni sul tono della pelle e precisione degli arti ma non significative. Per questo è chiamata 3.2 e non 4.0.

📖15.12.2023 Presentazione di "HelloWorld 3.0"

  1. La nuova versione ha ampliato il set di training, migliorando l'abilità del modello di esprimersi in diversi stili artistici, inclusi fantascienza e arte.

  2. Ha integrato un LoCon di miglioramento qualità autoprogettato (creato con tecnologia slider), per migliorare la texture delle immagini e alleviare problemi di distorsione di dita e arti.

📖17.11.2023 Presentazione di "HelloWorld 2.0"

Grazie a tutti per la pazienza. Dopo varie sfide, la versione HelloWorld 2.0 è finalmente pronta in uno stato di soddisfazione personale. Le principali differenze tra HelloWorld 2.0 e 1.0 sono:

  1. HelloWorld 2.0 non richiede più parole trigger, e i risultati sono comparabili in qualità a 1.0 con parole trigger. La parola trigger "leogirl" in 1.0 era fortemente associata a asiatici orientali. Dopo l'eliminazione delle parole trigger, termini come "1girl" probabilmente generano ancora ritratti asiatici se la razza non è specificata, ma ora è possibile indicare la razza con parole chiave di nazionalità, colore pelle ecc. Per esempio, effetti trigger per parole come "cinese", "russo", "iraniano", "giamaicano", "keniota", "pelle scura", "pelle chiara" ecc... sono elencati di seguito.

    Si possono anche ottenere stili diversi scrivendo nomi di persone di vari paesi e generi nei prompt, come Han Meimei (Cina), Sophie Martin (Francia), Priya Patel (India), Fatima Al-Hassan (Arabo), Wanjiru Mwangi (Kenya). Questi esempi sono solo indicativi, ci sono molti prompt e modi di giocare, siete incoraggiati a esplorare e condividere.

  2. HelloWorld 2.0 ha bilanciato qualità/colore e offre più opzioni di stile. La versione 1.0 con "leogirl" produceva immagini con forte texture film. HelloWorld 2.0 non è più vincolato a texture film e può essere personalizzato con prompt legati alla qualità. Alcuni prompt testati e funzionali includono:

    servizio fotografico di moda di alta gamma, foto di introduzione prodotto, trucco coreano popolare, aegyo sal, foto nitide ad alta qualità, luce da studio, foto formato medio, fotografia Mamiya, pellicola analogica, ritratto medio con luce soffusa, immagine reale, elegante fotografia editoriale, foto raw, foto reale, foto scansionata, fermo immagine film

    Gli effetti di colore di questi prompt sono:

  3. Il set di training di HelloWorld 2.0 ha aumentato significativamente la proporzione di foto a figura intera per migliorare gli effetti SDXL nella generazione di ritratti a figura intera e viste distanti. Sebbene migliorato rispetto alla 1.0, si raccomanda fortemente l'uso di "adetailer" durante la generazione di foto full body. Per utenti con sufficiente memoria video (24g), è consigliato un ritocco 1.5x ad alta risoluzione, che migliora notevolmente i dettagli facciali.

📖29.8.2023 Presentazione del modello base SDXL "HelloWorld"

Promemoria speciale: Quando si usa il modello HelloWorld 1.0, ricordarsi di aggiungere la parola trigger "leogirl".

Diversamente dal modello base SD1.5 “MoonFilm”, “HelloWorld” è una nuova serie di modelli base realistici SDXL. Per permettere a più utenti di scoprire HelloWorld, ho mantenuto il link del modello originale Moonfilm. Può essere visto come una continuazione spirituale di Moonfilm sulla nuova piattaforma SDXL, ma HelloWorld mira a più della sola ricerca di realismo e qualità cinematografica nei ritratti. Grazie alle notevoli capacità di comprensione testuale e quantità di informazioni di SDXL rispetto a SD1.5, HelloWorld è un modello base che mira a rappresentare realisticamente ogni cosa, ovvero voglio costruire gradualmente un mondo virtuale di fotografia usando HelloWorld.

Il modello base realistico SD1.5 è ormai piuttosto maturo, è improbabile che migliori significativamente. A meno di una tecnologia rivoluzionaria per la piattaforma SD1.5, le serie Moonfilm & MoonMix smetteranno di aggiornarsi. Dedicherò la mia energia principale allo sviluppo del modello grande HelloWorld SDXL. La versione 1.0 è ora disponibile, la 2.0 è in rapido sviluppo e prevista per aggiornamento a inizio settembre.

Come nuovo modello SDXL, HelloWorld differisce dai modelli SD1.5 tradizionali in tre aspetti:

  1. A differenza dei modelli base SD1.5 che normalmente non richiedono parole trigger, ricordate di usare la parola trigger "leogirl" in HelloWorld 1.0 per attivare stabilmente gli effetti del set di training SDXL.

  2. Il modello HelloWorld supporta output diretti a risoluzione 1024*1024 senza bisogno di ingrandimenti ad alta risoluzione. La qualità dei ritratti ravvicinati diretti non è inferiore alla versione SD1.5, ma presenta difetti negli output di ritratti distanti, perciò si suggerisce l'uso del plugin ADetailer per correggere i problemi dei volti distanti.

  3. SDXL ora consente un output più semplice con prompt in linguaggio naturale semplice. Si consiglia di provare più prompt in linguaggio naturale, per risultati migliori in foto realistiche AI.

Dopo più test, le impostazioni consigliate sono:

  • Passi ≥ 25

  • Campionatore: DPM++ 2M Karras

  • Scala CFG: 10

  • Dimensioni ≥ 1024x1024

  • ADetailer: attivo

Benvenuti a provare HelloWorld e a fornire feedback. Le vostre opinioni sono importanti per miglioramenti futuri!

La serie di modelli HelloWorld (di seguito "il Modello") è stata creata da me (di seguito "il Proprietario") con l'assistenza della piattaforma LiblibAI. La ripubblicazione del Modello su piattaforme diverse da LiblibAI e Civitai non è autorizzata dal Proprietario.

Il Proprietario permette l'uso gratuito delle immagini generate dal Modello per scopi educativi o informativi non commerciali, a condizione che:

- Gli utenti rispettino le leggi applicabili e non violino i diritti del Modello o di terzi.

- Le immagini siano chiaramente attribuite come "create con il modello base HelloWorld di LEOSAM".

Per qualsiasi uso commerciale è necessaria una licenza commerciale preventiva con il Proprietario. Per informazioni su licenze commerciali e personalizzazione modello, contattare il Proprietario tramite i recapiti sulla homepage.

Lo sviluppo e la distribuzione gratuita del modello SDXL sono impegni significativi. Il Proprietario garantisce aggiornamenti gratuiti continui del modello HelloWorld per hobbisti, come segno di gratitudine per il sostegno alla comunità open source. Collaborazioni commerciali sono fondamentali per il progresso e perfezionamento del Modello. Il Proprietario apprezza la comprensione e il supporto di ogni utente.

L'uso non autorizzato può violare leggi applicabili con conseguenze legali. Il Proprietario detiene i diritti esclusivi di interpretazione di questa dichiarazione, regolata dalle leggi vigente.

Precedente
Incursios Meme Diffusion SDXL Pony - v16PDXL
Successivo
LEOSAMs HelloWorld XL - HelloWorld XL 60

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

SDXL 1.0

Versione del modello

HelloWorld XL 7.0

Hash del modello

573f4a7d35

Creatore

Discussione

Per favore log in per lasciare un commento.