HelloWorld XL di LEOSAM - HelloWorld XL 1.0
Parole Chiave e Tag Correlati
Prompt Consigliati
studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still,film grain texture,analog photography aesthetic
leogirl
Prompt Negativi Consigliati
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly
(worst quality, low quality, cgi, bad eye, worst eye, illustration, deformed, cartoon), distorted, disfigured, poorly drawn, bad anatomy, wrong anatomy, open mouth
Parametri Consigliati
samplers
steps
cfg
clip skip
resolution
Parametri Consigliati per Alta Risoluzione
upscaler
upscale
steps
Suggerimenti
Aggiungere la parola trigger 'leogirl' quando si usa HelloWorld 1.0 per attivare stabilmente gli effetti di training.
Usare il plugin 'adetailer' per correggere problemi nei ritratti distanti, specialmente per immagini full-body.
Per dettagli facciali migliori in immagini full-body, eseguire riparazione alta risoluzione 1.5x con intensità circa 0.3.
Utilizzare prompt in linguaggio naturale per migliorare la qualità di output con modelli SDXL.
Evitare toni caldi indesiderati usando prompt come 'studio light' e 'sharp focus'.
Le immagini full-body possono avere scene più ampie e dettagli facciali meno nitidi a risoluzione 1024; usare prompt di composizione o adetailer per migliorare.
Il modello include concetti diversi come surrealismo, boudoir, maschere, origami, mecha, animali e texture filmiche.
Punti Salienti della Versione
Come nuovo modello SDXL, HelloWorld presenta tre differenze rispetto ai modelli tradizionali SD1.5:
A differenza dei modelli base SD1.5 che di solito non usano parole trigger, ricordate di usare la parola trigger "leogirl" con HelloWorld 1.0. Questo assicura effetti del set di training più stabili.
Il modello HelloWorld supporta output diretto a risoluzione 1024x1024 senza necessità di ingrandimenti HR. La qualità del ritratto ravvicinato diretto non è inferiore alla versione SD1.5, ma ci sono ancora difetti nei ritratti distanti diretti. Si suggerisce di usare il plugin ADetailer che può correggere efficacemente problemi di volti distanti.
SDXL permette ora output facilitati con prompt in linguaggio naturale semplice, consigliando l’impiego di più prompt in linguaggio naturale per risultati migliori nelle foto realistiche AI.
Dopo vari test, i parametri raccomandati sono:
Passi ≥ 25
Sampler: DPM++ 2M Karras
CFG scale: 10
Dimensione ≥ 1024x1024
ADetailer: attivo
作为全新的SDXL模型,HelloWorld在使用时有三点与传统SD1.5模型的不同:
HelloWorld 1.0模型使用必备的触发词是leogirl,除此以外,建议同时添加realistic和looking at viewer两个正向提示词。建议使用的负面提示词是:bad eyes, incorrect hands, worst teeth, abnormal anatomy, wrong lips, illustration, cartoon, painting。
HelloWorld模型支持1024*1024分辨率直接出图,不需要高分辨率放大,目前在近景人像直出质感上不输于SD1.5版本,但直出远景人像时仍存在瑕疵,因此建议搭配ADetailer插件使用,可以很好地修正远景人脸问题。
SDXL现在可以使用更简单的自然语言提示词进行出图,建议多多尝试自然语言提示词,输出AI写实照片时会有更好的效果。
经过多轮测试,建议的绘图参数设置包括:
Steps ≥ 25
Sampler: DPM++ 2M Karras
CFG scale: 10
Size ≥ 1024x1024
ADetailer: open
Sponsor del Creatore
🖥️Prova lo open-source GPT4V-Image-Captioner con installazione con un clic e funzioni come pre-compressione immagini e tagging.
Usa la versione plugin webui per facile integrazione.
🖥️Benvenuti a provare lo GPT4V-Image-Captioner open-source, sviluppato da me e dal mio amico. Offre un'installazione con un clic e include funzionalità come la pre-compressione immagini, il tagging delle immagini e statistiche dei tag. Recentemente abbiamo anche lanciato la versione plugin webui di questo strumento, aperta a tutti gli utenti!
🌍Benvenuti a unirvi ai gruppi QQ "兔狲·AIGC梦工北厂" con numero gruppo: 780132897; "兔狲·AIGC梦工南厂" con numero gruppo: 835297318 (la risposta per entrare è: 兔狲). Gruppo Telegram "兔狲的SDXL百老汇", link: https://t.me/+KkflmfLTAdwzMzI1
📖Aggiornamento HelloWorld 7.0 - 13 giugno 2024
Riassunto in una frase: HelloWorld 7.0 è una versione ottimizzata iterativamente, con la migliore performance corporea di tutta la serie e un'ulteriore estensione del campo concettuale e della ricchezza dei dettagli.
Dettagli aggiornamento:
Aggiungendo immagini negative per l'addestramento, rafforzando l'addestramento delle pose e ottimizzando il modello clip, la precisione degli arti e delle mani è migliorata rispetto alle versioni precedenti. Le parole negative raccomandate sono: "bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality".
Estratto il LoRA rifinito dal modello ufficiale SPO e incorporato in HelloWorld 7.0. SPO rappresenta un ulteriore miglioramento del metodo DPO. Il modello base SPO offre prestazioni migliori rispetto ai modelli base DPO XL e SDXL originali. Lo SPO LoRA migliora dettagli, contrasto e abbellisce le immagini. Grazie al team tecnico dietro SPO.
Espanso ulteriormente il campo concettuale del set di addestramento, ma ottimizzato e snellito (il fine tuning di un set grande costa troppo, e H800 è difficile da noleggiare ultimamente, quindi il training locale non è fattibile). Il set totale attuale conta 20.821 immagini con la seguente distribuzione di risoluzione, si raccomanda di usare risoluzioni con più immagini per l'output:
(832, 1248) - Conteggio: 7128 (896, 1152) - Conteggio: 6250 (1248, 832) - Conteggio: 2402 (1024, 1024) - Conteggio: 1639 (1360, 768) - Conteggio: 928 (1152, 896) - Conteggio: 870 (768, 1360) - Conteggio: 432 (960, 1088) - Conteggio: 506 (992, 1056) - Conteggio: 162 (1088, 960) - Conteggio: 140 (704, 1472) - Conteggio: 120 (1056, 992) - Conteggio: 122 (1472, 704) - Conteggio: 115 (1632, 640) - Conteggio: 75 (640, 1632) - Conteggio: 12Usato GPT4O per rietichettare tutti i dataset. Questa volta è stato usato un metodo di etichettatura strutturata con la seguente struttura: "descrizione sommaria in una frase + più tag degli elementi dell’immagine + ispirato da XXX + parole per la qualità estetica", dove le parole di qualità estetica sono divise in cinque livelli: worst quality, low quality, average quality, best quality, masterpiece. Un esempio tipico di etichettatura è:
arte concettuale che presenta una mano umana avvolta da nastri rossi e beige, isolata su sfondo chiaro e semplice, stile realistico, schema di colori minimalista, texture lisce, estetica allungata e surreale, ispirata alle opere surrealiste di Salvador Dalí, capolavoro
La "Lista delle Parole di Tagging ad Alta Frequenza" e la "Lista degli Stili Artistici ad Alta Frequenza" coinvolte in "Ispirato da XXX" per la versione 7.0 di HelloWorld saranno fornite solo a utenti con licenza commerciale. I partner che hanno acquistato in passato l'autorizzazione al modello HelloWorld XL possono contattarmi per eventuali omissioni e ottenere l’accesso gratuito.
Gli utenti possono fare riferimento alla Lista delle Parole Tagging ad Alta Frequenza di HelloWorld 6.0. Inoltre, ho fornito oltre 150 immagini di esempio di alta qualità di HelloWorld 7.0 nella galleria come riferimento per la produzione. Realizzare modelli non è semplice, grazie a tutti gli utenti per la comprensione e la tolleranza!
📖Aggiornamento HelloWorld 6.0 - 20 aprile 2024
LEOSAM HelloWorld 6.0 Top 250 – Lista Parole Tagging ad Alta Frequenza
Grazie per la pazienza. Ho cercato lavoro ultimamente, causando ritardi negli aggiornamenti di HelloWorld. Principali aggiornamenti in versione 6.0:
HelloWorld 6.0 è un miglioramento iterativo basato sulla versione 5.0. Secondo i miei test, il realismo non differisce significativamente dalla 5.0. Il vantaggio principale è la copertura più ampia di concetti nel set di addestramento. Secondo feedback, sono stati migliorati temi come surrealismo, boudoir, foto di gruppo, maschere, origami, rendering 3D, auto, draghi e fotografia di maternità. Alcuni esempi sono nelle illustrazioni.
HelloWorld 6.0 include volutamente alcune immagini di bassa qualità nel training per migliorare la risposta del modello a prompt negativi. Si raccomanda l’uso delle seguenti parole nei prompt negativi: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".
Il corpo principale del training set di HelloWorld 6.0 usa il tagging GPT4v. Per immagini non taggabili da GPT4v, si usa cogVQA guidato da blip2-opt-6.7b. Lo stile linguistico di questi modelli multimodali differisce significativamente dal tagger tradizionale WD1.4. Per facilitare un più accurato trigger di concetti nel training set, ho compilato la top 250 parole di tagging ad alta frequenza dal dataset di HelloWorld 6.0. Puoi consultare queste parole ad alta frequenza in questo documento.
Infine, anche se SD3 è prossimo al rilascio, continuerò ad aggiornare HelloWorld XL 7.0 col fine di ottenere miglioramenti maggiori in quella versione!
📖2024.2.22 Presentazione di "HW5.0_Euler_a_Lightning"
Questo modello è una versione accelerata del modello base HelloWorld SDXL che integra le tecnologie SDXL-Lightning. Dotato del campionatore Euler a e CFG 1, può generare immagini in 6-8 passi, tre volte più veloce rispetto alla versione SDXL originale. Inoltre, a confronto, i risultati di imaging sono superiori rispetto alle versioni LCM o Turbo.
I parametri consigliati per la generazione con questo modello sono:
Sampler: Euler a (Importante! Il modello è adattato specificamente a Euler a, altri sampler potrebbero non dare buoni risultati)
CFG scale: 1
Passi di campionamento: 8 passi (6-8 passi accettabili)
Algoritmo Hires: ESRGAN 4x / 8x_NMKD-Faces_160000_G
Fattore di ingrandimento Hires: 1.5x
Passi Hires: 8 passi
Forza denoising Hires: 0.3
📖2024.2.11 Presentazione di "HelloWorld 5.0 GPT4V"
HelloWorld 5.0 è l’aggiornamento più rilevante della serie HelloWorld, taggato con GPT-4v, con un rifinitura significativa in ambiti come fantascienza, animali, architettura e illustrazione.
I test comparativi mostrano miglioramenti in questa versione quali:
1. Pose e composizioni più varie e dinamiche dei personaggi, per immagini visivamente coinvolgenti;
2. Dataset cinematografico ampiamente addestrato. Sebbene la texture cinematografica fosse debole da 2.0 a 4.0, molti fan rimpiangevano lo stile leogirl 1.0. Questo aggiornamento rafforza la texture filmica senza compromettere altre qualità fotografiche. La texture filmica può essere attivata con frasi come film grain texture e analog photography aesthetic;
3. Espressività migliorata in temi come fantascienza, thriller e animali, con mecha e altri soggetti più progettati. Animali come leopardo delle nevi, panda rosso, panda gigante, tigre, gatto di Pallas e gatti e cani domestici più realistici;
4. Grazie al tagging GPT, la conformità ai prompt e la precisione concettuale sono ulteriormente migliorate.
I difetti di questa versione includono:
1. Essendo un aggiornamento di rifinitura consistente, il tasso di errore sugli arti può aumentare leggermente, fenomeno normale quando si esce da una zona di comfort verso nuove ottimizzazioni. Le versioni precedenti avevano estesi test su arti, mentre questa versione ha avuto meno tempo per tali miglioramenti. Comunque, la precisione degli arti è almeno superiore alla versione 1.0 e continuerò a migliorare nelle versioni future.
2. A causa della texture filmica rafforzata, nonostante il tagging GPT preciso, può esservi un tono caldo di default. Tuttavia, usando prompt come studio light o sharp focus si ottengono immagini in studio ad alta definizione con toni della pelle e appeal visivo migliori rispetto alle versioni precedenti.
3. Questa versione include più immagini di personaggi a figura intera per migliorare l’effetto figura intera, quindi il modello può produrre scene più ampie se non viene indicata una composizione specifica. Actualmente, i dettagli facciali in scatti full-body a risoluzione 1024 possono essere meno nitidi rispetto a mezzi busti o primi piani. Ciò può essere migliorato con adetailer e un ingrandimento 1.5x con intensità 0.3 o prompt che specificano la composizione per evitare full-body.
4. Dato l’aggiunta di pochi dataset di illustrazioni di alta qualità, è possibile che prompt di stili animati producano immagini animate. Se è un problema, regolate i prompt di conseguenza.
Questi sono gli aggiornamenti principali di questa versione. Addestrare il modello base SDXL è impegnativo e con oltre diecimila immagini, il costo per tagging e training di ogni modello supera i 300 USD. Invito tutti a usare il modello e apprezzo qualsiasi feedback! Se vi piace, vi sarei grato se poteste aiutare a diffonderlo.
📖2024.1.31 Presentazione di "HelloWorld 4.0"
HelloWorld 4.0 è una versione transitoria progressiva dal tagging blip+clip al tagging GPT4V. Ho addestrato inizialmente un modello di tagging GPT4V puro, che poi ho unito con una grande proporzione di HelloWorld 3.2 e 0.05 di Juggernaut XL (per regolare il tono della pelle). La nuova versione mostra miglioramenti nella conformità ai prompt e copertura concettuale rispetto alla 3.2.
Il nuovo dataset di tagging GPT4V è raddoppiato rispetto alle 4000 immagini della serie helloworld3 a 8000 immagini, coprendo ritratti, animali, architettura, natura, cibo, illustrazioni e altro. Tuttavia, la versione GPT4V pura ha avuto problemi di overfitting, in parte dovuti al raddoppio delle immagini di addestramento. Un prossimo passo sarà includere più concetti non-ritratto garantendo una buona formazione sui ritratti. Attualmente si usa una fusione delle versioni nuova e vecchia per un passaggio graduale. I vantaggi del set concettuale espanso e del tagging GPT4V diventeranno più evidenti nelle generazioni 5 e 6 del modello.
📖2024.1.5 Presentazione di "HelloWorld 3.2"
La versione 3.2 è un’iterazione ottimizzata con la tecnologia DPO, e rispetto alla 3.0 presenta ottimizzazioni nel tono della pelle e nella precisione degli arti, anche se i miglioramenti non sono significativi. Per questo è chiamata 3.2 e non 4.0.
📖2023.12.15 Presentazione di "HelloWorld 3.0"
La nuova versione ha ampliato il set di addestramento, potenziando la capacità del modello di esprimersi in diversi stili artistici, inclusi fantascienza e arte.
Integra un LoCon di miglioramento qualità autoprodotto (creato con tecnologia slider) per migliorare la texture delle immagini e alleviare problemi di distorsione di dita e arti.
📖2023.11.17 Presentazione di "HelloWorld 2.0"
Grazie per la pazienza. Dopo varie difficoltà, la versione HelloWorld 2.0 è pronta per essere presentata in uno stato soddisfacente. Le principali differenze tra HelloWorld 2.0 e 1.0 sono:
HelloWorld 2.0 non richiede più parole trigger e la qualità è comparabile alla versione 1.0 con trigger. La parola trigger "leogirl" in 1.0 era molto associata agli asiatici orientali. Dopo aver tolto i trigger, termini come "1girl" genereranno ancora ritratti asiatici a meno che non si specifichi la razza con parole chiave come nazionalità, colore della pelle, ecc. Ad esempio, gli effetti trigger per parole come "Chinese", "Russian", "Iranian", "Jamaican", "Kenyan", "dark-skinned", "pale-skinned", ecc. sono indicati di seguito.

Si possono ottenere stili diversi scrivendo nel prompt nomi di persone di vari paesi e generi, come Han Meimei (Cina), Sophie Martin (Francia), Priya Patel (India), Fatima Al-Hassan (Arabo), Wanjiru Mwangi (Kenya). Questi sono solo esempi: ci sono molti modi di giocare e siete invitati a esplorarli e condividerli.

HelloWorld 2.0 ha bilanciato qualità e colore e offre più opzioni di stile. La versione 1.0 con "leogirl" produceva immagini con texture filmica marcata. HelloWorld 2.0 non è più legato alla texture filmica e può essere personalizzato con prompt legati alla qualità. Alcuni prompt testati includono:
servizio fotografico di alta moda, foto introduttiva prodotto, trucco coreano popolare, aegyo sal, foto ad alta qualità nitida, luce da studio, foto medio formato, fotografia Mamiya, pellicola analogica, ritratto medio con luce soffusa, immagine realistica, fotografia editoriale raffinata, foto raw, foto reale, foto scannerizzata, still film
L'effetto colore di questi prompt è il seguente:

Il set di addestramento di HelloWorld 2.0 ha incrementato significativamente la proporzione di foto full-body per migliorare gli effetti di SDXL nella generazione di ritratti a figura intera e in prospettiva distante. Sebbene migliorato rispetto alla 1.0, è fortemente consigliato usare "adetailer" per generare foto full-body. Inoltre, utenti con abbastanza VRAM (24GB) possono eseguire una riparazione in alta risoluzione 1.5x che migliora significativamente i dettagli facciali.
📖2023.8.29 Presentazione del modello base SDXL "HelloWorld"
Promemoria speciale: Quando usate il modello HelloWorld 1.0, ricordate di aggiungere la parola trigger "leogirl".
Diverso dal modello base SD1.5 “MoonFilm”, “HelloWorld” è una nuova serie di modelli base SDXL realistici. Per permettere a più utenti di scoprire HelloWorld, ho mantenuto il link originale di MoonFilm. Può essere visto come una continuazione spirituale di MoonFilm su piattaforma SDXL, ma HelloWorld mira a raggiungere più della semplice ricerca di realismo e qualità filmica nei ritratti. Grazie alla superiore quantità di informazioni e capacità di comprensione testuale di SDXL rispetto a SD1.5, HelloWorld è un modello base che vuole rappresentare realisticamente tutte le cose, in altre parole costruire progressivamente un mondo di fotografia virtuale con HelloWorld.
Il modello base realistico di SD1.5 è ormai molto maturo e poco suscettibile a miglioramenti significativi. Salvo tecnologie di rottura per SD1.5, la serie Moonfilm & MoonMix si fermerà essenzialmente negli aggiornamenti. Dedicherò la mia energia allo sviluppo di HelloWorld SDXL. La versione 1.0 è disponibile ora, la 2.0 è in sviluppo urgente e prevista per inizio settembre.
Come nuovo modello SDXL, HelloWorld presenta tre differenze rispetto ai modelli tradizionali SD1.5:
A differenza dei modelli base SD1.5 che di solito non usano parole trigger, ricordate di usare la parola trigger "leogirl" con HelloWorld 1.0. Questo assicura effetti più stabili del set di training.
Il modello HelloWorld supporta output diretto a risoluzione 1024x1024 senza necessità di ingrandimenti HR. La qualità del ritratto ravvicinato diretto non è inferiore alla versione SD1.5, ma accusa difetti nei ritratti distanti diretti. Si suggerisce quindi di usare il plugin ADetailer che corregge efficacemente problemi di volti distanti.
SDXL permette ora output facilitati con prompt in linguaggio naturale semplice, consigliando l’uso di questi per risultati migliori nelle foto realistiche AI.
Dopo vari test, i parametri raccomandati sono:
Passi ≥ 25
Sampler: DPM++ 2M Karras
CFG scale: 10
Dimensione ≥ 1024x1024
ADetailer: attivo
Tutti sono invitati a provare HelloWorld e fornire feedback, che sono molto importanti per miglioramenti futuri!
Dichiarazione di Copyright:
La serie di modelli HelloWorld (da qui "Modello") è stata creata da me ("Proprietario") con l’aiuto della piattaforma LiblibAI. La pubblicazione del Modello su piattaforme diverse da LiblibAI e Civitai non è autorizzata dal Proprietario.
Il Proprietario permette l’uso gratuito delle immagini generate dal Modello per scopi educativi o informativi non commerciali, a condizione che:
- Gli utenti rispettino le leggi applicabili e non violino diritti del Modello o di terzi.
- L’attribuzione sia chiaramente indicata come "creato con il modello base HelloWorld di LEOSAM".
Per qualsiasi uso commerciale è richiesta una licenza commerciale preventiva col Proprietario. Per richieste di licenze commerciali o personalizzazione del modello, contattare il Proprietario tramite le informazioni nella homepage.
Lo sviluppo e la distribuzione gratuita del modello SDXL sono impegni significativi. Il Proprietario si impegna a fornire aggiornamenti gratuiti a singoli appassionati come riconoscimento per il contributo alla comunità open-source. Collaborazioni commerciali sono fondamentali per il progresso e miglioramento del Modello. Il Proprietario ringrazia tutti per comprensione e supporto.
L’uso non autorizzato può violare leggi e comportare conseguenze legali. Il Proprietario ha diritti esclusivi di interpretazione di questa dichiarazione, regolata dalle leggi vigenti.
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Parole addestrate
Creatore
Discussione
Per favore log in per lasciare un commento.
