LEOSAMs HelloWorld XL - HelloWorld XL 60
Parole Chiave e Tag Correlati
Prompt Consigliati
conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic
film grain texture
analog photography aesthetic
Prompt Negativi Consigliati
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly
low quality,jpeg artifacts,blurry,poorly drawn,ugly,worst quality
Parametri Consigliati
samplers
steps
cfg
resolution
other models
Parametri Consigliati per Alta Risoluzione
upscaler
upscale
steps
denoising strength
Suggerimenti
Usa ADetailer per correggere i volti in lontananza.
Usa prompt in linguaggio naturale semplice per foto AI realistiche migliori.
I ritratti di alta qualità possono essere migliorati con ADetailer e correzione Hires 1.5x a intensità 0.3.
Punti Salienti della Versione
Aggiornamento HelloWorld 6.0 - 20 Aprile 2024
Grazie per la pazienza. Ho cercato lavoro recentemente, il che ha causato alcuni ritardi negli aggiornamenti di HelloWorld. Ecco i principali aggiornamenti nella versione 6.0:
HelloWorld 6.0 è un miglioramento iterativo basato sulla versione 5.0. Dai miei test, l'effetto realismo non differisce significativamente dalla versione 5.0. Il vantaggio principale della versione 6.0 risiede nella sua più ampia copertura di concetti nel training set. Secondo i feedback, sono stati migliorati vari temi inclusi surrealismo, boudoir, foto di gruppo, maschere, origami, render 3D, auto, draghi e fotografia di maternità. Alcuni esempi sono forniti nelle illustrazioni.
HelloWorld 6.0 include intenzionalmente alcune immagini di bassa qualità nel training per migliorare la risposta del modello ai prompt negativi. Si consiglia di utilizzare i seguenti termini nei prompt negativi: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".
Il corpo principale del training set di HelloWorld 6.0 usa il tagging GPT4v. Per le immagini che GPT4v non può taggare, si usa cogVQA guidato da blip2-opt-6.7b per il tagging. Lo stile del linguaggio di tag di questi modelli multimodali differisce significativamente dal tagger tradizionale WD1.4. Per facilitare una più accurata attivazione di diversi concetti nel training set, ho compilato le prime 250 parole tag ad alta frequenza dal training set di HelloWorld 6.0. È possibile visualizzare queste parole ad alta frequenza in questo documento.
Infine, sebbene SD3 stia per essere rilasciato, aggiornerò comunque a HelloWorld XL 7.0, sperando di ottenere miglioramenti maggiori nella versione 7.0!
Sponsor del Creatore
🖥️Benvenuti a provare l'open-source GPT4V-Image-Captioner, sviluppato da me e dal mio amico. Offre un'installazione con un clic ed è integrato con molteplici funzionalità tra cui pre-compressione delle immagini, tagging delle immagini e statistiche sui tag. Recentemente abbiamo anche lanciato la versione plugin webui di questo strumento, tutti sono invitati a utilizzarla!
🌍欢迎加入QQ群'兔狲·AIGC梦工北厂',群号 :780132897 ;'兔狲·AIGC梦工南厂',群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1
🖥️Benvenuti a provare l'open-source GPT4V-Image-Captioner, sviluppato da me e dal mio amico. Offre un'installazione con un clic ed è integrato con molteplici funzionalità tra cui pre-compressione delle immagini, tagging delle immagini e statistiche sui tag. Recentemente abbiamo anche lanciato la versione plugin webui di questo strumento, tutti sono invitati a utilizzarla!
🌍欢迎加入QQ群"兔狲·AIGC梦工北厂",群号 :780132897 ;"兔狲·AIGC梦工南厂",群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1
📖Aggiornamento HelloWorld 7.0 - 13 Giugno 2024
Sintesi dell'aggiornamento in una frase: HelloWorld 7.0 è una versione ottimizzata iterativamente, con la migliore resa corporea dell'intera serie, e un ulteriore ampliamento dell'ambito concettuale e della ricchezza di dettagli.
Dettagli dell'aggiornamento:
Aggiungendo immagini negative nel training, rafforzando l'allenamento delle pose e ottimizzando il modello clip, è stata migliorata la precisione di arti e mani rispetto alle versioni precedenti. Le parole negative consigliate sono: "bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality".
Estratto il LoRA fine-tuned dal modello SPO ufficiale e incorporato in HelloWorld 7.0. SPO è un ulteriore miglioramento del metodo DPO. Il modello base SPO è usato per prestazioni migliori rispetto al modello base DPO XL e al modello base SDXL originale. Lo SPO LoRA può migliorare i dettagli e il contrasto dell'immagine e abbellirle. Grazie al team tecnico dietro SPO.
Continuato ad espandere l'ambito concettuale del training set, ma ottimizzato e snellito il training set (il fine-tuning di grandi set è troppo costoso, e H800 è difficile da noleggiare recentemente, non si può permettere il tempo locale di training). L'attuale training set totale è di 20.821 immagini. La distribuzione delle risoluzioni del training set è la seguente, e si consiglia di usare diverse risoluzioni con maggior numero di immagini per l'output:
(832, 1248) - Numero: 7128 (896, 1152) - Numero: 6250 (1248, 832) - Numero: 2402 (1024, 1024) - Numero: 1639 (1360, 768) - Numero: 928 (1152, 896) - Numero: 870 (768, 1360) - Numero: 432 (960, 1088) - Numero: 506 (992, 1056) - Numero: 162 (1088, 960) - Numero: 140 (704, 1472) - Numero: 120 (1056, 992) - Numero: 122 (1472, 704) - Numero: 115 (1632, 640) - Numero: 75 (640, 1632) - Numero: 12Usato GPT4O per ri-etichettare tutti i dataset. Questa volta è stato utilizzato un metodo di etichettatura strutturato, con la struttura specifica: "descrizione riassuntiva in una frase + multipli tag di elementi dell'immagine + ispirato da XXX + parole descrittive della qualità estetica", dove le parole descrittive della qualità estetica sono divise in cinque livelli: worst quality, low quality, average quality, best quality e masterpiece. Un esempio tipico di etichettatura è il seguente:
conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic, inspired by salvador dalí's surrealist works, masterpiece
La "Lista Parole Tag ad Alta Frequenza" e la "Lista Stili Artistici ad Alta Frequenza" coinvolte in Inspired by XXX per la versione HelloWorld 7.0 saranno fornite solo agli utenti con licenza commerciale. I partner che hanno acquistato l'autorizzazione al modello della serie HelloWorld XL in passato, per favore contattatemi in caso di omissioni per riceverla gratuitamente.
I giocatori possono fare riferimento alla Lista Parole Tag ad Alta Frequenza di HelloWorld 6.0. Inoltre, ho fornito più di 150 immagini esemplificative di alta qualità di HelloWorld 7.0 nella galleria, che possono essere usate come riferimento per l'output di tutti. La creazione di modelli non è semplice, grazie ai giocatori per la comprensione e la tolleranza!
📖Aggiornamento HelloWorld 6.0 - 20 Aprile 2024
LEOSAM HelloWorld 6.0 Top 250 Lista Parole Tag ad Alta Frequenza
Grazie per la pazienza. Ho cercato lavoro recentemente, il che ha causato alcuni ritardi negli aggiornamenti di HelloWorld. Ecco i principali aggiornamenti nella versione 6.0:
HelloWorld 6.0 è un miglioramento iterativo basato sulla versione 5.0. Dai miei test, l'effetto realismo non differisce significativamente dalla versione 5.0. Il vantaggio principale della versione 6.0 risiede nella sua più ampia copertura di concetti nel training set. Secondo i feedback, sono stati migliorati vari temi inclusi surrealismo, boudoir, foto di gruppo, maschere, origami, render 3D, auto, draghi e fotografia di maternità. Alcuni esempi sono forniti nelle illustrazioni.
HelloWorld 6.0 include intenzionalmente alcune immagini di bassa qualità nel training per migliorare la risposta del modello ai prompt negativi. Si consiglia di utilizzare i seguenti termini nei prompt negativi: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".
Il corpo principale del training set di HelloWorld 6.0 usa il tagging GPT4v. Per le immagini che GPT4v non può taggare, si usa cogVQA guidato da blip2-opt-6.7b per il tagging. Lo stile del linguaggio di tag di questi modelli multimodali differisce significativamente dal tagger tradizionale WD1.4. Per facilitare una più accurata attivazione di diversi concetti nel training set, ho compilato le prime 250 parole tag ad alta frequenza dal training set di HelloWorld 6.0. È possibile visualizzare queste parole ad alta frequenza in questo documento.
Infine, sebbene SD3 stia per essere rilasciato, aggiornerò comunque a HelloWorld XL 7.0, sperando di ottenere miglioramenti maggiori nella versione 7.0!
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Creatore
Discussione
Per favore log in per lasciare un commento.













