modelli/LEOSAMs HelloWorld XL - HelloWorld XL 60

LEOSAMs HelloWorld XL - HelloWorld XL 60

|
5/20/2025
|
1:39:33 PM
| Discussion|
0
Uno scheletro traslucido di una sirena sott'acqua con tonalità blu spettrali, che mostra ossa dettagliate e uno stile raggi X, su sfondo oscuro dell'oceano.
Donna indiana tradizionale in saree verde e crema, creata utilizzando stable diffusion.
Immagine generata da AI usando Stable Diffusion di una donna vestita con un tradizionale sari verde e bianco con i capelli intrecciati, che indossa gioielli tradizionali.
Una bella donna indiana in un sari tradizionale con una combinazione di colori bianco e arancione, generata da AI usando stable diffusion.
Immagine generata da AI usando Stable Diffusion di una donna con capelli biondi e occhi blu intensi
Una bellissima donna con abito tradizionale indiano e treccia, che indossa un sari beige. Immagine generata da AI usando Stable Diffusion.
La piramide dell'hotel Luxor a Las Vegas illuminata da un fascio di luce blu, creata usando Stable Diffusion.
Una donna che indossa una maglietta grigia e leggings in piedi all'interno di un treno ben illuminato, creata usando stable diffusion AI.
Gruppo di giovani donne in abiti alla moda che posano insieme. Immagine generata da AI usando stable diffusion.
Foto di gruppo di giovani donne in vestiti colorati con palloncini sullo sfondo, sottolineando che questa è un'immagine generata da AI usando Stable Diffusion.
Barriera corallina vibrante che circonda una città subacquea con strutture dall'aspetto antico. Immagine generata da AI usando Stable Diffusion.
Immagine generata da AI usando Stable Diffusion che mostra una splendida vista notturna dello skyline di Las Vegas con hotel e casinò luminosi lungo lo strip.

Prompt Consigliati

conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic

film grain texture

analog photography aesthetic

Prompt Negativi Consigliati

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

low quality,jpeg artifacts,blurry,poorly drawn,ugly,worst quality

Parametri Consigliati

samplers

Restart

steps

27 - 30

cfg

7 - 8

resolution

832x1344, 832x1260

other models

LeosamHelloWorldV6 (8ca0bade3c)

Parametri Consigliati per Alta Risoluzione

upscaler

ESRGAN_4x

upscale

1.5

steps

27 - 30

denoising strength

0.3

Suggerimenti

Usa ADetailer per correggere i volti in lontananza.

Usa prompt in linguaggio naturale semplice per foto AI realistiche migliori.

I ritratti di alta qualità possono essere migliorati con ADetailer e correzione Hires 1.5x a intensità 0.3.

Punti Salienti della Versione

Aggiornamento HelloWorld 6.0 - 20 Aprile 2024

Grazie per la pazienza. Ho cercato lavoro recentemente, il che ha causato alcuni ritardi negli aggiornamenti di HelloWorld. Ecco i principali aggiornamenti nella versione 6.0:

  • HelloWorld 6.0 è un miglioramento iterativo basato sulla versione 5.0. Dai miei test, l'effetto realismo non differisce significativamente dalla versione 5.0. Il vantaggio principale della versione 6.0 risiede nella sua più ampia copertura di concetti nel training set. Secondo i feedback, sono stati migliorati vari temi inclusi surrealismo, boudoir, foto di gruppo, maschere, origami, render 3D, auto, draghi e fotografia di maternità. Alcuni esempi sono forniti nelle illustrazioni.

  • HelloWorld 6.0 include intenzionalmente alcune immagini di bassa qualità nel training per migliorare la risposta del modello ai prompt negativi. Si consiglia di utilizzare i seguenti termini nei prompt negativi: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".

  • Il corpo principale del training set di HelloWorld 6.0 usa il tagging GPT4v. Per le immagini che GPT4v non può taggare, si usa cogVQA guidato da blip2-opt-6.7b per il tagging. Lo stile del linguaggio di tag di questi modelli multimodali differisce significativamente dal tagger tradizionale WD1.4. Per facilitare una più accurata attivazione di diversi concetti nel training set, ho compilato le prime 250 parole tag ad alta frequenza dal training set di HelloWorld 6.0. È possibile visualizzare queste parole ad alta frequenza in questo documento.

Infine, sebbene SD3 stia per essere rilasciato, aggiornerò comunque a HelloWorld XL 7.0, sperando di ottenere miglioramenti maggiori nella versione 7.0!

Sponsor del Creatore

🖥️Benvenuti a provare l'open-source GPT4V-Image-Captioner, sviluppato da me e dal mio amico. Offre un'installazione con un clic ed è integrato con molteplici funzionalità tra cui pre-compressione delle immagini, tagging delle immagini e statistiche sui tag. Recentemente abbiamo anche lanciato la versione plugin webui di questo strumento, tutti sono invitati a utilizzarla!

🌍欢迎加入QQ群'兔狲·AIGC梦工北厂',群号 :780132897 ;'兔狲·AIGC梦工南厂',群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1

🖥️Benvenuti a provare l'open-source GPT4V-Image-Captioner, sviluppato da me e dal mio amico. Offre un'installazione con un clic ed è integrato con molteplici funzionalità tra cui pre-compressione delle immagini, tagging delle immagini e statistiche sui tag. Recentemente abbiamo anche lanciato la versione plugin webui di questo strumento, tutti sono invitati a utilizzarla!

🌍欢迎加入QQ群"兔狲·AIGC梦工北厂",群号 :780132897 ;"兔狲·AIGC梦工南厂",群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1

📖Aggiornamento HelloWorld 7.0 - 13 Giugno 2024

Sintesi dell'aggiornamento in una frase: HelloWorld 7.0 è una versione ottimizzata iterativamente, con la migliore resa corporea dell'intera serie, e un ulteriore ampliamento dell'ambito concettuale e della ricchezza di dettagli.

Dettagli dell'aggiornamento:

  1. Aggiungendo immagini negative nel training, rafforzando l'allenamento delle pose e ottimizzando il modello clip, è stata migliorata la precisione di arti e mani rispetto alle versioni precedenti. Le parole negative consigliate sono: "bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality".

  2. Estratto il LoRA fine-tuned dal modello SPO ufficiale e incorporato in HelloWorld 7.0. SPO è un ulteriore miglioramento del metodo DPO. Il modello base SPO è usato per prestazioni migliori rispetto al modello base DPO XL e al modello base SDXL originale. Lo SPO LoRA può migliorare i dettagli e il contrasto dell'immagine e abbellirle. Grazie al team tecnico dietro SPO.

  3. Continuato ad espandere l'ambito concettuale del training set, ma ottimizzato e snellito il training set (il fine-tuning di grandi set è troppo costoso, e H800 è difficile da noleggiare recentemente, non si può permettere il tempo locale di training). L'attuale training set totale è di 20.821 immagini. La distribuzione delle risoluzioni del training set è la seguente, e si consiglia di usare diverse risoluzioni con maggior numero di immagini per l'output:

    (832, 1248) - Numero: 7128
    (896, 1152) - Numero: 6250
    (1248, 832) - Numero: 2402
    (1024, 1024) - Numero: 1639
    (1360, 768) - Numero: 928
    (1152, 896) - Numero: 870
    (768, 1360) - Numero: 432
    (960, 1088) - Numero: 506
    (992, 1056) - Numero: 162
    (1088, 960) - Numero: 140
    (704, 1472) - Numero: 120
    (1056, 992) - Numero: 122
    (1472, 704) - Numero: 115
    (1632, 640) - Numero: 75
    (640, 1632) - Numero: 12
  4. Usato GPT4O per ri-etichettare tutti i dataset. Questa volta è stato utilizzato un metodo di etichettatura strutturato, con la struttura specifica: "descrizione riassuntiva in una frase + multipli tag di elementi dell'immagine + ispirato da XXX + parole descrittive della qualità estetica", dove le parole descrittive della qualità estetica sono divise in cinque livelli: worst quality, low quality, average quality, best quality e masterpiece. Un esempio tipico di etichettatura è il seguente:

    conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic, inspired by salvador dalí's surrealist works, masterpiece

La "Lista Parole Tag ad Alta Frequenza" e la "Lista Stili Artistici ad Alta Frequenza" coinvolte in Inspired by XXX per la versione HelloWorld 7.0 saranno fornite solo agli utenti con licenza commerciale. I partner che hanno acquistato l'autorizzazione al modello della serie HelloWorld XL in passato, per favore contattatemi in caso di omissioni per riceverla gratuitamente.

I giocatori possono fare riferimento alla Lista Parole Tag ad Alta Frequenza di HelloWorld 6.0. Inoltre, ho fornito più di 150 immagini esemplificative di alta qualità di HelloWorld 7.0 nella galleria, che possono essere usate come riferimento per l'output di tutti. La creazione di modelli non è semplice, grazie ai giocatori per la comprensione e la tolleranza!

📖Aggiornamento HelloWorld 6.0 - 20 Aprile 2024

LEOSAM HelloWorld 6.0 Top 250 Lista Parole Tag ad Alta Frequenza

Grazie per la pazienza. Ho cercato lavoro recentemente, il che ha causato alcuni ritardi negli aggiornamenti di HelloWorld. Ecco i principali aggiornamenti nella versione 6.0:

  • HelloWorld 6.0 è un miglioramento iterativo basato sulla versione 5.0. Dai miei test, l'effetto realismo non differisce significativamente dalla versione 5.0. Il vantaggio principale della versione 6.0 risiede nella sua più ampia copertura di concetti nel training set. Secondo i feedback, sono stati migliorati vari temi inclusi surrealismo, boudoir, foto di gruppo, maschere, origami, render 3D, auto, draghi e fotografia di maternità. Alcuni esempi sono forniti nelle illustrazioni.

  • HelloWorld 6.0 include intenzionalmente alcune immagini di bassa qualità nel training per migliorare la risposta del modello ai prompt negativi. Si consiglia di utilizzare i seguenti termini nei prompt negativi: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".

  • Il corpo principale del training set di HelloWorld 6.0 usa il tagging GPT4v. Per le immagini che GPT4v non può taggare, si usa cogVQA guidato da blip2-opt-6.7b per il tagging. Lo stile del linguaggio di tag di questi modelli multimodali differisce significativamente dal tagger tradizionale WD1.4. Per facilitare una più accurata attivazione di diversi concetti nel training set, ho compilato le prime 250 parole tag ad alta frequenza dal training set di HelloWorld 6.0. È possibile visualizzare queste parole ad alta frequenza in questo documento.

Infine, sebbene SD3 stia per essere rilasciato, aggiornerò comunque a HelloWorld XL 7.0, sperando di ottenere miglioramenti maggiori nella versione 7.0!

Precedente
LEOSAMs HelloWorld XL - HelloWorld XL 70
Successivo
Vixons Comic Styles - Budd Root

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

SDXL 1.0

Versione del modello

HelloWorld XL 6.0

Hash del modello

8ca0bade3c

Creatore

Discussione

Per favore log in per lasciare un commento.

Immagini di LEOSAMs HelloWorld XL - HelloWorld XL 60

Uno scheletro traslucido di una sirena sott'acqua con tonalità blu spettrali, che mostra ossa dettagliate e uno stile raggi X, su sfondo oscuro dell'oceano.
Donna indiana tradizionale in saree verde e crema, creata utilizzando stable diffusion.
Immagine generata da AI usando Stable Diffusion di una donna vestita con un tradizionale sari verde e bianco con i capelli intrecciati, che indossa gioielli tradizionali.
Una bella donna indiana in un sari tradizionale con una combinazione di colori bianco e arancione, generata da AI usando stable diffusion.
Immagine generata da AI usando Stable Diffusion di una donna con capelli biondi e occhi blu intensi
Una bellissima donna con abito tradizionale indiano e treccia, che indossa un sari beige. Immagine generata da AI usando Stable Diffusion.
La piramide dell'hotel Luxor a Las Vegas illuminata da un fascio di luce blu, creata usando Stable Diffusion.
Una donna che indossa una maglietta grigia e leggings in piedi all'interno di un treno ben illuminato, creata usando stable diffusion AI.
Gruppo di giovani donne in abiti alla moda che posano insieme. Immagine generata da AI usando stable diffusion.
Foto di gruppo di giovani donne in vestiti colorati con palloncini sullo sfondo, sottolineando che questa è un'immagine generata da AI usando Stable Diffusion.
Barriera corallina vibrante che circonda una città subacquea con strutture dall'aspetto antico. Immagine generata da AI usando Stable Diffusion.
Immagine generata da AI usando Stable Diffusion che mostra una splendida vista notturna dello skyline di Las Vegas con hotel e casinò luminosi lungo lo strip.

Immagini con modello base

Scena fotorealistica di personaggi non morti tra zombie e scheletri che camminano attraverso un cimitero spettrale illuminato da jack-o'-lantern luminosi sotto un cielo scuro e minaccioso.

Immagini con foto

Un topo realistico che indossa un'armatura d'oro dettagliata e un mantello scuro, in piedi su una strada di ciottoli con illuminazione cinematografica drammatica ed effetti di grana della pellicola.
Una rappresentazione semi-realistica di una danzatrice del ventre esotica con lunghi capelli scuri intrecciati, che indossa un abito verde fluente con gioielli dorati, in piedi in un giardino arabo ornato da vigneti di rose rosa su muri di arenaria.
Una scena stradale urbana scura e drammatica di notte con marciapiedi bagnati che riflettono i lampioni e un cielo tempestoso e minaccioso sopra una città deserta.
Ballerina fotorealistica in posa sulla punta con le braccia estese, che indossa un abito con motivo intricato che forma una spirale di Fibonacci a cascata sotto illuminazione chiaroscuro.
Ritratto ravvicinato di una soldato femmina lupo bianco anthro con occhi rossi intensi, zanne visibili e bocca leggermente aperta che mostra la lingua, indossando un elmetto da soldato in luce naturale.
Una piccola figura di gatto in vetro di colore turchese con grandi occhi e naso rosa, seduta su una mano aperta contro uno sfondo scuro.
Ritratto fotorealistico in primo piano di Elsa con capelli biondi intrecciati, occhi azzurri e illuminazione morbida e realistica.
Una scena surreale dove un fiume fluisce da un olio su tela che raffigura montagne e una nave, che si riversa su un divano beige e si diffonde su un pavimento in legno in un soggiorno caldo.
Ritratto di una ragazza giapponese che indossa un kimono floreale con spalle scoperte e tatuaggi neri dettagliati, i suoi capelli decorati con fiori vivaci e petali cadenti, ambientata su uno sfondo di lago sereno con morbida luce controluce.
Primo piano del profilo laterale di una giovane modella di moda con capelli neri fino alle spalle e occhi verdi, che indossa un blazer beige a righe sottili e posa con un'espressione impassibile in luce naturale con bagliore solare

Immagini con fotorealistico

Ritratto a figura intera di una donna con capelli rossi e lentiggini che indossa un abito lungo giallo senape con maniche corte arricciate, in piedi tra le foglie della giungla su uno sfondo scuro.
Husky siberiano fotorealistico che indossa mimetica da spec-ops innevata e si trova in una foresta di pini innevata con riflessi di luce.
Primo piano fotorealistico di donna metà umana metà cyborg in un vivace accappatoio rosso che tiene due spade samurai in una città noir anni '40, scura e fumosa.
Fotografia macro che mostra gambi di fiori selvatici in silhouette contro un grande tramonto arancione con sfere di luce bokeh sullo sfondo.
Silhouette di un uomo che indossa una corona di spine bioluminescente luminosa con luci viola su sfondo blu scuro.
Illustrazione digitale fotorealistica di una camera da letto futuristica con proiezione olografica di un personaggio a tema spaziale in toni blu sopra il letto ornato, con una donna in un abito futuristico elegante seduta sul letto in una stanza lussuosa con pareti blu e vista sulla città.
Personaggio bambola creepy-cute con arti cuciti, occhi a bottone e capelli rosa gemelli legati con nastri neri, indossa un abito verde e un grande papillon rosa, con la mano dietro la testa, in piedi contro uno sfondo testurizzato turchese e beige.
Una tazza da caffè Starbucks luminosa che emette scintille viola e ciano e vapore in un ambiente scuro.