modelli/LEOSAMs HelloWorld XL - HelloWorld XL 60

LEOSAMs HelloWorld XL - HelloWorld XL 60

|
5/20/2025
|
1:39:33 PM
| Discussion|
0
Uno scheletro traslucido di una sirena sott'acqua con tonalità blu spettrali, che mostra ossa dettagliate e uno stile raggi X, su sfondo oscuro dell'oceano.
Donna indiana tradizionale in saree verde e crema, creata utilizzando stable diffusion.
Immagine generata da AI usando Stable Diffusion di una donna vestita con un tradizionale sari verde e bianco con i capelli intrecciati, che indossa gioielli tradizionali.
Una bella donna indiana in un sari tradizionale con una combinazione di colori bianco e arancione, generata da AI usando stable diffusion.
Immagine generata da AI usando Stable Diffusion di una donna con capelli biondi e occhi blu intensi
Una bellissima donna con abito tradizionale indiano e treccia, che indossa un sari beige. Immagine generata da AI usando Stable Diffusion.
La piramide dell'hotel Luxor a Las Vegas illuminata da un fascio di luce blu, creata usando Stable Diffusion.
Una donna che indossa una maglietta grigia e leggings in piedi all'interno di un treno ben illuminato, creata usando stable diffusion AI.
Gruppo di giovani donne in abiti alla moda che posano insieme. Immagine generata da AI usando stable diffusion.
Foto di gruppo di giovani donne in vestiti colorati con palloncini sullo sfondo, sottolineando che questa è un'immagine generata da AI usando Stable Diffusion.
Barriera corallina vibrante che circonda una città subacquea con strutture dall'aspetto antico. Immagine generata da AI usando Stable Diffusion.
Immagine generata da AI usando Stable Diffusion che mostra una splendida vista notturna dello skyline di Las Vegas con hotel e casinò luminosi lungo lo strip.

Prompt Consigliati

conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic

film grain texture

analog photography aesthetic

Prompt Negativi Consigliati

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

low quality,jpeg artifacts,blurry,poorly drawn,ugly,worst quality

Parametri Consigliati

samplers

Restart

steps

27 - 30

cfg

7 - 8

resolution

832x1344, 832x1260

other models

LeosamHelloWorldV6 (8ca0bade3c)

Parametri Consigliati per Alta Risoluzione

upscaler

ESRGAN_4x

upscale

1.5

steps

27 - 30

denoising strength

0.3

Suggerimenti

Usa ADetailer per correggere i volti in lontananza.

Usa prompt in linguaggio naturale semplice per foto AI realistiche migliori.

I ritratti di alta qualità possono essere migliorati con ADetailer e correzione Hires 1.5x a intensità 0.3.

Punti Salienti della Versione

Aggiornamento HelloWorld 6.0 - 20 Aprile 2024

Grazie per la pazienza. Ho cercato lavoro recentemente, il che ha causato alcuni ritardi negli aggiornamenti di HelloWorld. Ecco i principali aggiornamenti nella versione 6.0:

  • HelloWorld 6.0 è un miglioramento iterativo basato sulla versione 5.0. Dai miei test, l'effetto realismo non differisce significativamente dalla versione 5.0. Il vantaggio principale della versione 6.0 risiede nella sua più ampia copertura di concetti nel training set. Secondo i feedback, sono stati migliorati vari temi inclusi surrealismo, boudoir, foto di gruppo, maschere, origami, render 3D, auto, draghi e fotografia di maternità. Alcuni esempi sono forniti nelle illustrazioni.

  • HelloWorld 6.0 include intenzionalmente alcune immagini di bassa qualità nel training per migliorare la risposta del modello ai prompt negativi. Si consiglia di utilizzare i seguenti termini nei prompt negativi: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".

  • Il corpo principale del training set di HelloWorld 6.0 usa il tagging GPT4v. Per le immagini che GPT4v non può taggare, si usa cogVQA guidato da blip2-opt-6.7b per il tagging. Lo stile del linguaggio di tag di questi modelli multimodali differisce significativamente dal tagger tradizionale WD1.4. Per facilitare una più accurata attivazione di diversi concetti nel training set, ho compilato le prime 250 parole tag ad alta frequenza dal training set di HelloWorld 6.0. È possibile visualizzare queste parole ad alta frequenza in questo documento.

Infine, sebbene SD3 stia per essere rilasciato, aggiornerò comunque a HelloWorld XL 7.0, sperando di ottenere miglioramenti maggiori nella versione 7.0!

Sponsor del Creatore

🖥️Benvenuti a provare l'open-source GPT4V-Image-Captioner, sviluppato da me e dal mio amico. Offre un'installazione con un clic ed è integrato con molteplici funzionalità tra cui pre-compressione delle immagini, tagging delle immagini e statistiche sui tag. Recentemente abbiamo anche lanciato la versione plugin webui di questo strumento, tutti sono invitati a utilizzarla!

🌍欢迎加入QQ群'兔狲·AIGC梦工北厂',群号 :780132897 ;'兔狲·AIGC梦工南厂',群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1

🖥️Benvenuti a provare l'open-source GPT4V-Image-Captioner, sviluppato da me e dal mio amico. Offre un'installazione con un clic ed è integrato con molteplici funzionalità tra cui pre-compressione delle immagini, tagging delle immagini e statistiche sui tag. Recentemente abbiamo anche lanciato la versione plugin webui di questo strumento, tutti sono invitati a utilizzarla!

🌍欢迎加入QQ群"兔狲·AIGC梦工北厂",群号 :780132897 ;"兔狲·AIGC梦工南厂",群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1

📖Aggiornamento HelloWorld 7.0 - 13 Giugno 2024

Sintesi dell'aggiornamento in una frase: HelloWorld 7.0 è una versione ottimizzata iterativamente, con la migliore resa corporea dell'intera serie, e un ulteriore ampliamento dell'ambito concettuale e della ricchezza di dettagli.

Dettagli dell'aggiornamento:

  1. Aggiungendo immagini negative nel training, rafforzando l'allenamento delle pose e ottimizzando il modello clip, è stata migliorata la precisione di arti e mani rispetto alle versioni precedenti. Le parole negative consigliate sono: "bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality".

  2. Estratto il LoRA fine-tuned dal modello SPO ufficiale e incorporato in HelloWorld 7.0. SPO è un ulteriore miglioramento del metodo DPO. Il modello base SPO è usato per prestazioni migliori rispetto al modello base DPO XL e al modello base SDXL originale. Lo SPO LoRA può migliorare i dettagli e il contrasto dell'immagine e abbellirle. Grazie al team tecnico dietro SPO.

  3. Continuato ad espandere l'ambito concettuale del training set, ma ottimizzato e snellito il training set (il fine-tuning di grandi set è troppo costoso, e H800 è difficile da noleggiare recentemente, non si può permettere il tempo locale di training). L'attuale training set totale è di 20.821 immagini. La distribuzione delle risoluzioni del training set è la seguente, e si consiglia di usare diverse risoluzioni con maggior numero di immagini per l'output:

    (832, 1248) - Numero: 7128
    (896, 1152) - Numero: 6250
    (1248, 832) - Numero: 2402
    (1024, 1024) - Numero: 1639
    (1360, 768) - Numero: 928
    (1152, 896) - Numero: 870
    (768, 1360) - Numero: 432
    (960, 1088) - Numero: 506
    (992, 1056) - Numero: 162
    (1088, 960) - Numero: 140
    (704, 1472) - Numero: 120
    (1056, 992) - Numero: 122
    (1472, 704) - Numero: 115
    (1632, 640) - Numero: 75
    (640, 1632) - Numero: 12
  4. Usato GPT4O per ri-etichettare tutti i dataset. Questa volta è stato utilizzato un metodo di etichettatura strutturato, con la struttura specifica: "descrizione riassuntiva in una frase + multipli tag di elementi dell'immagine + ispirato da XXX + parole descrittive della qualità estetica", dove le parole descrittive della qualità estetica sono divise in cinque livelli: worst quality, low quality, average quality, best quality e masterpiece. Un esempio tipico di etichettatura è il seguente:

    conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic, inspired by salvador dalí's surrealist works, masterpiece

La "Lista Parole Tag ad Alta Frequenza" e la "Lista Stili Artistici ad Alta Frequenza" coinvolte in Inspired by XXX per la versione HelloWorld 7.0 saranno fornite solo agli utenti con licenza commerciale. I partner che hanno acquistato l'autorizzazione al modello della serie HelloWorld XL in passato, per favore contattatemi in caso di omissioni per riceverla gratuitamente.

I giocatori possono fare riferimento alla Lista Parole Tag ad Alta Frequenza di HelloWorld 6.0. Inoltre, ho fornito più di 150 immagini esemplificative di alta qualità di HelloWorld 7.0 nella galleria, che possono essere usate come riferimento per l'output di tutti. La creazione di modelli non è semplice, grazie ai giocatori per la comprensione e la tolleranza!

📖Aggiornamento HelloWorld 6.0 - 20 Aprile 2024

LEOSAM HelloWorld 6.0 Top 250 Lista Parole Tag ad Alta Frequenza

Grazie per la pazienza. Ho cercato lavoro recentemente, il che ha causato alcuni ritardi negli aggiornamenti di HelloWorld. Ecco i principali aggiornamenti nella versione 6.0:

  • HelloWorld 6.0 è un miglioramento iterativo basato sulla versione 5.0. Dai miei test, l'effetto realismo non differisce significativamente dalla versione 5.0. Il vantaggio principale della versione 6.0 risiede nella sua più ampia copertura di concetti nel training set. Secondo i feedback, sono stati migliorati vari temi inclusi surrealismo, boudoir, foto di gruppo, maschere, origami, render 3D, auto, draghi e fotografia di maternità. Alcuni esempi sono forniti nelle illustrazioni.

  • HelloWorld 6.0 include intenzionalmente alcune immagini di bassa qualità nel training per migliorare la risposta del modello ai prompt negativi. Si consiglia di utilizzare i seguenti termini nei prompt negativi: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".

  • Il corpo principale del training set di HelloWorld 6.0 usa il tagging GPT4v. Per le immagini che GPT4v non può taggare, si usa cogVQA guidato da blip2-opt-6.7b per il tagging. Lo stile del linguaggio di tag di questi modelli multimodali differisce significativamente dal tagger tradizionale WD1.4. Per facilitare una più accurata attivazione di diversi concetti nel training set, ho compilato le prime 250 parole tag ad alta frequenza dal training set di HelloWorld 6.0. È possibile visualizzare queste parole ad alta frequenza in questo documento.

Infine, sebbene SD3 stia per essere rilasciato, aggiornerò comunque a HelloWorld XL 7.0, sperando di ottenere miglioramenti maggiori nella versione 7.0!

Precedente
LEOSAMs HelloWorld XL - HelloWorld XL 70
Successivo
Vixons Comic Styles - Budd Root

Dettagli del Modello

Tipo di modello

Checkpoint

Modello base

SDXL 1.0

Versione del modello

HelloWorld XL 6.0

Hash del modello

8ca0bade3c

Creatore

Discussione

Per favore log in per lasciare un commento.

Immagini di LEOSAMs HelloWorld XL - HelloWorld XL 60

Immagini con modello base

Immagini con foto

Immagini con fotorealistico