modelli/Fotografia Amatoriale [Flux Dev] - v5-beta

Fotografia Amatoriale [Flux Dev] - v5-beta

7/16/2025

2:19:21 AM

Parole Chiave e Tag Correlati

fotografia amatoriale,scala cfg,flux.1 d,correzione alta risoluzione,generazione di immagini,lora,peso lora,fotorealismo,fotorealistico,realistico,stable diffusion,stile

Un orso polare in piedi sul bordo di un iceberg nevoso in acque artiche calme sotto un cielo coperto.

Foto nitida di una turista donna nella Florida Centrale con maglietta di Topolino e pantaloncini, appoggiata a una palma in una giornata soleggiata in un quartiere residenziale.

Casa gialla suburbana a due piani in Florida circondata da acqua alta di alluvione, con palme riflesse sulla superficie dell'acqua.

Uomo vestito da mago con lunga barba bianca, cappello a punta floreale e tunica verde che tiene un bastone di legno in una festa affollata in soggiorno con divani, palloncini e bottiglie di birra sul pavimento.

Prompt Consigliati

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

Parametri Consigliati

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, DEIS, [Forge] Flux Realistic (Slow)

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 1824x1248, 1344x1728, 1248x1824

other models

amateurphoto-version5-gm (d9ccc813e4d8), flux1-dev-Q8_0 (52cfce60d7)

Parametri Consigliati per Alta Risoluzione

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

Suggerimenti

Devi sperimentare con il peso Lora in base ai tuoi prompt; i pesi consigliati variano da 0.3-0.5 a 0.6-1 a seconda della versione.

Prompt dettagliati relativi alla fotografia guidano meglio il modello; usa termini come foto, fotografia, oppure includi tipi di fotocamere o date.

Se sorgono problemi con mani, testo, persone sullo sfondo o texture della pelle, prova a ridurre il peso Lora.

Puoi anche generare direttamente a risoluzioni più alte come 1344x1728 se il tuo setup lo permette.

I sottotitoli del dataset sono stati creati usando GPT4o; sottotitoli dettagliati danno i migliori risultati.

Punti Salienti della Versione

Piccoli miglioramenti dalla v4

Ciao a tutti, per favore leggete questo prima di usare la Lora

Impostazioni consigliate (v6):

Scala CFG Distillata: 3.5
Metodo di campionamento e tipo di programma: DEIS con DDIM
Passi: 20
Risoluzione: 896x1152
- Modello hires fix: 4x_NMKD-Superscale-SP_178000_G
- Passi: 10
- Denoise: 0.3
- Upscale di: 1.5
Peso Lora: 0.8. Devi sperimentare in base ai tuoi prompt

Impostazioni consigliate (v5-final):

Scala CFG Distillata: 2.5 a 4
Metodo di campionamento e tipo di programma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Slow) con Beta / DDIM
Passi: >=20 (A volte uso 20 o 30 o 35 o 40 - Devi verificare a quanti passi l'immagine converge - Quindi, sperimenta tu stesso)
Risoluzione: 896x1152 (Ho verificato che funziona a questa risoluzione perché alcuni di voi non gradivano quando dicevo di generare ad alte risoluzioni) - Ma devi usare hiresfix. Di seguito le impostazioni usate nelle mie immagini di esempio
- Hires. fix: 4x ultrasharp, 0.4 denoise, 10 passi (Non sono esperto di upscale. Se hai altri metodi di upscale, puoi usarli)
- Puoi anche generare direttamente a 1344x1728 se puoi
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8 o Q4 o altri quanti)
Peso Lora: 0.3-0.5. Devi sperimentare in base ai tuoi prompt
Prompt Positivo: Non serve nessuna parola trigger. Ma devi usare alcuni termini fotografici per guidare Flux (come foto, fotografia, ecc.). Puoi iniziare con quelli sottostanti. È come ho etichettato il dataset di addestramento
- Foto a figura intera di
- Foto a mezzo busto di
- Selfie di
- Foto ravvicinata di
- O qualunque cosa tu voglia (adatta passi e peso in base al tuo prompt). I prompt dettagliati funzionano meglio

Problemi: Se si presentano, riduci il peso
- Mani
- Testo
- Persone sullo sfondo
- Texture della pelle - non è perfetta. Non mi piace nemmeno a me. Sto cercando modi per migliorarla

Vorrei ringraziare tutti coloro che hanno supportato Buzz e reso possibile questa versione. Menzioni onorevoli:

plectrudecatastrophe
Paper_Cranes
congo2008

Impostazioni consigliate (v4-soap-testing e v5-beta):

Scala CFG Distillata: 2.5 a 4
Metodo di campionamento e tipo di programma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Slow) con Beta / DDIM
Passi: >=20 (A volte uso 20 o 30 o 35 o 40 - Devi verificare a quanti passi l'immagine converge - Quindi, sperimenta tu stesso)
Risoluzione: 1344x1728 o 1248x1824 o 1440x1800. Anche 896x1152 funziona ma devi usare hires fix
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8 o Q4 o altri quanti)
Peso Lora: 0.3-0.5 è il valore ottimale
Prompt Positivo: Queste 2 versioni non hanno bisogno di parola trigger. Puoi usare "foto di", puoi usare "fotografia di", puoi usare "Shot on iPhone photo of", puoi usare "This Image features" o qualunque cosa tu voglia (vedi esempi postati da altri - alcuni usano tipi diversi di prompt e ottengono comunque buoni risultati) ma dopo molti test, ho avuto ottimi risultati con la parola trigger che ho aggiunto a destra in questa pagina. Se vuoi usarla, puoi altrimenti usa quello che vuoi. Ricorda che il dataset è ancora etichettato usando GPT4O quindi i prompt dettagliati danno sempre i migliori risultati

Vorrei ringraziare tutti coloro che hanno supportato Buzz e reso possibile questa versione. Menzione onorevole:

kudzueye

Impostazioni consigliate (v3 e v2):

Scala CFG Distillata: 2.5 a 4
Metodo di campionamento e tipo di programma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Slow) con Beta / DDIM
Passi: >=20 (A volte uso 20 o 30 o 35 o 40 - Devi verificare a quanti passi l'immagine converge - Quindi, sperimenta tu stesso)
Risoluzione: 896x1152 o 1152x896 o 1024x1024 (Puoi generare anche a risoluzioni più alte. Flux e questa lora lo gestiscono bene)
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8 o Q4 o altri quanti)
Peso Lora: 0.6-1
Prompt Positivo: Se altri prompt funzionano per te con questa Lora, usali. Sto solo evidenziando come testo la Lora. Ho visto diverse immagini qui e su Reddit dove le persone utilizzano diversi tipi di prompt
- Inizia sempre con "Fotografia amatoriale di" e termina con "on flickr in 2007, 2005 blog, 2007 blog"
  - Il prompt migliore deve essere in questo formato per ottenere i migliori risultati: Fotografia amatoriale di <Descrizione del soggetto>, <Descrizione della scena>, <Tag qualità immagine>, on flickr in 2007, 2005 blog, 2007 blog

Come è stato etichettato il dataset?:

Ho etichettato il dataset di addestramento usando GPT4o. I sottotitoli dettagliati funzionano meglio con questa Lora

Se ti piace questa lora e puoi fare una donazione a Buzz, è molto apprezzata

Se non ti piace e hai feedback costruttivi, lascia un commento spiegando dove ci sono problemi e cercherò di risolverli nella prossima versione

Se non hai feedback costruttivi da condividere e vuoi solo lamentarti di questa Lora, porta i tuoi commenti altrove

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

ZavyChromaXL - b1

SpaceCraft - Nebulosa Vivace v.2

Usa questo modello