Fotografia Amatoriale [Flux Dev] - v1.0
Parole Chiave e Tag Correlati
Prompt Consigliati
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
Parametri Consigliati
samplers
steps
cfg
resolution
other models
Parametri Consigliati per Alta Risoluzione
upscaler
upscale
steps
Suggerimenti
Devi sperimentare con il Peso Lora in base ai tuoi prompt; i pesi consigliati variano da 0.3-0.5 a 0.6-1 a seconda della versione.
I prompt dettagliati legati alla fotografia indirizzano meglio il modello; usa termini come foto, fotografia o includi tipi di fotocamere o date.
Se si presentano problemi con mani, testi, persone sullo sfondo o texture della pelle, prova a ridurre il peso Lora.
Puoi anche generare direttamente a risoluzioni più alte come 1344x1728 se il tuo setup lo permette.
I caption del dataset sono stati creati usando GPT4o; i caption dettagliati forniscono i migliori risultati.
Ciao a tutti, per favore leggete questo prima di usare la Lora
Impostazioni consigliate (v6):
Scala CFG Distillata: 3.5
Metodo di campionamento e tipo di schedule: DEIS con DDIM
Passi: 20
Risoluzione: 896x1152
Modello Hires fix: 4x_NMKD-Superscale-SP_178000_G
Passi: 10
Denoise: 0.3
Upscale di: 1.5
Peso Lora: 0.8. Devi sperimentare in base ai tuoi prompt
Impostazioni consigliate (v5-final):
Scala CFG Distillata: da 2.5 a 4
Metodo di campionamento e tipo di schedule: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passi: >=20 (A volte uso 20 o 30 o 35 o 40 - Devi verificare a quanti passi l'immagine converge - Quindi, sperimenta tu stesso)
Risoluzione: 896x1152 (Ho verificato che funzioni a questa risoluzione dato che alcuni di voi non erano contenti quando dicevo di generare ad alta risoluzione) - Ma devi usare hiresfix. Qui sotto le impostazioni che ho usato nei miei esempi
Hires. fix: 4x ultrasharp, denoise 0.4, 10 passi (Non sono il miglior esperto di upscale. Se hai altri metodi di upscale, puoi usarli)
Puoi anche generare direttamente a 1344x1728 se riesci
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8 o Q4 o altri quant)
Peso Lora: 0.3-0.5. Devi sperimentare in base ai tuoi prompt
Prompt positivo: Non serve una parola trigger. Ma devi usare alcuni termini fotografici per guidare Flux (come foto, fotografia, ecc.). Puoi iniziare con quelli sotto. È come ho etichettato il dataset di training
Foto a figura intera di
Foto a mezzo busto di
Selfie di
Foto ravvicinata di
O quel che vuoi (adatta passi e peso in base al tuo prompt). I prompt dettagliati funzionano ancora meglio
Problemi: Se succedono, riduci il peso
Mani
Testo
Persone sullo sfondo
Texture della pelle - non è perfetta. Nemmeno a me piace. Sto cercando modi per migliorarla
Vorrei ringraziare tutti quelli che hanno donato a Buzz e reso possibile questa versione. Menzioni d'onore:
plectrudecatastrophe
Paper_Cranes
congo2008
Impostazioni consigliate (v4-soap-testing e v5-beta):
Scala CFG Distillata: da 2.5 a 4
Metodo di campionamento e tipo di schedule: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passi: >=20 (A volte uso 20 o 30 o 35 o 40 - Devi controllare a quanti passi l'immagine converge - Quindi, sperimenta da solo)
Risoluzione: 1344x1728 o 1248x1824 o 1440x1800. 896x1152 funziona anche ma devi usare hires fix
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8 o Q4 o altri quant)
Peso Lora: 0.3-0.5 è il range ideale
Prompt positivo: Queste 2 versioni non hanno bisogno di parola trigger. Puoi usare "foto di", puoi usare "fotografia di", puoi usare "Shot on iPhone photo of", puoi usare "This Image features" oppure qualsiasi cosa tu voglia (vedi gli esempi postati da altri - alcuni usano tipi diversi di prompt e ottengono comunque buoni risultati) ma dopo molti test, ho avuto ottimi risultati con la parola trigger che ho aggiunto a destra in questa pagina. Se vuoi usarla, puoi farlo altrimenti usa quel che vuoi. Ricorda che il dataset è ancora captionato usando GPT4O quindi i prompt dettagliati danno sempre i migliori risultati
Vorrei ringraziare tutti quelli che hanno donato a Buzz e reso possibile questa versione. Menzioni d'onore:
kudzueye
Impostazioni consigliate (v3 e v2):
Scala CFG Distillata: da 2.5 a 4
Metodo di campionamento e tipo di schedule: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passi: >=20 (A volte uso 20 o 30 o 35 o 40 - Devi vedere a quanti passi l'immagine converge - Quindi sperimenta da solo)
Risoluzione: 896x1152 o 1152x896 o 1024x1024 (Puoi generare anche a risoluzioni più alte. Flux e questa lora lo supportano)
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8 o Q4 o altri quant)
Peso Lora: 0.6-1
Prompt positivo: Se altri prompt funzionano per te con questa Lora, usali. Sto solo mostrando come testo la Lora. Ho visto diverse immagini qui e su Reddit dove la gente usa tipi diversi di prompt
Inizia sempre con "Fotografia amatoriale di" e termina con "su flickr nel 2007, blog 2005, blog 2007"
Il prompt dovrebbe essere in questo formato per ottenere i migliori risultati: Fotografia amatoriale di <Descrizione del soggetto>, <Descrizione della scena>, <Tag della qualità dell'immagine>, su flickr nel 2007, blog 2005, blog 2007
Come è stato captionato il Dataset?:
Ho captionato il dataset di training usando GPT4o. I caption dettagliati funzionano meglio con questa Lora
Se ti piace questa lora e puoi donare a Buzz, è molto apprezzato
Se non ti piace e hai feedback costruttivi, lascia un commento spiegando dove trova difficoltà e cercherò di risolverli nella prossima versione
Se non hai feedback costruttivi da condividere e vuoi solo lamentarti di questa Lora, porta altrove i tuoi commenti
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Parole addestrate
Creatore
Discussione
Per favore log in per lasciare un commento.






