Fotografia amatoriale [Flux Dev] - v4-soap-testing
Parole Chiave e Tag Correlati
Prompt Consigliati
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,photo,photograph,Shot on iPhone photo of,This Image features
Prompt Negativi Consigliati
Hands,Text,People in the background,Skin texture
Parametri Consigliati
samplers
steps
cfg
resolution
other models
Parametri Consigliati per Alta Risoluzione
upscaler
upscale
steps
Suggerimenti
Devi sperimentare con il peso Lora in base ai tuoi prompt; le gamme tipiche sono 0.3-0.5 o 0.6-1 a seconda della versione.
Se si verificano problemi (come con mani, testo, persone sullo sfondo o texture della pelle), riduci il peso Lora.
I prompt dettagliati funzionano meglio, specialmente quelli didascalizzati usando GPT4o.
Non è necessariamente necessaria una parola trigger ma usare termini legati alla fotografia aiuta a dirigere il modello.
Controlla a quanti passi l'immagine converge e sperimenta tu stesso per i migliori risultati.
Punti Salienti della Versione
(Leggi la descrizione del modello) - Non so se è buona quindi l'ho contrassegnata come "testing". Puoi provare se vuoi o restare con v3 o v2. Se vuoi usarla, raccomando FORTEMENTE di generare a 1344x1728 (dà i migliori risultati) o 1728x1344. Se è lento per te, genera a 896x1152 (dà i migliori risultati) o 1152x896 e usa hires fix
Ciao a tutti, per favore leggete questo prima di usare la Lora
Impostazioni consigliate (v6):
Scala CFG distillata: 3.5
Metodo di campionamento e tipo di schema: DEIS con DDIM
Passi: 20
Risoluzione: 896x1152
Modello hires fix: 4x_NMKD-Superscale-SP_178000_G
Passi: 10
Denoise: 0.3
Upscale di: 1.5
Peso Lora: 0.8. Devi sperimentare in base ai tuoi prompt
Impostazioni consigliate (v5-final):
Scala CFG distillata: da 2.5 a 4
Metodo di campionamento e tipo di schema: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passi: >=20 (A volte uso 20 o 30 o 35 o 40 - Devi verificare a quanti passi l'immagine converge - Quindi, sperimenta tu stesso)
Risoluzione: 896x1152 (Ho verificato che funziona a questa risoluzione visto che alcuni di voi non volevano usarla ad alta risoluzione) - Ma devi usare hiresfix. Di seguito le impostazioni usate nei miei esempi
Correzione hires: 4x ultrasharp, denoise 0.4, 10 passi (Non sono il migliore con l'upscale. Se hai altri metodi di upscale, puoi usarli)
Puoi anche generare direttamente a 1344x1728 se puoi
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8 o Q4 o altri quant)
Peso Lora: 0.3-0.5. Devi sperimentare in base ai tuoi prompt
Prompt positivo: Non serve una parola trigger. Però devi usare alcuni termini fotografici per indirizzare Flux (come foto, fotografia ecc.). Puoi iniziare con i seguenti. È come ho etichettato il dataset di addestramento
Foto a figura intera di
Foto a mezza figura di
Selfie di
Foto ravvicinata di
O qualunque cosa tu voglia (regola passi, peso in base al tuo prompt). I prompt dettagliati funzionano meglio
Problemi: Se succede, per favore riduci il peso
Mani
Testo
Persone sullo sfondo
Texture della pelle - non è perfetta. Non mi piace nemmeno a me. Sto cercando modi per migliorare
Vorrei ringraziare tutti coloro che hanno donato a Buzz e reso possibile questa versione. Menzioni onorevoli:
plectrudecatastrophe
Paper_Cranes
congo2008
Impostazioni consigliate (v4-soap-testing e v5-beta):
Scala CFG distillata: da 2.5 a 4
Metodo di campionamento e tipo di schema: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passi: >=20 (A volte uso 20 o 30 o 35 o 40 - Devi verificare a quanti passi l'immagine converge - Quindi, sperimenta tu stesso)
Risoluzione: 1344x1728 o 1248x1824 o 1440x1800. 896x1152 funziona anch'esso ma devi usare hires fix
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8 o Q4 o altri quant)
Peso Lora: 0.3-0.5 è il valore ideale
Prompt positivo: Queste 2 versioni non necessitano di parola trigger. Puoi usare foto di, puoi usare fotografia di, puoi usare Foto scattata con iPhone di, puoi usare Questa immagine presenta o qualunque cosa tu voglia (vedi esempi postati da altri - alcuni usano prompt differenti e ottengono comunque buoni risultati) ma dopo molti test, ho avuto ottimi risultati con la parola trigger che ho aggiunto sul lato destro di questa pagina. Se vuoi usarla, puoi, altrimenti usa qualunque cosa tu voglia. Ricorda, il dataset è ancora didascalizzato usando GPT4O quindi i prompt dettagliati danno sempre i migliori risultati
Vorrei ringraziare tutti coloro che hanno donato a Buzz e reso possibile questa versione. Menzione onorevole:
kudzueye
Impostazioni consigliate (v3 e v2):
Scala CFG distillata: da 2.5 a 4
Metodo di campionamento e tipo di schema: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passi: >=20 (A volte uso 20 o 30 o 35 o 40 - Devi verificare a quanti passi l'immagine converge - Quindi, sperimenta tu stesso)
Risoluzione: 896x1152 o 1152x896 o 1024x1024 (Puoi generare anche a risoluzioni più alte. Flux e questa lora lo possono gestire)
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8 o Q4 o altri quant)
Peso Lora: 0.6-1
Prompt positivo: Se altri prompt funzionano per te con questa Lora, usali pure. Io sto solo evidenziando come testo la Lora. Ho visto diverse immagini qui e su Reddit dove le persone usano diversi tipi di prompt
Inizia sempre con "Fotografia amatoriale di" e termina con "su flickr nel 2007, blog 2005, blog 2007"
Il prompt dovrebbe essere in questo formato per ottenere i migliori risultati: Fotografia amatoriale di <Descrizione del soggetto>, <Descrizione della scena>, <Tag qualità immagine>, su flickr nel 2007, blog 2005, blog 2007
Come è stato didascalizzato il dataset?:
Ho didascalizzato il dataset di addestramento usando GPT4o. Didascalie dettagliate funzionano meglio con questa Lora
Se ti piace questa lora e puoi fare una donazione a Buzz, è molto apprezzato
Se non ti piace e hai feedback costruttivi, lascia un commento spiegando dove ha difficoltà e cercherò di correggerli nella prossima versione
Se non hai feedback costruttivi da condividere e vuoi solo lamentarti di questa Lora, porta i tuoi commenti altrove
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Parole addestrate
Creatore
Discussione
Per favore log in per lasciare un commento.






