Fotografia Amatoriale [Flux Dev] - v2.0
Parole Chiave e Tag Correlati
Prompt Consigliati
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
2005 blog
Parametri Consigliati
samplers
steps
cfg
resolution
other models
Parametri Consigliati per Alta Risoluzione
upscaler
upscale
steps
Suggerimenti
Devi sperimentare con il peso Lora basandoti sui tuoi prompt; i pesi consigliati variano da 0.3-0.5 a 0.6-1 a seconda della versione.
I prompt dettagliati relativi alla fotografia indirizzano meglio il modello; usa termini come foto, photograph o includi tipi di fotocamere o date.
Se sorgono problemi con mani, testo, persone sullo sfondo o texture della pelle, prova a ridurre il peso Lora.
Puoi anche generare direttamente a risoluzioni più alte come 1344x1728 se il tuo setup lo permette.
Le didascalie del dataset sono state create usando GPT4o; le didascalie dettagliate danno i migliori risultati.
Punti Salienti della Versione
Prompt GPT4o:
Sto pianificando di addestrare un LoRA per il modello stable diffusion testo-immagine, che utilizza il trasformatore T5XXL nella sua architettura. I prompt devono essere in linguaggio naturale e seguire un formato specifico. Caricherò immagini e ho bisogno del tuo aiuto per creare prompt dettagliati basati su quelle immagini. I prompt devono iniziare con "Fotografia amatoriale di" e terminare con "su flickr nel 2007, 2005 blog, 2007 blog." Forniscimi sempre il prompt in un unico paragrafo.Il formato deve essere:Descrizione del soggetto: Inizia descrivendo tutte le persone nell'immagine in dettaglio. È molto importante includere la loro razza ed etnia, attributi fisici (come altezza, corporatura, tono della pelle e colore dei capelli), caratteristiche facciali, abbigliamento e qualsiasi espressione o posa che assumono. Sii il più specifico possibile. Assicurati di includere sempre la corporatura dei soggetti (es. taglia grande, snella, minuta) senza dimenticarla.Descrizione della scena: Trasmetti accuratamente cosa stanno facendo esattamente le persone nella foto. Descrivi l'ambientazione, gli elementi di sfondo, eventuali oggetti con cui interagiscono e l'ambiente generale (urbano, rurale, interno, esterno, ecc.).Tag di qualità immagine: Includi tag descrittivi che evidenziano la qualità dell'immagine. Usa termini come leggero mosso, sfondo affollato, toni caldi, luce naturale intensa, alto contrasto, colori vividi, ecc. Questi tag devono riflettere anche l'atmosfera e la sensazione dell'immagine.Il risultato finale deve combinare tutti questi elementi in un prompt coerente e dettagliato che rifletta accuratamente l'immagine.Ciao a tutti, per favore leggete questo prima di usare la Lora
Impostazioni Consigliate (v6):
Scala CFG Distillata: 3.5
Metodo di campionamento e Tipo di programma: DEIS con DDIM
Passaggi: 20
Risoluzione: 896x1152
Modello Hires fix: 4x_NMKD-Superscale-SP_178000_G
Passaggi: 10
Denoise: 0.3
Upscale di: 1.5
Peso Lora: 0.8. Devi sperimentare in base ai tuoi prompt
Impostazioni Consigliate (v5-final):
Scala CFG Distillata: 2.5 a 4
Metodo di campionamento e Tipo di programma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passaggi: >=20 (A volte uso 20, 30, 35 o 40 - Dovresti verificare a quanti passaggi l'immagine converge - Perciò, sperimenta autonomamente)
Risoluzione: 896x1152 (Ho fatto in modo che funzioni a questa risoluzione dato che alcuni di voi non l'hanno gradito quando ho detto di generare ad alte risoluzioni) - Ma devi usare hiresfix. Di seguito le impostazioni usate nei miei esempi di immagini
Hires. fix: 4x ultrasharp, 0.4 denoise, 10 passaggi (Non sono il migliore nell'upscale. Se hai altri metodi di upscaling, puoi usarli)
Puoi anche generare direttamente a 1344x1728 se puoi
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8, Q4 o altri quant)
Peso Lora: 0.3-0.5. Devi sperimentare in base ai tuoi prompt
Prompt Positivo: Non serve una parola chiave trigger. Ma devi usare termini fotografici per dirigere Flux (come photo, photograph ecc.). Puoi partire da quelli qui sotto. È come ho etichettato il dataset di addestramento
Foto a figura intera di
Foto a mezzo busto di
Selfie di
Foto in primo piano di
O qualunque cosa tu voglia (adatta i passaggi, il peso in base al tuo prompt). I prompt dettagliati funzionano ancora meglio
Problemi: Se accade, riduci il peso
Mani
Testo
Persone sullo sfondo
Texture della pelle - non è perfetta. Anche a me non piace. Sto cercando modi per migliorarla
Vorrei ringraziare tutti coloro che hanno donato a Buzz e reso possibile questa versione. Menzioni onorevoli:
plectrudecatastrophe
Paper_Cranes
congo2008
Impostazioni Consigliate (v4-soap-testing e v5-beta):
Scala CFG Distillata: 2.5 a 4
Metodo di campionamento e Tipo di programma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passaggi: >=20 (A volte uso 20, 30, 35 o 40 - Dovresti verificare a quanti passaggi l'immagine converge - Perciò, sperimenta autonomamente)
Risoluzione: 1344x1728 o 1248x1824 o 1440x1800. 896x1152 funziona ugualmente ma devi usare hires fix
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8, Q4 o altri quant)
Peso Lora: 0.3-0.5 è l'intervallo ideale
Prompt Positivo: Queste 2 versioni non necessitano di parola trigger. Puoi usare foto di, puoi usare photograph of, puoi usare Shot on iPhone photo of, puoi usare This Image features o qualunque cosa tu voglia (vedi gli esempi postati da altri - alcuni usano vari tipi di prompt e ottengono comunque buoni risultati) ma dopo molti test, ho avuto ottimi risultati con la parola trigger che ho aggiunto a destra in questa pagina. Se vuoi usarla, puoi farlo, altrimenti usa qualunque cosa desideri. Ricorda che il dataset è stato ancora sottotitolato usando GPT4O quindi prompt dettagliati danno sempre i migliori risultati
Vorrei ringraziare tutti coloro che hanno donato a Buzz e reso possibile questa versione. Menzioni onorevoli:
kudzueye
Impostazioni Consigliate (v3 e v2):
Scala CFG Distillata: 2.5 a 4
Metodo di campionamento e Tipo di programma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passaggi: >=20 (A volte uso 20, 30, 35 o 40 - Dovresti verificare a quanti passaggi l'immagine converge - Perciò, sperimenta autonomamente)
Risoluzione: 896x1152 o 1152x896 o 1024x1024 (Puoi generare anche a risoluzioni più alte di queste. Flux e questa lora possono gestirlo)
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8, Q4 o altri quant)
Peso Lora: 0.6-1
Prompt Positivo: Se altri prompt funzionano per te con questa Lora, usali pure. Sto solo evidenziando come testo la Lora. Ho visto molte immagini qui e su Reddit dove le persone usano diversi tipi di prompt
Inizia sempre con "Fotografia amatoriale di" e termina con "su flickr nel 2007, 2005 blog, 2007 blog"
Il prompt dovrebbe essere in questo formato per ottenere i migliori risultati: Fotografia amatoriale di <Descrizione del soggetto>, <Descrizione della scena>, <Tag di qualità immagine>, su flickr nel 2007, 2005 blog, 2007 blog
Come è stato sottotitolato il Dataset?:
Ho sottotitolato il dataset di addestramento usando GPT4o. I didascalie dettagliate funzionano meglio con questa Lora
Se ti piace questa lora e puoi donare a Buzz, è molto apprezzato
Se non ti piace e hai un feedback costruttivo, lascia un commento spiegando dove ha difficoltà e cercherò di correggerlo nella prossima versione
Se non hai alcun riscontro costruttivo da condividere e vuoi solo lamentarti di questa Lora, porta altrove i tuoi commenti
Dettagli del Modello
Tipo di modello
Modello base
Versione del modello
Hash del modello
Parole addestrate
Creatore
Discussione
Per favore log in per lasciare un commento.






