modelli/Fotografia Amatoriale [Flux Dev] - v2.0

Fotografia Amatoriale [Flux Dev] - v2.0

Luca Bianchi

7/19/2025

2:08:16 PM

| Discussion|

Parole Chiave e Tag Correlati

Donna in bikini bianco e occhiali da sole che si rilassa su uno yacht con lo skyline di Miami sullo sfondo sotto un cielo soleggiato

Donna in abito rosso brillante con occhiali da sole neri e capelli vaporosi, in piedi accanto a una Lamborghini rossa sotto luci al neon a Miami di notte.

Donna che indossa un completo bianco e occhiali da sole in piedi davanti a palme di Miami e grattacieli per uffici sotto un cielo azzurro brillante, vista da un'angolazione bassa.

Agente di polizia in stile anni '80 con occhiali da sole e baffi neri, appoggiato a un'auto della polizia bianca a Miami, che tiene una ciambella glassata rosa con palme e un edificio per uffici sullo sfondo.

Prompt Consigliati

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

2005 blog

Parametri Consigliati

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, Heun

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 896x1152

other models

amateurphotov2-000049 (771781fd6719), flux1-dev-Q8_0 (52cfce60d7)

Parametri Consigliati per Alta Risoluzione

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

Suggerimenti

Devi sperimentare con il peso Lora basandoti sui tuoi prompt; i pesi consigliati variano da 0.3-0.5 a 0.6-1 a seconda della versione.

I prompt dettagliati relativi alla fotografia indirizzano meglio il modello; usa termini come foto, photograph o includi tipi di fotocamere o date.

Se sorgono problemi con mani, testo, persone sullo sfondo o texture della pelle, prova a ridurre il peso Lora.

Puoi anche generare direttamente a risoluzioni più alte come 1344x1728 se il tuo setup lo permette.

Le didascalie del dataset sono state create usando GPT4o; le didascalie dettagliate danno i migliori risultati.

Punti Salienti della Versione

Prompt GPT4o:

Sto pianificando di addestrare un LoRA per il modello stable diffusion testo-immagine, che utilizza il trasformatore T5XXL nella sua architettura. I prompt devono essere in linguaggio naturale e seguire un formato specifico. Caricherò immagini e ho bisogno del tuo aiuto per creare prompt dettagliati basati su quelle immagini. I prompt devono iniziare con "Fotografia amatoriale di" e terminare con "su flickr nel 2007, 2005 blog, 2007 blog." Forniscimi sempre il prompt in un unico paragrafo.

Il formato deve essere:

Descrizione del soggetto: Inizia descrivendo tutte le persone nell'immagine in dettaglio. È molto importante includere la loro razza ed etnia, attributi fisici (come altezza, corporatura, tono della pelle e colore dei capelli), caratteristiche facciali, abbigliamento e qualsiasi espressione o posa che assumono. Sii il più specifico possibile. Assicurati di includere sempre la corporatura dei soggetti (es. taglia grande, snella, minuta) senza dimenticarla.

Descrizione della scena: Trasmetti accuratamente cosa stanno facendo esattamente le persone nella foto. Descrivi l'ambientazione, gli elementi di sfondo, eventuali oggetti con cui interagiscono e l'ambiente generale (urbano, rurale, interno, esterno, ecc.).

Tag di qualità immagine: Includi tag descrittivi che evidenziano la qualità dell'immagine. Usa termini come leggero mosso, sfondo affollato, toni caldi, luce naturale intensa, alto contrasto, colori vividi, ecc. Questi tag devono riflettere anche l'atmosfera e la sensazione dell'immagine.

Il risultato finale deve combinare tutti questi elementi in un prompt coerente e dettagliato che rifletta accuratamente l'immagine.

Ciao a tutti, per favore leggete questo prima di usare la Lora

Impostazioni Consigliate (v6):

Scala CFG Distillata: 3.5
Metodo di campionamento e Tipo di programma: DEIS con DDIM
Passaggi: 20
Risoluzione: 896x1152
- Modello Hires fix: 4x_NMKD-Superscale-SP_178000_G
- Passaggi: 10
- Denoise: 0.3
- Upscale di: 1.5
Peso Lora: 0.8. Devi sperimentare in base ai tuoi prompt

Impostazioni Consigliate (v5-final):

Scala CFG Distillata: 2.5 a 4
Metodo di campionamento e Tipo di programma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passaggi: >=20 (A volte uso 20, 30, 35 o 40 - Dovresti verificare a quanti passaggi l'immagine converge - Perciò, sperimenta autonomamente)
Risoluzione: 896x1152 (Ho fatto in modo che funzioni a questa risoluzione dato che alcuni di voi non l'hanno gradito quando ho detto di generare ad alte risoluzioni) - Ma devi usare hiresfix. Di seguito le impostazioni usate nei miei esempi di immagini
- Hires. fix: 4x ultrasharp, 0.4 denoise, 10 passaggi (Non sono il migliore nell'upscale. Se hai altri metodi di upscaling, puoi usarli)
- Puoi anche generare direttamente a 1344x1728 se puoi
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8, Q4 o altri quant)
Peso Lora: 0.3-0.5. Devi sperimentare in base ai tuoi prompt
Prompt Positivo: Non serve una parola chiave trigger. Ma devi usare termini fotografici per dirigere Flux (come photo, photograph ecc.). Puoi partire da quelli qui sotto. È come ho etichettato il dataset di addestramento
- Foto a figura intera di
- Foto a mezzo busto di
- Selfie di
- Foto in primo piano di
- O qualunque cosa tu voglia (adatta i passaggi, il peso in base al tuo prompt). I prompt dettagliati funzionano ancora meglio

Problemi: Se accade, riduci il peso
- Mani
- Testo
- Persone sullo sfondo
- Texture della pelle - non è perfetta. Anche a me non piace. Sto cercando modi per migliorarla

Vorrei ringraziare tutti coloro che hanno donato a Buzz e reso possibile questa versione. Menzioni onorevoli:

plectrudecatastrophe
Paper_Cranes
congo2008

Impostazioni Consigliate (v4-soap-testing e v5-beta):

Scala CFG Distillata: 2.5 a 4
Metodo di campionamento e Tipo di programma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passaggi: >=20 (A volte uso 20, 30, 35 o 40 - Dovresti verificare a quanti passaggi l'immagine converge - Perciò, sperimenta autonomamente)
Risoluzione: 1344x1728 o 1248x1824 o 1440x1800. 896x1152 funziona ugualmente ma devi usare hires fix
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8, Q4 o altri quant)
Peso Lora: 0.3-0.5 è l'intervallo ideale
Prompt Positivo: Queste 2 versioni non necessitano di parola trigger. Puoi usare foto di, puoi usare photograph of, puoi usare Shot on iPhone photo of, puoi usare This Image features o qualunque cosa tu voglia (vedi gli esempi postati da altri - alcuni usano vari tipi di prompt e ottengono comunque buoni risultati) ma dopo molti test, ho avuto ottimi risultati con la parola trigger che ho aggiunto a destra in questa pagina. Se vuoi usarla, puoi farlo, altrimenti usa qualunque cosa desideri. Ricorda che il dataset è stato ancora sottotitolato usando GPT4O quindi prompt dettagliati danno sempre i migliori risultati

Vorrei ringraziare tutti coloro che hanno donato a Buzz e reso possibile questa versione. Menzioni onorevoli:

kudzueye

Impostazioni Consigliate (v3 e v2):

Scala CFG Distillata: 2.5 a 4
Metodo di campionamento e Tipo di programma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Passaggi: >=20 (A volte uso 20, 30, 35 o 40 - Dovresti verificare a quanti passaggi l'immagine converge - Perciò, sperimenta autonomamente)
Risoluzione: 896x1152 o 1152x896 o 1024x1024 (Puoi generare anche a risoluzioni più alte di queste. Flux e questa lora possono gestirlo)
Checkpoint: flux1-dev-Q8_0.gguf (Uso quello Q8. Non testo questa Lora con FP8, Q4 o altri quant)
Peso Lora: 0.6-1
Prompt Positivo: Se altri prompt funzionano per te con questa Lora, usali pure. Sto solo evidenziando come testo la Lora. Ho visto molte immagini qui e su Reddit dove le persone usano diversi tipi di prompt
- Inizia sempre con "Fotografia amatoriale di" e termina con "su flickr nel 2007, 2005 blog, 2007 blog"
  - Il prompt dovrebbe essere in questo formato per ottenere i migliori risultati: Fotografia amatoriale di <Descrizione del soggetto>, <Descrizione della scena>, <Tag di qualità immagine>, su flickr nel 2007, 2005 blog, 2007 blog

Come è stato sottotitolato il Dataset?:

Ho sottotitolato il dataset di addestramento usando GPT4o. I didascalie dettagliate funzionano meglio con questa Lora

Se ti piace questa lora e puoi donare a Buzz, è molto apprezzato

Se non ti piace e hai un feedback costruttivo, lascia un commento spiegando dove ha difficoltà e cercherò di correggerlo nella prossima versione

Se non hai alcun riscontro costruttivo da condividere e vuoi solo lamentarti di questa Lora, porta altrove i tuoi commenti

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

ritratto robot/cyborg chromeBot - v0.1

Ritratti Dettagliati del Viaggiatore | FLUX - v1.0

Usa questo modello