modelos/Fotografia Amadora [Flux Dev] - v5-beta

Fotografia Amadora [Flux Dev] - v5-beta

7/16/2025

2:38:39 AM

Palavras-chave e Tags Relacionadas

fotografia amadora,fotografia amadora [flux dev],escala cfg,flux.1 d,fóruns de hack removidos postados no whatsapp r/me_irl r/pics foto tirada no iphone mau qualidade foto nítida de,correção de alta resolução,geração de imagem,lora,lora usgr07fdw,peso lora,peterkickasspeter,fotorealismo,fotorealista,realista,método de amostragem,stable diffusion,estilo,v5-beta

Um urso polar de pé na borda de um iceberg nevado nas águas calmas do Ártico sob um céu nublado.

Foto nítida de uma turista feminina na Flórida Central vestindo camiseta do Mickey Mouse e shorts, encostada em uma palmeira em um dia ensolarado em um bairro suburbano.

Casa suburbana amarela de dois andares na Flórida cercada por água de enchente alta, com palmeiras refletindo na superfície da água.

Homem vestido de mago com longa barba branca, chapéu pontudo floral e robe verde segurando um cajado de madeira em uma festa lotada na sala com sofás, balões e garrafas de cerveja no chão.

Prompts Recomendados

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

Parâmetros Recomendados

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, DEIS, [Forge] Flux Realistic (Slow)

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 1824x1248, 1344x1728, 1248x1824

other models

amateurphoto-version5-gm (d9ccc813e4d8), flux1-dev-Q8_0 (52cfce60d7)

Parâmetros Recomendados para Alta Resolução

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

Dicas

Você deve experimentar o Peso do Lora com base nos seus prompts; os pesos recomendados variam de 0,3-0,5 a 0,6-1 dependendo da versão.

Prompts detalhados relacionados à fotografia direcionam melhor o modelo; use termos como foto, fotografia, ou inclua tipos de câmeras ou datas.

Se surgirem problemas com mãos, texto, pessoas ao fundo ou textura da pele, tente reduzir o peso do Lora.

Você também pode gerar diretamente em resoluções maiores como 1344x1728 se sua configuração permitir.

As legendas do conjunto de dados foram criadas usando GPT4o; legendas detalhadas dão os melhores resultados.

Destaques da Versão

Atualizações menores desde a v4

Olá a todos, por favor leiam isto antes de usar a Lora

Configurações Recomendadas (v6):

Escala CFG Destilada: 3,5
Método de amostragem e tipo de agendamento: DEIS com DDIM
Passos: 20
Resolução: 896x1152
- Modelo hires fix: 4x_NMKD-Superscale-SP_178000_G
- Passos: 10
- Denoise: 0,3
- Upscale por: 1,5
Peso do Lora: 0,8. Você deve experimentar com base nos seus prompts

Configurações Recomendadas (v5-final):

Escala CFG Destilada: 2,5 a 4
Método de amostragem e tipo de agendamento: Heun com BETA ou DEIS com DDIM ou [Forge] Flux Realistic (Lento) com Beta / DDIM
Passos: >=20 (Às vezes uso 20, 30, 35 ou 40 - Você deve verificar em quantos passos a imagem converge - Portanto, por favor, experimente você mesmo)
Resolução: 896x1152 (Garanti que funciona nessa resolução, pois alguns de vocês não gostaram quando eu disse para gerar em altas resoluções) - Mas você tem que usar hiresfix. Abaixo estão as configurações que usei nas minhas imagens de exemplo
- Hires. fix: 4x ultrasharp, 0,4 de denoise, 10 passos (Não sou o melhor em upscaling. Se você tem outros métodos de upscaling, pode usar)
- Você também pode gerar diretamente em 1344x1728 se puder
Checkpoint: flux1-dev-Q8_0.gguf (Uso o Q8. Não testo esta Lora com FP8, Q4 ou outros quants)
Peso do Lora: 0,3-0,5. Você deve experimentar baseado nos seus prompts
Prompt Positivo: Não é necessário palavra gatilho. Mas você deve usar alguns termos fotográficos para direcionar o Flux (como foto, fotografia etc.). Pode começar com os abaixo. É como etiquetei o conjunto de dados de treinamento
- Foto de corpo inteiro de
- Foto de close médio de
- Selfie de
- Foto de close-up de
- Ou o que você quiser (ajuste os passos e peso baseado no seu prompt). Prompts detalhados ainda funcionam melhor

Problemas: Se acontecer, reduza o peso
- Mãos
- Texto
- Pessoas ao fundo
- Textura da pele - não é perfeita. Também não gosto disso. Estou tentando encontrar maneiras de melhorar

Gostaria de agradecer a todos que deram gorjetas para Buzz e possibilitaram esta versão. Menções honrosas:

plectrudecatastrophe
Paper_Cranes
congo2008

Configurações Recomendadas (v4-soap-testing e v5-beta):

Escala CFG Destilada: 2,5 a 4
Método de amostragem e tipo de agendamento: Heun com BETA ou DEIS com DDIM ou [Forge] Flux Realistic (Lento) com Beta / DDIM
Passos: >=20 (Às vezes uso 20, 30, 35 ou 40 - Você deve verificar em quantos passos a imagem converge - Portanto, por favor, experimente você mesmo)
Resolução: 1344x1728 ou 1248x1824 ou 1440x1800. 896x1152 também funciona, mas você precisa usar hires fix
Checkpoint: flux1-dev-Q8_0.gguf (Uso o Q8. Não testo esta Lora com FP8, Q4 ou outros quants)
Peso do Lora: 0,3-0,5 é o ideal
Prompt Positivo: Estas 2 versões não precisam de palavra gatilho. Você pode usar foto de, pode usar fotografia de, pode usar foto tirada com iPhone, pode usar Esta imagem apresenta ou pode usar qualquer coisa que quiser (veja os exemplos postados por outros - alguns usam tipos diferentes de prompts e ainda obtêm bons resultados) mas após muitos testes, obtive resultados muito bons com a palavra gatilho que adicionei na lateral desta página. Se quiser usar, pode, senão pode usar qualquer coisa que queira. Lembre-se, o conjunto de dados ainda está legendado usando GPT4O, então prompts detalhados sempre dão melhores resultados

Gostaria de agradecer a todos que deram gorjetas para Buzz e possibilitaram esta versão. Menções honrosas:

kudzueye

Configurações Recomendadas (v3 e v2):

Escala CFG Destilada: 2,5 a 4
Método de amostragem e tipo de agendamento: Heun com BETA ou DEIS com DDIM ou [Forge] Flux Realistic (Lento) com Beta / DDIM
Passos: >=20 (Às vezes uso 20, 30, 35 ou 40 - Você deve verificar em quantos passos a imagem converge - Portanto, por favor, experimente você mesmo)
Resolução: 896x1152 ou 1152x896 ou 1024x1024 (Você pode gerar em resoluções maiores também. Flux e esta Lora suportam isso)
Checkpoint: flux1-dev-Q8_0.gguf (Uso o Q8. Não testo esta Lora com FP8, Q4 ou outros quants)
Peso do Lora: 0,6-1
Prompt Positivo: Se outros prompts funcionam para você com esta Lora, use-os. Estou apenas destacando como testo a Lora. Vi várias imagens aqui e no Reddit onde as pessoas usam tipos diferentes de prompts
- Sempre comece com "Fotografia amadora de" e termine com "no flickr em 2007, blog 2005, blog 2007"
  - O prompt deve estar nesse formato para obter os melhores resultados: Fotografia amadora de <Descrição do Sujeito>, <Descrição da Cena>, <Etiquetas de Qualidade da Imagem>, no flickr em 2007, blog 2005, blog 2007

Como foi legendado o Conjunto de Dados?:

Eu legendava o conjunto de dados de treinamento usando GPT4o. Legendas detalhadas funcionam melhor com esta Lora

Se você gosta desta Lora e pode doar para Buzz, é muito apreciado

Se você não gosta e tem feedback construtivo, por favor deixe um comentário explicando onde está com dificuldades e tentarei corrigir na próxima versão

Se você não tem feedback construtivo e só quer reclamar dessa Lora, leve seus comentários para outro lugar

Colaborador

João Silva

Olá! Sou o João Silva. Especialista em curadoria visual, utilizo minha experiência em fotografia para aprimorar cada criação de IA exibida na galeria.

ZavyChromaXL - b1

Disney Animation [Illustrious & Pony] - [illustrious]

Usar este modelo