Fotografia Amadora [Flux Dev] - v5-beta
Palavras-chave e Tags Relacionadas
Prompts Recomendados
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
Parâmetros Recomendados
samplers
steps
cfg
resolution
other models
Parâmetros Recomendados para Alta Resolução
upscaler
upscale
steps
Dicas
Você deve experimentar o Peso do Lora com base nos seus prompts; os pesos recomendados variam de 0,3-0,5 a 0,6-1 dependendo da versão.
Prompts detalhados relacionados à fotografia direcionam melhor o modelo; use termos como foto, fotografia, ou inclua tipos de câmeras ou datas.
Se surgirem problemas com mãos, texto, pessoas ao fundo ou textura da pele, tente reduzir o peso do Lora.
Você também pode gerar diretamente em resoluções maiores como 1344x1728 se sua configuração permitir.
As legendas do conjunto de dados foram criadas usando GPT4o; legendas detalhadas dão os melhores resultados.
Destaques da Versão
Atualizações menores desde a v4
Olá a todos, por favor leiam isto antes de usar a Lora
Configurações Recomendadas (v6):
Escala CFG Destilada: 3,5
Método de amostragem e tipo de agendamento: DEIS com DDIM
Passos: 20
Resolução: 896x1152
Modelo hires fix: 4x_NMKD-Superscale-SP_178000_G
Passos: 10
Denoise: 0,3
Upscale por: 1,5
Peso do Lora: 0,8. Você deve experimentar com base nos seus prompts
Configurações Recomendadas (v5-final):
Escala CFG Destilada: 2,5 a 4
Método de amostragem e tipo de agendamento: Heun com BETA ou DEIS com DDIM ou [Forge] Flux Realistic (Lento) com Beta / DDIM
Passos: >=20 (Às vezes uso 20, 30, 35 ou 40 - Você deve verificar em quantos passos a imagem converge - Portanto, por favor, experimente você mesmo)
Resolução: 896x1152 (Garanti que funciona nessa resolução, pois alguns de vocês não gostaram quando eu disse para gerar em altas resoluções) - Mas você tem que usar hiresfix. Abaixo estão as configurações que usei nas minhas imagens de exemplo
Hires. fix: 4x ultrasharp, 0,4 de denoise, 10 passos (Não sou o melhor em upscaling. Se você tem outros métodos de upscaling, pode usar)
Você também pode gerar diretamente em 1344x1728 se puder
Checkpoint: flux1-dev-Q8_0.gguf (Uso o Q8. Não testo esta Lora com FP8, Q4 ou outros quants)
Peso do Lora: 0,3-0,5. Você deve experimentar baseado nos seus prompts
Prompt Positivo: Não é necessário palavra gatilho. Mas você deve usar alguns termos fotográficos para direcionar o Flux (como foto, fotografia etc.). Pode começar com os abaixo. É como etiquetei o conjunto de dados de treinamento
Foto de corpo inteiro de
Foto de close médio de
Selfie de
Foto de close-up de
Ou o que você quiser (ajuste os passos e peso baseado no seu prompt). Prompts detalhados ainda funcionam melhor
Problemas: Se acontecer, reduza o peso
Mãos
Texto
Pessoas ao fundo
Textura da pele - não é perfeita. Também não gosto disso. Estou tentando encontrar maneiras de melhorar
Gostaria de agradecer a todos que deram gorjetas para Buzz e possibilitaram esta versão. Menções honrosas:
plectrudecatastrophe
Paper_Cranes
congo2008
Configurações Recomendadas (v4-soap-testing e v5-beta):
Escala CFG Destilada: 2,5 a 4
Método de amostragem e tipo de agendamento: Heun com BETA ou DEIS com DDIM ou [Forge] Flux Realistic (Lento) com Beta / DDIM
Passos: >=20 (Às vezes uso 20, 30, 35 ou 40 - Você deve verificar em quantos passos a imagem converge - Portanto, por favor, experimente você mesmo)
Resolução: 1344x1728 ou 1248x1824 ou 1440x1800. 896x1152 também funciona, mas você precisa usar hires fix
Checkpoint: flux1-dev-Q8_0.gguf (Uso o Q8. Não testo esta Lora com FP8, Q4 ou outros quants)
Peso do Lora: 0,3-0,5 é o ideal
Prompt Positivo: Estas 2 versões não precisam de palavra gatilho. Você pode usar foto de, pode usar fotografia de, pode usar foto tirada com iPhone, pode usar Esta imagem apresenta ou pode usar qualquer coisa que quiser (veja os exemplos postados por outros - alguns usam tipos diferentes de prompts e ainda obtêm bons resultados) mas após muitos testes, obtive resultados muito bons com a palavra gatilho que adicionei na lateral desta página. Se quiser usar, pode, senão pode usar qualquer coisa que queira. Lembre-se, o conjunto de dados ainda está legendado usando GPT4O, então prompts detalhados sempre dão melhores resultados
Gostaria de agradecer a todos que deram gorjetas para Buzz e possibilitaram esta versão. Menções honrosas:
kudzueye
Configurações Recomendadas (v3 e v2):
Escala CFG Destilada: 2,5 a 4
Método de amostragem e tipo de agendamento: Heun com BETA ou DEIS com DDIM ou [Forge] Flux Realistic (Lento) com Beta / DDIM
Passos: >=20 (Às vezes uso 20, 30, 35 ou 40 - Você deve verificar em quantos passos a imagem converge - Portanto, por favor, experimente você mesmo)
Resolução: 896x1152 ou 1152x896 ou 1024x1024 (Você pode gerar em resoluções maiores também. Flux e esta Lora suportam isso)
Checkpoint: flux1-dev-Q8_0.gguf (Uso o Q8. Não testo esta Lora com FP8, Q4 ou outros quants)
Peso do Lora: 0,6-1
Prompt Positivo: Se outros prompts funcionam para você com esta Lora, use-os. Estou apenas destacando como testo a Lora. Vi várias imagens aqui e no Reddit onde as pessoas usam tipos diferentes de prompts
Sempre comece com "Fotografia amadora de" e termine com "no flickr em 2007, blog 2005, blog 2007"
O prompt deve estar nesse formato para obter os melhores resultados: Fotografia amadora de <Descrição do Sujeito>, <Descrição da Cena>, <Etiquetas de Qualidade da Imagem>, no flickr em 2007, blog 2005, blog 2007
Como foi legendado o Conjunto de Dados?:
Eu legendava o conjunto de dados de treinamento usando GPT4o. Legendas detalhadas funcionam melhor com esta Lora
Se você gosta desta Lora e pode doar para Buzz, é muito apreciado
Se você não gosta e tem feedback construtivo, por favor deixe um comentário explicando onde está com dificuldades e tentarei corrigir na próxima versão
Se você não tem feedback construtivo e só quer reclamar dessa Lora, leve seus comentários para outro lugar
Detalhes do Modelo
Tipo de modelo
Modelo base
Versão do modelo
Hash do modelo
Palavras treinadas
Criador
Discussão
Por favor, faça log in para deixar um comentário.






