modelos/Fotografía Amateur [Flux Dev] - v6

Fotografía Amateur [Flux Dev] - v6

7/3/2025

1:15:51 PM

Palabras Clave y Etiquetas Relacionadas

fotografía amateur,fotografía amateur [desarrollador flux],flux.1 d,alta resolución,arreglo de alta resolución,generación de imágenes,lora,modelo lora,lora usgr07fdw,peterkickasspeter,indicaciones de fotografía,fotorrealismo,fotorrealista,realista,métodos de muestreo,stable diffusion,estilo,v6

Vista desde dentro de un auto conduciendo por un barrio suburbano lluvioso con casas americanas en un día ventoso y nublado, fotografiada en estilo POV en primera persona.

Una mujer de unos 40 años con vestido floral sentada en un banco de madera en una lavandería con piso a cuadros y lavadoras, bajo iluminación fluorescente.

SUV cubierto de nieve estacionado frente a una cabaña de madera con ventanas iluminadas durante una ventisca nocturna, rodeado de nieve y árboles sin hojas.

Gato atigrado gris con disfraz peludo blanco con orejas y nariz rosadas, que parece un ratón o animal pequeño, con una cinta rosa alrededor del cuello.

Hombre con un gran abrigo marrón de piel con capucha camina por nieve hasta las rodillas durante una ventisca, cubriéndose el rostro con una mano enguantada en una zona residencial nevada.

Retrato de una mujer con cabello corto que lleva un traje hecho de recortes de periódico, fotografiada en un día nublado en una calle de Berna, Suiza, con un fondo desenfocado de personas y edificios.

Persona con un fursuit de lobo antropomórfico amarillo y verde de pie en una casa abandonada y oscura iluminada por un flash, con efecto de foto granulada y de baja calidad.

Paisaje de pantano con un cuerpo de agua con hojas verdes de lirio y hierbas, rodeado de árboles altos bajo un cielo azul despejado.

Hombre mexicano sonriendo con jeans y camiseta blanca sentado en una acera en Los Ángeles sosteniendo una botella de cerveza.

Sala de estar acogedora con sofás blancos, papel tapiz rojo, chimenea de mármol encendida, pinturas al óleo, lámparas de mesa y grandes ventanas arqueadas de piso a techo con una ventisca nevada afuera.

Espacio de oficina abierto de los 90 lleno de filas de cubículos, suelo con alfombra verde, luces fluorescentes en el techo y una atmósfera incómoda.

Un castillo europeo de piedra oscura se alza sobre una colina nevada en una niebla matutina con una única ventana iluminada que muestra una figura oscura, rodeado de árboles muertos bajo un cielo nublado.

Prompts Recomendados

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

Parámetros Recomendados

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, DEIS

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 1152x896, 896x1152

other models

amateurphoto-v6-forcu (32f7530463d5), flux1-dev-Q8_0 (52cfce60d7)

Parámetros Recomendados de Alta Resolución

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - 4

steps

denoising strength

0.25 - 0.3

Consejos

El peso de Lora es ajustable; experimenta entre 0.3 y 1 según la versión y el prompt.

Usa prompts positivos detallados relacionados con fotografía para una mejor calidad de generación.

Si surgen problemas como con manos, texto o personas en el fondo, reduce el peso de la Lora.

El dataset fue titulado con GPT4o para mejorar la correspondencia calidad del prompt.

Puedes generar directamente a resoluciones más altas como 1344x1728 si tu sistema lo soporta.

Para mejores resultados, verifica en cuántos pasos converge la imagen experimentando entre 20 y 40 pasos.

Hola a todos, por favor lean esto antes de usar la Lora

Configuraciones recomendadas (v6):

Escala CFG Destilada: 3.5
Método de muestreo y tipo de programación: DEIS con DDIM
Pasos: 20
Resolución: 896x1152
- Modelo de corrección hires: 4x_NMKD-Superscale-SP_178000_G
- Pasos: 10
- Reducción de ruido: 0.3
- Escalado por: 1.5
Peso de Lora: 0.8. Debes experimentar según tus prompts

Configuraciones recomendadas (v5-final):

Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de programación: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (A veces uso 20, 30, 35 o 40 - Debes verificar en cuántos pasos converge la imagen - Así que, experimenta por ti mismo)
Resolución: 896x1152 (Me aseguré que funcione a esta resolución ya que a algunos no les gustó que dijera generar en alta resolución) - Pero debes usar hiresfix. A continuación las configuraciones que usé en mis imágenes de ejemplo
- Corrección hires: 4x ultrasharp, 0.4 reducción de ruido, 10 pasos (No soy el mejor en escalado. Si tienes otros métodos, puedes usarlos)
- También puedes generar directamente a 1344x1728 si puedes
Checkpoint: flux1-dev-Q8_0.gguf (Uso el Q8. No he probado esta Lora con FP8, Q4 u otros quants)
Peso de Lora: 0.3-0.5. Debes experimentar según tus prompts
Prompt Positivo: No es necesario palabra clave especial. Pero debes usar términos de fotografía para guiar a Flux (como foto, fotografía, etc.). Puedes comenzar con los siguientes. Así etiqueté el conjunto de datos de entrenamiento
- Foto de cuerpo entero de
- Foto de plano medio de
- Selfie de
- Foto en primer plano de
- O cualquier otro que quieras (ajusta pasos y peso según tu prompt). Los prompts detallados funcionan mejor

Problemas: Si ocurren, reduce el peso
- Manos
- Texto
- Personas en el fondo
- Textura de piel - no es perfecta. Tampoco me gusta mucho, estoy tratando de mejorarla

Quiero agradecer a todos los que apoyaron a Buzz y hicieron posible esta versión. Menciones honorables:

plectrudecatastrophe
Paper_Cranes
congo2008

Configuraciones recomendadas (v4-prueba-soap y v5-beta):

Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de programación: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (A veces uso 20, 30, 35 o 40 - Verifica en cuántos pasos converge la imagen - Experimenta por ti mismo)
Resolución: 1344x1728 o 1248x1824 o 1440x1800. 896x1152 también funciona pero debes usar corrección hires
Checkpoint: flux1-dev-Q8_0.gguf (Uso el Q8. No he probado esta Lora con FP8, Q4 u otros quants)
Peso de Lora: 0.3-0.5 es el punto ideal
Prompt Positivo: Estas 2 versiones no necesitan palabra clave especial. Puedes usar 'foto de', 'fotografía de', 'foto tomada con iPhone de', 'Esta imagen presenta' o cualquier cosa que quieras (mira ejemplos de otros, algunos usan prompts diferentes y aún obtienen buenos resultados) pero después de muchas pruebas, tuve muy buenos resultados con la palabra clave que añadí al lado derecho de esta página. Puedes usarla o no. Ten en cuenta que el dataset está titulado con GPT4O, por lo que los prompts detallados dan mejores resultados

Quiero agradecer a todos los que apoyaron a Buzz y hicieron posible esta versión. Menciones honorables:

kudzueye

Configuraciones recomendadas (v3 y v2):

Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de programación: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (A veces uso 20, 30, 35 o 40 - Verifica en cuántos pasos converge la imagen - Experimenta por ti mismo)
Resolución: 896x1152 o 1152x896 o 1024x1024 (Puedes generar a resoluciones mayores también. Flux y esta lora lo soportan)
Checkpoint: flux1-dev-Q8_0.gguf (Uso el Q8. No he probado esta Lora con FP8, Q4 u otros quants)
Peso de Lora: 0.6-1
Prompt Positivo: Si otros prompts funcionan con esta Lora, úsalo. Solo destaco cómo la pruebo. He visto varias imágenes aquí y en Reddit donde la gente usa distintos tipos de prompts
- Siempre empieza con "Fotografía amateur de" y termina con "en flickr en 2007, blog 2005, blog 2007"
  - El prompt debe tener este formato para mejores resultados: Fotografía amateur de <Descripción del Sujeto>, <Descripción de la Escena>, <Etiquetas de Calidad de Imagen>, en flickr en 2007, blog 2005, blog 2007