modelos/Fotografía Amateur [Flux Dev] - v5-beta

Fotografía Amateur [Flux Dev] - v5-beta

7/16/2025

2:24:17 AM

Palabras Clave y Etiquetas Relacionadas

fotografía amateur,fotografía amateur [desarrollador flux],escala cfg,flux.1 d,foros de hackeo recopilados publicados en whatsapp r/me_irl r/pics foto tomada con iphone mala calidad foto nítida de,arreglo de alta resolución,generación de imágenes,lora,lora usgr07fdw,peso lora,peterkickasspeter,fotorrealismo,fotorrealista,realista,método de muestreo,stable diffusion,estilo,v5-beta

Un oso polar de pie al borde de un témpano de hielo nevado en aguas tranquilas del Ártico bajo un cielo nublado.

Foto nítida de una turista mujer en el centro de Florida con camiseta de Mickey Mouse y pantalones cortos, apoyada en una palmera en un día soleado en un barrio suburbano.

Casa suburbana amarilla de dos pisos en Florida rodeada de agua de inundación alta, con palmeras reflejándose en la superficie del agua.

Hombre disfrazado de mago con larga barba blanca, sombrero puntiagudo floral y túnica verde sosteniendo un bastón de madera en una fiesta concurrida en sala con sofás, globos y botellas de cerveza en el suelo.

Prompts Recomendados

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

Parámetros Recomendados

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, DEIS, [Forge] Flux Realistic (Slow)

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 1824x1248, 1344x1728, 1248x1824

other models

amateurphoto-version5-gm (d9ccc813e4d8), flux1-dev-Q8_0 (52cfce60d7)

Parámetros Recomendados de Alta Resolución

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

Consejos

Debes experimentar con el Peso de Lora basado en tus indicaciones; los pesos recomendados varían entre 0.3-0.5 y 0.6-1 dependiendo de la versión.

Indicaciones detalladas relacionadas con fotografía guían mejor el modelo; usa términos como foto, fotografía, o incluye tipos de cámara o fechas.

Si surgen problemas con manos, texto, personas de fondo o textura de piel, intenta reducir el peso de Lora.

También puedes generar directamente en resoluciones más altas como 1344x1728 si tu configuración lo permite.

Los subtítulos del conjunto de datos fueron creados usando GPT4o; los subtítulos detallados dan mejores resultados.

Aspectos Destacados de la Versión

Mejoras menores respecto a la v4

Hola a todos, por favor lean esto antes de usar el Lora

Configuraciones Recomendadas (v6):

Escala CFG Destilada: 3.5
Método de muestreo y tipo de cronograma: DEIS con DDIM
Pasos: 20
Resolución: 896x1152
- Modelo de hires fix: 4x_NMKD-Superscale-SP_178000_G
- Pasos: 10
- Reducción de ruido: 0.3
- Aumento de escala por: 1.5
Peso de Lora: 0.8. Debes experimentar según tus indicaciones

Configuraciones Recomendadas (v5-final):

Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de cronograma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (a veces uso 20, 30, 35 o 40 – debes verificar en cuántos pasos converge la imagen, así que experimenta tú mismo)
Resolución: 896x1152 (me aseguré que funcione en esta resolución ya que a algunos no les gustó cuando dije generar en altas resoluciones) - Pero debes usar hiresfix. A continuación las configuraciones que usé en mis imágenes de ejemplo
- Hires fix: 4x ultrasharp, reducción de ruido 0.4, 10 pasos (no soy muy bueno en aumento de escala. Si tienes otros métodos, puedes usarlos)
- También puedes generar directamente a 1344x1728 si puedes
Checkpoint: flux1-dev-Q8_0.gguf (uso el Q8. No pruebo este Lora con FP8, Q4 u otras cuantizaciones)
Peso de Lora: 0.3-0.5. Debes experimentar según tus indicaciones
Indicaciones Positivas: No se necesita palabra disparadora. Pero debes usar términos fotográficos para guiar a Flux (como foto, fotografía, etc.). Puedes comenzar con las siguientes; así etiqueté el conjunto de datos de entrenamiento
- Foto de cuerpo entero de
- Foto de plano medio de
- Selfie de
- Foto de primer plano de
- O lo que quieras (ajusta los pasos y el peso según tu indicación). Las indicaciones detalladas funcionan mejor

Problemas: Si ocurren, reduce el peso
- Manos
- Texto
- Personas en el fondo
- Textura de piel - no es perfecta. Tampoco me gusta. Estoy buscando formas de mejorarla

Quiero agradecer a todos los que dieron propina a Buzz y hicieron posible esta versión. Menciones honoríficas:

plectrudecatastrophe
Paper_Cranes
congo2008

Configuraciones Recomendadas (v4-soap-testing y v5-beta):

Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de cronograma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (a veces uso 20, 30, 35 o 40 – verifica en cuántos pasos converge la imagen; experimenta tú mismo)
Resolución: 1344x1728 o 1248x1824 o 1440x1800. 896x1152 también funciona, pero debes usar hires fix
Checkpoint: flux1-dev-Q8_0.gguf (uso el Q8. No pruebo este Lora con FP8, Q4 u otras cuantizaciones)
Peso de Lora: 0.3-0.5 es el punto ideal
Indicaciones Positivas: Estas dos versiones no necesitan palabra disparadora. Puedes usar "foto de", "fotografía de", "Foto tomada con iPhone de", "Esta imagen presenta" o lo que quieras (mira ejemplos publicados por otros – algunos usan distintos tipos de indicaciones y obtienen buenos resultados). Después de muchas pruebas, obtuve muy buenos resultados con la palabra disparadora que añadí al lado derecho de esta página. Puedes usarla o no. Ten en cuenta que el conjunto de datos sigue siendo subtitulado con GPT4O, por lo que indicaciones detalladas siempre brindan mejores resultados

Quiero agradecer a todos los que dieron propina a Buzz y hicieron posible esta versión. Menciones honoríficas:

kudzueye

Configuraciones Recomendadas (v3 y v2):

Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de cronograma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (a veces uso 20, 30, 35 o 40 – verifica en cuántos pasos converge la imagen; experimenta tú mismo)
Resolución: 896x1152 o 1152x896 o 1024x1024 (también puedes generar en resoluciones mayores. Flux y este lora pueden manejarlo)
Checkpoint: flux1-dev-Q8_0.gguf (uso el Q8. No pruebo este Lora con FP8, Q4 u otras cuantizaciones)
Peso de Lora: 0.6-1
Indicaciones Positivas: Si otras indicaciones te funcionan con este Lora, úsalas. Solo destaco cómo pruebo el Lora. He visto varias imágenes aquí y en Reddit donde la gente usa distintos tipos de indicaciones
- Comienza siempre con "Fotografía amateur de" y termina con "en flickr en 2007, blog de 2005, blog de 2007"
  - La indicación debe estar en este formato para obtener los mejores resultados: Fotografía amateur de <Descripción del sujeto>, <Descripción de la escena>, <Etiquetas de calidad de imagen>, en flickr en 2007, blog de 2005, blog de 2007