Fotografía Amateur [Flux Dev] - v6
Palabras Clave y Etiquetas Relacionadas
Prompts Recomendados
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
Parámetros Recomendados
samplers
steps
cfg
resolution
other models
Parámetros Recomendados de Alta Resolución
upscaler
upscale
steps
denoising strength
Consejos
El peso de Lora es ajustable; experimenta entre 0.3 y 1 según la versión y el prompt.
Usa prompts positivos detallados relacionados con fotografía para una mejor calidad de generación.
Si surgen problemas como con manos, texto o personas en el fondo, reduce el peso de la Lora.
El dataset fue titulado con GPT4o para mejorar la correspondencia calidad del prompt.
Puedes generar directamente a resoluciones más altas como 1344x1728 si tu sistema lo soporta.
Para mejores resultados, verifica en cuántos pasos converge la imagen experimentando entre 20 y 40 pasos.
Hola a todos, por favor lean esto antes de usar la Lora
Configuraciones recomendadas (v6):
Escala CFG Destilada: 3.5
Método de muestreo y tipo de programación: DEIS con DDIM
Pasos: 20
Resolución: 896x1152
Modelo de corrección hires: 4x_NMKD-Superscale-SP_178000_G
Pasos: 10
Reducción de ruido: 0.3
Escalado por: 1.5
Peso de Lora: 0.8. Debes experimentar según tus prompts
Configuraciones recomendadas (v5-final):
Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de programación: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (A veces uso 20, 30, 35 o 40 - Debes verificar en cuántos pasos converge la imagen - Así que, experimenta por ti mismo)
Resolución: 896x1152 (Me aseguré que funcione a esta resolución ya que a algunos no les gustó que dijera generar en alta resolución) - Pero debes usar hiresfix. A continuación las configuraciones que usé en mis imágenes de ejemplo
Corrección hires: 4x ultrasharp, 0.4 reducción de ruido, 10 pasos (No soy el mejor en escalado. Si tienes otros métodos, puedes usarlos)
También puedes generar directamente a 1344x1728 si puedes
Checkpoint: flux1-dev-Q8_0.gguf (Uso el Q8. No he probado esta Lora con FP8, Q4 u otros quants)
Peso de Lora: 0.3-0.5. Debes experimentar según tus prompts
Prompt Positivo: No es necesario palabra clave especial. Pero debes usar términos de fotografía para guiar a Flux (como foto, fotografía, etc.). Puedes comenzar con los siguientes. Así etiqueté el conjunto de datos de entrenamiento
Foto de cuerpo entero de
Foto de plano medio de
Selfie de
Foto en primer plano de
O cualquier otro que quieras (ajusta pasos y peso según tu prompt). Los prompts detallados funcionan mejor
Problemas: Si ocurren, reduce el peso
Manos
Texto
Personas en el fondo
Textura de piel - no es perfecta. Tampoco me gusta mucho, estoy tratando de mejorarla
Quiero agradecer a todos los que apoyaron a Buzz y hicieron posible esta versión. Menciones honorables:
plectrudecatastrophe
Paper_Cranes
congo2008
Configuraciones recomendadas (v4-prueba-soap y v5-beta):
Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de programación: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (A veces uso 20, 30, 35 o 40 - Verifica en cuántos pasos converge la imagen - Experimenta por ti mismo)
Resolución: 1344x1728 o 1248x1824 o 1440x1800. 896x1152 también funciona pero debes usar corrección hires
Checkpoint: flux1-dev-Q8_0.gguf (Uso el Q8. No he probado esta Lora con FP8, Q4 u otros quants)
Peso de Lora: 0.3-0.5 es el punto ideal
Prompt Positivo: Estas 2 versiones no necesitan palabra clave especial. Puedes usar 'foto de', 'fotografía de', 'foto tomada con iPhone de', 'Esta imagen presenta' o cualquier cosa que quieras (mira ejemplos de otros, algunos usan prompts diferentes y aún obtienen buenos resultados) pero después de muchas pruebas, tuve muy buenos resultados con la palabra clave que añadí al lado derecho de esta página. Puedes usarla o no. Ten en cuenta que el dataset está titulado con GPT4O, por lo que los prompts detallados dan mejores resultados
Quiero agradecer a todos los que apoyaron a Buzz y hicieron posible esta versión. Menciones honorables:
kudzueye
Configuraciones recomendadas (v3 y v2):
Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de programación: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (A veces uso 20, 30, 35 o 40 - Verifica en cuántos pasos converge la imagen - Experimenta por ti mismo)
Resolución: 896x1152 o 1152x896 o 1024x1024 (Puedes generar a resoluciones mayores también. Flux y esta lora lo soportan)
Checkpoint: flux1-dev-Q8_0.gguf (Uso el Q8. No he probado esta Lora con FP8, Q4 u otros quants)
Peso de Lora: 0.6-1
Prompt Positivo: Si otros prompts funcionan con esta Lora, úsalo. Solo destaco cómo la pruebo. He visto varias imágenes aquí y en Reddit donde la gente usa distintos tipos de prompts
Siempre empieza con "Fotografía amateur de" y termina con "en flickr en 2007, blog 2005, blog 2007"
El prompt debe tener este formato para mejores resultados: Fotografía amateur de <Descripción del Sujeto>, <Descripción de la Escena>, <Etiquetas de Calidad de Imagen>, en flickr en 2007, blog 2005, blog 2007
¿Cómo fue titulado el dataset?:
Le puse títulos al conjunto de entrenamiento usando GPT4o. Los títulos detallados funcionan mejor con esta Lora
Si te gusta esta lora y puedes donar a Buzz, se agradece mucho
Si no te gusta y tienes críticas constructivas, deja un comentario explicando los problemas y trataré de solucionarlos en la próxima versión
Si no tienes críticas constructivas y solo quieres quejarte, lleva tus comentarios a otro lugar
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.






