Fotografía Amateur [Flux Dev] - v5-beta
Palabras Clave y Etiquetas Relacionadas
Prompts Recomendados
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
Parámetros Recomendados
samplers
steps
cfg
resolution
other models
Parámetros Recomendados de Alta Resolución
upscaler
upscale
steps
Consejos
Debes experimentar con el Peso de Lora basado en tus indicaciones; los pesos recomendados varían entre 0.3-0.5 y 0.6-1 dependiendo de la versión.
Indicaciones detalladas relacionadas con fotografía guían mejor el modelo; usa términos como foto, fotografía, o incluye tipos de cámara o fechas.
Si surgen problemas con manos, texto, personas de fondo o textura de piel, intenta reducir el peso de Lora.
También puedes generar directamente en resoluciones más altas como 1344x1728 si tu configuración lo permite.
Los subtítulos del conjunto de datos fueron creados usando GPT4o; los subtítulos detallados dan mejores resultados.
Aspectos Destacados de la Versión
Mejoras menores respecto a la v4
Hola a todos, por favor lean esto antes de usar el Lora
Configuraciones Recomendadas (v6):
Escala CFG Destilada: 3.5
Método de muestreo y tipo de cronograma: DEIS con DDIM
Pasos: 20
Resolución: 896x1152
Modelo de hires fix: 4x_NMKD-Superscale-SP_178000_G
Pasos: 10
Reducción de ruido: 0.3
Aumento de escala por: 1.5
Peso de Lora: 0.8. Debes experimentar según tus indicaciones
Configuraciones Recomendadas (v5-final):
Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de cronograma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (a veces uso 20, 30, 35 o 40 – debes verificar en cuántos pasos converge la imagen, así que experimenta tú mismo)
Resolución: 896x1152 (me aseguré que funcione en esta resolución ya que a algunos no les gustó cuando dije generar en altas resoluciones) - Pero debes usar hiresfix. A continuación las configuraciones que usé en mis imágenes de ejemplo
Hires fix: 4x ultrasharp, reducción de ruido 0.4, 10 pasos (no soy muy bueno en aumento de escala. Si tienes otros métodos, puedes usarlos)
También puedes generar directamente a 1344x1728 si puedes
Checkpoint: flux1-dev-Q8_0.gguf (uso el Q8. No pruebo este Lora con FP8, Q4 u otras cuantizaciones)
Peso de Lora: 0.3-0.5. Debes experimentar según tus indicaciones
Indicaciones Positivas: No se necesita palabra disparadora. Pero debes usar términos fotográficos para guiar a Flux (como foto, fotografía, etc.). Puedes comenzar con las siguientes; así etiqueté el conjunto de datos de entrenamiento
Foto de cuerpo entero de
Foto de plano medio de
Selfie de
Foto de primer plano de
O lo que quieras (ajusta los pasos y el peso según tu indicación). Las indicaciones detalladas funcionan mejor
Problemas: Si ocurren, reduce el peso
Manos
Texto
Personas en el fondo
Textura de piel - no es perfecta. Tampoco me gusta. Estoy buscando formas de mejorarla
Quiero agradecer a todos los que dieron propina a Buzz y hicieron posible esta versión. Menciones honoríficas:
plectrudecatastrophe
Paper_Cranes
congo2008
Configuraciones Recomendadas (v4-soap-testing y v5-beta):
Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de cronograma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (a veces uso 20, 30, 35 o 40 – verifica en cuántos pasos converge la imagen; experimenta tú mismo)
Resolución: 1344x1728 o 1248x1824 o 1440x1800. 896x1152 también funciona, pero debes usar hires fix
Checkpoint: flux1-dev-Q8_0.gguf (uso el Q8. No pruebo este Lora con FP8, Q4 u otras cuantizaciones)
Peso de Lora: 0.3-0.5 es el punto ideal
Indicaciones Positivas: Estas dos versiones no necesitan palabra disparadora. Puedes usar "foto de", "fotografía de", "Foto tomada con iPhone de", "Esta imagen presenta" o lo que quieras (mira ejemplos publicados por otros – algunos usan distintos tipos de indicaciones y obtienen buenos resultados). Después de muchas pruebas, obtuve muy buenos resultados con la palabra disparadora que añadí al lado derecho de esta página. Puedes usarla o no. Ten en cuenta que el conjunto de datos sigue siendo subtitulado con GPT4O, por lo que indicaciones detalladas siempre brindan mejores resultados
Quiero agradecer a todos los que dieron propina a Buzz y hicieron posible esta versión. Menciones honoríficas:
kudzueye
Configuraciones Recomendadas (v3 y v2):
Escala CFG Destilada: 2.5 a 4
Método de muestreo y tipo de cronograma: Heun con BETA o DEIS con DDIM o [Forge] Flux Realistic (Lento) con Beta / DDIM
Pasos: >=20 (a veces uso 20, 30, 35 o 40 – verifica en cuántos pasos converge la imagen; experimenta tú mismo)
Resolución: 896x1152 o 1152x896 o 1024x1024 (también puedes generar en resoluciones mayores. Flux y este lora pueden manejarlo)
Checkpoint: flux1-dev-Q8_0.gguf (uso el Q8. No pruebo este Lora con FP8, Q4 u otras cuantizaciones)
Peso de Lora: 0.6-1
Indicaciones Positivas: Si otras indicaciones te funcionan con este Lora, úsalas. Solo destaco cómo pruebo el Lora. He visto varias imágenes aquí y en Reddit donde la gente usa distintos tipos de indicaciones
Comienza siempre con "Fotografía amateur de" y termina con "en flickr en 2007, blog de 2005, blog de 2007"
La indicación debe estar en este formato para obtener los mejores resultados: Fotografía amateur de <Descripción del sujeto>, <Descripción de la escena>, <Etiquetas de calidad de imagen>, en flickr en 2007, blog de 2005, blog de 2007
¿Cómo fue subtitulado el conjunto de datos?:
Subtitulé el conjunto de datos de entrenamiento usando GPT4o. Los subtítulos detallados funcionan mejor con este Lora
Si te gusta este lora y puedes donar a Buzz, se lo agradeceremos mucho
Si no te gusta y tienes retroalimentación constructiva, deja un comentario explicando dónde falla y trataré de corregirlo en la próxima versión
Si no tienes retroalimentación constructiva y solo quieres quejarte de este Lora, lleva tus comentarios a otro lado
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Palabras entrenadas
Creador
Discusión
Por favor log in para dejar un comentario.






