Proyecto UltraRealista Lora - Flux - v2
Palabras Clave y Etiquetas Relacionadas
Parámetros Recomendados
samplers
steps
cfg
Consejos
Para ComfyUI con el modelo Flux: CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength entre 0.8 y 1.0 (típicamente 1.0; reducir a 0.87 si la calidad de las manos empeora).
Para ComfyUI con el modelo SD3.5: CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength entre 0.5 y 1.0 (típicamente 0.7).
Considera ampliar el conjunto de datos con poses más diversas para mejorar la precisión anatómica en futuras actualizaciones.
Patrocinadores del Creador
Si deseas apoyar el trabajo y las futuras actualizaciones del modelo Flux, por favor visita y dona en https://ko-fi.com/danrisi.
El objetivo principal fue crear imágenes más ‘vivas’ con emociones más expresivas, poses más dinámicas y una calidad ligeramente amateur (también puede producir imágenes de alta calidad).
P.D.: ¡Gracias a todos por los comentarios! He notado los comentarios (no solo aquí) sobre problemas de anatomía y he estado recopilando reportes y ejemplos de todos ustedes. Estoy considerando un par de opciones para abordar esto:
Entrenar un checkpoint completo, que podría ser el enfoque más racional para mejoras consistentes.
Ampliar el conjunto de datos con más fotos que cubran poses diversas para ayudar a refinar la precisión anatómica.
Agradezco la aportación, realmente me ayuda a moldear las futuras actualizaciones.
P.D.2: He cambiado el entrenamiento a RunPod para obtener resultados consistentes y de alta calidad. Si deseas apoyar mi trabajo y futuras actualizaciones, puedes encontrarme en Ko-fi. Planeo ajustar un modelo, no solo una LoRa. https://ko-fi.com/danrisi
Configuración que uso en ComfyUI para Flux:
CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength= de 0.8 a 1.0 funciona bien, pero generalmente uso 1, aunque si las manos empeoran, lo bajo a 0.87.
Configuración que uso en ComfyUI para SD3.5:
CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength= de 0.5 a 1.0 funciona bien, pero generalmente uso 0.7.
V2 - Flux
Aporta aún más realismo y versatilidad a tus creaciones, con mejoras significativas en estabilidad, anatomía y calidad general. Esta actualización hace que la LoRA sea más adaptable, permitiéndote lograr varios niveles de calidad según tus indicaciones — desde realismo en alta definición hasta estética intencionalmente de menor calidad.
Entrenado con 1048 imágenes.
Novedades:
Mejoras de estabilidad: La nueva versión es más estable y funciona mejor con indicaciones basadas en texto, proporcionando un resultado más fluido y predecible.
Manos y anatomía mejoradas: Las manos y la anatomía del cuerpo están más refinadas, mejorando la calidad realista.
Flexibilidad en la calidad: Con las indicaciones adecuadas, puedes ajustar tanto para estética de alta calidad como de menor calidad (ejemplos disponibles).
V1.2 para SD3.5 - Grande
Decidí hacer una versión para SD3.5 con configuraciones casi iguales. En mi opinión se ve bien, pero noté algunos problemas con la anatomía (en algunos momentos hasta peor que Flux), aunque la estética (colores, contraste y otros aspectos) se ve incluso mejor que Flux. Veo que SD3.5 tiene potencial, quizás nuevas versiones también estarán en SD3.5.
V1.2
Cambié la mitad de las imágenes del conjunto de datos, modifiqué el estilo de indicaciones, mejoré las manos, reduje los 'efectos de linterna' en escenas nocturnas y mejoré la calidad general de la LoRa (eso espero).
En esta versión no es necesario usar montones de 'palabras clave' como en V1. Solo añade algunas de las que mencioné en las palabras clave.
V1
Entrené otra LoRa amateur (que ya se ha hecho bastante por aquí).
Aún así, tomé algunas fotos de mi conjunto de datos de los 2000s y añadí otras 700 imágenes. Hasta ahora quedó bastante bien, pero hay un punto controvertido sobre la optimización de la calidad: esperaba que ayudara a controlar la calidad, pero parece que solo confundió el modelo. En el conjunto de datos hay muchas gradaciones diferentes de calidad, tales como:
1) Foto de alta resolución, tomada con un móvil, sin artefactos visibles, clara y nítida.
2) Foto de baja resolución, amateur, tomada con una cámara digital, sin artefactos JPEG visibles, ligeramente ruidosa.
3) Foto de resolución media, tomada con un móvil, ligera granulosidad por condiciones de poca luz, sin artefactos digitales significativos.
Y otras combinaciones y variaciones. Creo que eliminaré eso en la próxima versión. Pero esta funciona mejor para mí:
Foto de baja resolución, amateur, tomada con una cámara digital, sin artefactos JPEG visibles, ligeramente ruidosa.
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Palabras entrenadas
Creador
Discusión
Por favor log in para dejar un comentario.






