SDS_FILM / Fotografía analógica - v2.1.2
Palabras Clave y Etiquetas Relacionadas
Prompts Recomendados
8K,masterpiece,best quality:1.2,ultrahigh-res,Film photography + any film type,computational photography + any quality rating,ulzzang,naver fanpop,fffffound,streaming on twitch,character album cover,<lora:DetailedEyes_xl_V2:1>,<lora:neg4all_bdsqlsz_xl_V7:1>,<lora:ClearHand-V2:1>
Prompts Negativos Recomendados
anime,cartoon,3D rendering,high saturation,facial blemishes,lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,CyberRealistic_Negative-neg,SkinPerfection_NegV15,illustration,3d,2d,painting,cartoons,sketch,mole,skin blemishes,overexposed background,poor lighting,overexposed areas,uneven lighting,Low resolution,potential compression artifact,greasy skin
(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch)
Parámetros Recomendados
samplers
steps
cfg
clip skip
resolution
Parámetros Recomendados de Alta Resolución
upscaler
upscale
steps
denoising strength
Consejos
Incluye fotografía computacional y clasificaciones inferiores en palabras negativas al inicio para máxima mejora de calidad.
El modelo V5_SD1.5 tiene debilidades en el tratamiento de ojos; se recomienda usar modelos XL para redibujarlos y mejorar el efecto.
Al usar categorías de película, ingresa 'Film photography + cualquier tipo de película' para efectos por defecto.
Al usar categoría de fotografía computacional, ingresa 'computational photography + cualquier clasificación de calidad' para simular calidad móvil.
Para ADetailer, se recomienda usar muestreadores Euler y Euler a para evitar problemas de ruido.
Se sugiere usar nuevos modelos de etiquetado VIT-L-14/openai y bilp2-flan-t5-xl para inferir buenas palabras clave.
Las combinaciones clave de palabras positivas incluyen ulzzang, naver fanpop, ffffffound, streaming on twitch, character album cover.
Añadir palabras negativas como mole y skin blemishes ayuda a mitigar defectos en la piel de esta versión.
Para reparación en alta definición, se recomienda usar 8x_NMKD-Superscale_150000_G con aumento 1.5x, 12 iteraciones y amplitud 0.35.
Evita activar simultáneamente refiner y ADetailer para prevenir acumulación de ruido.
Patrocinadores del Creador
Formas de apoyo:
Únete al grupo de QQ 749047075 contraseña: SDS para participar en discusiones e intercambios.
V5_SD1.5:
El modelo se entrena principalmente enfotografía analógica,fotografía computacional y raw digital, con afinación profunda en retratos asiáticos. Actualmente, el conjunto principal de entrenamiento incluye jóvenes asiáticos masculinos, femeninos y una pequeña cantidad de paisajes. Emplea GPT4V para etiquetado, parcialmente combinado con Cogvqa y WD1.4; las etiquetas wd1.4 para 1girl y 1boy han sido modificadas a woman y man para evitar confusión con la edad.
Nota: esta versión es basada en SD1.5, combinada desde otras páginas de modelos. Tampoco el modelo busca un entrenamiento equilibrado completo, por lo que pueden existir desviaciones evidentes en funcionalidad y estética.
Raw digital: Formato Raw
Fotografía analógica: Film photography
Algunos tipos de película: Fuji C100 shooting, Fuji C200 shooting, Kodak 400 shooting, Kodak gold 200 shooting, Nolan 5219 shooting
Fotografía computacional: computational photography
Clasificación de calidad de imagen: Calidad imagen teléfono móvil, Calidad imagen línea fija, Calidad imagen buscapersonas
Método inicial (se puede modificar según la situación, añadiendo fotografía computacional y clasificaciones siguientes en negativo para obtener máxima mejora en calidad, o viceversa):
Palabras clave positivas: 8K,masterpiece, best quality:1.2,ultrahigh-res,
Palabras clave negativas: anime,cartoon,3D rendering,high saturation,facial blemishes,lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username,CyberRealistic_Negative-neg,(SkinPerfection_NegV15),
Configuraciones adicionales pueden consultarse en imágenes de ejemplo.
Problemas existentes: El tratamiento de ojos en el modelo 1.5 ha sido siempre forzado; para mejoras profundas es recomendable redibujar los ojos por separado con modelos XL.
El modelo está basado en el entrenamiento de LEOSAM FilmGirl Ultra, manteniendo todas las declaraciones de derechos de uso del modelo anteriorde nivel superior.
V4:
El modelo se entrena principalmente en fotografía analógica, fotografía computacional y realiza afinación profunda en retratos asiáticos. Mientras optimiza los datos principales, incorpora algunos modelos populares de película. La calidad de imagen es valorada y se introducen varias imágenes de baja calidad para extraer características negativas y mejorar el control de la calidad visual.
El modelo se basa en el modelo grande LEOSAM's HelloWorld5.0 (abreviado HW5.0), siguiendo la misma declaración de uso. Si modificas este modelo, debes mencionar tanto éste como HW5.0 en la introducción. Dirección del modelo HW5.0: https://civitai.com/models/43977/leosams-helloworld-sdxl-base-model
Si te gusta mi modelo, puedesinvitarme un café o apoyarme en AIDian. También agradezco mucho que compartan imágenes, pongan estrellas y comenten, ¡es realmente importante para mí!
Resumen de palabras clave para entrenamiento:
Se recomienda priorizar resolución de 896x1152, otros parámetros pueden consultarse en las instrucciones de V4RC1 o HW5.0.
A continuación, conceptos clave y palabras de invocación.
Película:Fotografía analógica
Algunos tipos de película: Fuji C100 shooting, Fuji C200 shooting, Kodak 400 shooting, Kodak gold 200 shooting, Nolan 5219 shooting
Fotografía computacional:computational photography
Clasificación de calidad: Calidad imagen teléfono móvil, Calidad imagen línea fija, Calidad imagen buscapersonas
(Calidad decreciente: móvil, línea fija, buscapersonas)
Palabras negativas entrenadas: sobreexposición de fondo, mala iluminación, áreas sobreexpuestas, iluminación desigual, baja resolución, posibles artefactos de compresión (estos no interfieren en exceso en la imagen)
Recomendaciones de uso:
Al usar película, ingresa Film photography + cualquier tipo de película (o sin nombre de película)
Usa las palabras negativas entrenadas y worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch,
Opcionalmente agrega computational photography, Mobile phone image quality, Landline image quality, Pager image quality
Incluir toda categoría de fotografía computacional en negativo puede llevar a un exceso de nitidez; dado que los datos principales siguen siendo película, si no se añaden indicaciones específicas suele asumirse efecto película.
Al usar fotografía computacional (calidad móvil), ingresa computational photography + cualquier clasificación de calidad
No es necesario incluir las palabras negativas entrenadas, ya que son características de la fotografía computacional.
Comparación de calidad entre categorías de fotografía:

Comparación entre diferentes tipos de película:

Comparación de diferentes incrustaciones negativas:

Nota: todos los efectos fotográficos no representan películas reales ni efectos reales de fotografía móvil, son resultados simulados por IA con apreciación personal; no se correspondan con equipos reales específicos.
Nota: todos los efectos fotográficos no pueden representar la película del mundo real o los efectos de fotografía con teléfono móvil, aquí son resultados de simulación por IA, con apreciación personal; no correspondan el efecto del modelo con equipos específicos reales.
V4_RC1:
V4 ya ha sido entrenado localmente durante cientos de horas, con el cuerpo de datos etiquetado usando GPT4V y parcialmente con WD1.4+cog. El modelo ha mostrado cierto sobreajuste, mitigado con la primera ronda de MBW. En comparación con versiones anteriores, la estructura de las manos mejora, con respuestas a indicaciones más sensibles y ajustes de color más agresivos. (Debido a datos limitados, no se puede garantizar un efecto integral completo)
V4_RC1:
V4 ha sido entrenado localmente durante cientos de horas, con el cuerpo de datos etiquetado con GPT4V y parcialmente con WD1.4+cog.
El modelo también ha enfrentado cierta sobreajuste, para lo que se aplicó la primera ronda de MBW para mitigarlo.
En comparación con la versión anterior de V4, la estructura de las manos es relativamente mejor, la respuesta a indicaciones es más sensible y el ajuste de color más radical. (Debido a datos limitados, no se garantiza un efecto integral.)
Instrucciones de uso:
Generalmente uso DPM++2M K o restart, muestro 30-40 (restart 20), clip stop 1, CFG: 5-7
En ADetailer, redibujar borde con desenfoque 20, amplitud 0.4.
Se puede emplear refiner0.8 para obtener mejores detalles de alta frecuencia.
La reparación en alta definición usa 8x_NMKD-Superscale_150000_G, con ampliación 1.5, 12 iteraciones, amplitud 0.35.
Palabras clave negativas: (worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), lunares, manchas en la piel, (esta versión puede presentar defectos en la piel, añadir estas dos ayuda a mitigarlos)
Instructions for use:
normalmente uso DPM++2M K o restart, muestreo 30-40 (restart 20), clip termina 1pm CFG restart20 5-7.
En ADetailer, redibujar bordes con desenfoque 20 y amplitud 0.4.
Se puede usar refiner0.8 para mejores detalles de alta frecuencia.
Reparación HD con 8x_NMKD-Superscale_150000_G, zoom 1.5, 12 iteraciones, rango 0.35.
Prompts negativos: (worst quality, low quality, illustration, 3D, 2d, painting, cartoons, sketch), lunares, manchas en la piel, (esta versión puede tener defectos, añadir los dos últimos ayuda a mitigar).
El modelo puede tener problemas aún, ahora usa marcado GPT4V + nuevo proceso de reentrenamiento.


Versión oficial V3 descripción:
Entrenamiento en lenguaje natural en FP32, sin palabras gatillo fijas, sin problemas detectados en el muestreador. Si la raza no es estable, se recomienda ingresar asiático para reforzar el gatillo. Activar reparaciones HD y faciales según sea necesario (no se recomienda reparación facial en escenas con primer plano total de rostro).
2.1.2:
Ahora la mayoría de muestreadores no generan ruido excesivo en la mayoría de escenas, refiner ya no es obligatorio y After Detailer funciona normal. El resto sigue igual que antes.
DPM++ 2M Karras, Euler y Restart tienen mejor rendimiento.
La mayoría de los métodos de muestreo ya no generan ruido excesivo en la mayoría de escenarios, por lo que refiner ya no es necesario y After Detailer puede usarse con normalidad.
DPM++2M Karras, Euler y Restart tienen mejor desempeño. Lo demás sigue igual que abajo.
2.1.0:
1: He hecho muchas pruebas, y actualmente recomiendo usar los muestreadores euler y euler a, pasos óptimos recomendados 50, se puede usar refiner, momento de cambio 0.9.
Otros muestreadores generan ruido excesivo en algunas escenas; se puede usar refiner para reducirlo efectivamente. Pero al activar ADetailer se vuelve a añadir ruido, causando casi inutilidad. Si usas otros muestreadores, no actives el plugin de reparación facial, usa reparación HD, problema principal actual.
2: CILP: 2 (entrenamiento con 1, sin diferencia al probar con 2)
3: Se recomienda activar ADetailer sólo con muestreadores euler y euler a.
4: Resolución: 896x1152 (o la recomendada oficialmente)
Parte de palabras clave:
1: Se usaron nuevos modelos para etiquetado, modelo cilp: VIT-L-14/openai, modelo captain: bilp2-flan-t5-xl. Cuando no sabes cómo describir la imagen, intenta usar estos modelos para inferir las palabras clave, logrando el mejor resultado.
2: Sobre palabras de invocación: hice pruebas y afectan algo la imagen, pero poco; aun así recomiendo usarlas.
3: ¡Clave importante! Revisé todos los archivos de subtítulos y resumí varias tags eficaces: ulzzang, naver fanpop, ffffffound, streaming on twitch, character album cover, que aparecen con más frecuencia tras las palabras de invocación. Puedes agregarlas juntas como inicio, con buen efecto.
4: Sobre palabras positivas, uso generalmente estas dos: <lora:DetailedEyes_xl_V2:1>,<lora:neg4all_bdsqlsz_xl_V7:1>, ambas de @bdsqlsz, casi sin contaminación. Reparación de manos <lora:ClearHand-V2:1> de @frostyforest, maneja bien relaciones simples de manos, situación compleja es un reto.
5: Palabras negativas: (worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), piel grasa,
Finalmente, este es mi grupo de QQ 749047075, contraseña: SDS. Invitados a unirse para discutir. Nuevos modelos los probaré primero internamente.
Sección de recordatorios:
1: Usamos nuevo modelo de marcado, modelo cip: VIT-L-14/openai y modelo capture: bilp2-flan-t5-xl. Por ello, cuando no sepas describir la imagen, prueba con estos para inferir palabras clave consiguiendo buen resultado.
2: Sobre palabras de invocación: hice test y aunque impactan poco en la imagen, se recomienda usarlas.
3: Lo clave: compilé todos los archivos de subtítulos y resumí los tags más efectivos: ulzzang, naver fanpop, ffffffound, streaming on twitch, character album cover. Estas son las más frecuentes tras las palabras de invocación. Agrégalas todas al principio para buen resultado.
4: Sobre indicaciones positivas, suelo usar estas dos: <lora:DetailedEyes_xl_V2:1>,<lora:neg4all_bdsqlsz_xl_V7:1>, ambas de @bdsqlsz, casi sin contaminación. Reparación de manos <lora:ClearHand-V2:1> de @frostyforest, buena para relaciones simples de manos, retos en casos complejos.
5: Palabras negativas: (worst quality, low quality, illustration, 3d, 2d, painting, cartons, sketch), piel grasa,
Por último, mi grupo QQ es 749047075, contraseña SDS. Invitados a unirse para discusión, nuevos modelos serán testeados primero interno.
Sampler/Pasos / Sampler/Steps:
Palabras de invocación / trigger word

Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.







