modelos/The Araminta Experiment (SDXL+Flux) - Fv3

The Araminta Experiment (SDXL+Flux) - Fv3

10/14/2025

1:08:27 AM

Palabras Clave y Etiquetas Relacionadas

todo propósito,aramintastudio,modelo base,punto de control,flux1-a1,fv3,gv4,contenido para adultos,fotorrealista,realista,sdxl 1.0,sdxl ilustración,sdxl fotorrealista,stable diffusion xl,el experimento araminta (sdxl+flux),mujer

Una joven con alas de insecto y orejas rojas de gato patinando rápidamente por una calle de ciudad borrosa, vistiendo un corsé, falda estampada y botas altas carmesí con tacón.

Prompts Recomendados

(photography by Jimmy Nelson and Sally Mann:1.0), (anus gaping), eye contact, (petite-bodied African) girl with her ass spread apart, hairy asshole, rear view, beautiful out of focus background

Prompts Negativos Recomendados

child, big boobs, ((watermark)), ((make-up)), censored, low-res, low quality, dull, overcooked, artefacts, JPEG artefacts, poor quality, deformed, missing limb, extra limb

Parámetros Recomendados

samplers

DPM++ 2M SDE Karras, DPM++ 3M SDE Karras, DPM++ 2M SDE Exponential, DPM++ SDE Karras, Euler Ancestral, Euler, dpmpp_3m_sde, dpmpp_3m_sde_gpu, DPM++ 3M SDE Exponential

steps

12 - 25

cfg

4 - 11

Consejos

Para modelos SDXL, usa más de 25 pasos y CFG alrededor de 5-7 con samplers como DPM++ 2/3M SDE Karras o Exponential.

Prueba DPM++ SDE Karras con menos pasos (por ejemplo, 12) y CFG más alto (8-11) para resultados diferentes.

El sampler Euler Ancestral / Normal puede dar resultados menos detallados, útil con Fv6 para imágenes menos ruidosas.

El valor predeterminado de CLIP Skip es 2; 1 aumenta la adherencia al prompt, 3-4 a veces mejora el enfoque en conceptos.

El CFG del modelo Flux es sensible; para fotos mantén CFG bajo (1.5-2.5) para evitar efecto de piel plástica.

Para estilos toscos en Flux, mantén CFG bajo (1.5-2.5); para estilo anime/cómic, se recomienda CFG más alto (3-6+).

Aspectos Destacados de la Versión

Versión F mejorada con representación NSFW más realista: mejor comprensión de conceptos y mejor textura de piel (ver imágenes comparativas)

Basado en Fv2 con la fusión de batchXLPHOTOREAL_v1 así como algunas Loras entrenadas personalmente.

Patrocinadores del Creador

Si disfrutas mi contribución a esta comunidad, siéntete libre de invitarme un café: cuanto más cafeína tomo, más modelos puedo crear 😅

Galería de comparación aquí: Fv6-Fv5 y comparación de ilustraciones NSFW entre Gv1-Cv6-Fv2.

Modelo SOTA actual en mi experimento:

Modelo Base SDXL: Gv4 es el modelo más equilibrado que permite imágenes realistas y estilizadas NSFW y SFW. Mejor estética que Fv6 pero menos fotorrealista.
Modelo fotorealista SDXL (SFW y NSFW): Fv6 es la opción para hiperrealismo incluyendo imágenes NSFW realistas pero carece en su mayoría del estilo de Gv4.
Ilustración SDXL : Gv4 (SFW y NSFW). Cv6 aún vale la pena probar si no te interesan las imágenes NSFW.

Modelo Flux: Flux1-A1

Configuraciones para generación de imágenes en modelos SDXL

DPM++ 2/3M SDE / Karras o Exponential siempre son una buena elección con más de 25 pasos y CFG alrededor de 5-7. Pero DPM++ SDE / Karras con menos pasos (por ejemplo 12) y CFG más alto (8-11) vale la pena probar, igual que Euler Ancestral / Normal para un resultado menos detallado que puede ser interesante con un modelo como Fv6 para obtener algo menos "ruidoso".

El valor predeterminado CLIP Skip de 2 también es una buena opción, pero usar 1 o 3-4 también vale la pena probar: 1 empuja más hacia la adherencia al prompt y 3-4 a veces da un mejor resultado enfocándose más en los "conceptos".

Configuraciones para generación de imágenes en modelos Flux

Mis configuraciones preferidas son DPM++ 2M / beta o sgm_uniform o DDEIS / normal para el sampler / scheduler, beta para una imagen más audaz y fuerte. Para una imagen más sutil, Euler / simple o beta parece una buena opción.

El CFG parece tener un gran impacto en la imagen final y ser muy sensible incluso a pequeñas variaciones.

Para fotos, el CFG debe mantenerse bajo (1.5-2.5) para evitar piel plástica.
Para arte fino e ilustración es más complicado porque depende del medio. Para estilos "toscos" (pintura, acuarelas, etc.) el CFG debe mantenerse bastante bajo en el rango de 1.5-2.5 pero para estilo anime o cómic, a menudo el CFG debe aumentarse para lograr el estilo deseado (3-6 o más).

Si la imagen está desordenada/malformed o borrosa, a menudo es porque el CFG/pasos no son adecuados para esa imagen, pero no siempre es fácil saber si el CFG/pasos deben aumentarse o disminuirse (al menos para mí 😊).

Seguro hay mucho por aprender sobre el comportamiento de Flux que es bastante diferente a SDXL y necesitaremos adaptarnos.

Flujo de trabajo

Todas mis imágenes se suben con el flujo de trabajo ComfyUI incrustado que lamentablemente es incompatible con el procesamiento de CivitAI y la mayoría de las veces no se puede recuperar el prompt. Sin embargo, puedes descargar la imagen PNG original con el flujo de trabajo incluido haciendo clic en el icono "DOWNLOAD" en el visor de imágenes.

Intento publicar imágenes principalmente de mi modelo con quizás un poco de Lora (mío o algún potenciador de detalles), también a veces uso Controlnet para obtener composiciones más detalladas más fácilmente; en este caso la imagen fuente obviamente no está en el flujo de trabajo, pero supongo que aún puedes usar la imagen que publico como fuente si quieres hacer una variación :)

Pasado

A partir de la serie E, los modelos evolucionan a veces fusionándose con otros modelos (¡gracias a otros contribuyentes!), pero principalmente mediante entrenamiento con mi propio conjunto de datos: un conjunto modesto (~2000 imágenes actualmente), pero trato de compensar de alguna manera con calidad y originalidad.

Desde Fv1, he incluido muchas imágenes sintéticas que creé usando versiones anteriores: jugando duro con el prompt y retocando cuando es necesario el resultado en Photoshop para tener un conjunto que contenga muchas imágenes originales.

La idea central detrás de este modelo fue crear una herramienta versátil fusionando algunos de los mejores modelos existentes que se ajustan a mi gusto personal (fotografía y arte fantástico para simplificar). Mis objetivos principales fueron:

Fotorrealismo: La capacidad de producir imágenes sorprendentemente realistas tanto de personas como de objetos/naturaleza.
Flexibilidad: La capacidad de crear imágenes altamente estilizadas, permitiendo la expresión artística a través de varios estilos y combinaciones de artistas. Soy de una generación mayor y vengo de Europa, por lo que "estilo" no significa para mí "anime kawaii japonés con pechos" o "cómic de DC con muchos superhéroes y chicas rubias voluptuosas", sino más bien un universo de Frank Frazetta, Milo Manara, Boris Vallejo, H.R.Giger, Wojtek Siudmak y tales maestros del arte fantástico: seguro hay pechos involucrados, pero el estilo es algo diferente :P
Como no me gusta estar limitado en mi exploración del cuerpo humano, la idea es también tener un modelo NSFW bastante capaz. Sin embargo, debido a la naturaleza de las imágenes de entrenamiento disponibles en los conjuntos de datos, NSFW a menudo viene con un fuerte sesgo hacia fotos porno o anime porno japonés y afecta la flexibilidad (típicamente tan pronto usas la palabra "sexy" en tu prompt necesitas considerar el estilo). Este punto NO es la prioridad para el modelo base pero se enfatiza en el modelo NSFW.