Perfil lateral de una mujer bella abstracta con maquillaje delicado y adornos tradicionales en el cabello, ambientada en un paisaje urbano nocturno con montañas y una gran luna.
Ilustración abstracta de una mujer con llamativo cabello rojo y pecas, vistiendo ropa oscura, sobre un cielo nocturno detallado con estrellas y patrones celestiales.

Parámetros Recomendados

steps

4 - null

Patrocinadores del Creador

Por favor vea nuestra Guía Rápida para Stable Diffusion 3.5 para toda la información más reciente!

Por favor vea nuestra Guía Rápida para Stable Diffusion 3.5 para toda la información más reciente!

Stable Diffusion 3.5 Large Turbo es un modelo de texto a imagen Multimodal Diffusion Transformer (MMDiT) con Adversarial Diffusion Distillation (ADD) que presenta un rendimiento mejorado en calidad de imagen, tipografía, entendimiento de prompts complejos y eficiencia en recursos, con un enfoque en menos pasos de inferencia.

Por favor note: Este modelo se publica bajo la Licencia Comunitaria de Stability. Visite Stability AI para más información o contáctenos para detalles de licenciamiento comercial.

Descripción del Modelo

  • Desarrollado por: Stability AI

  • Tipo de modelo: modelo generativo MMDiT de texto a imagen

  • Descripción del Modelo: Este modelo genera imágenes basadas en prompts de texto. Es un ADD-distilled Multimodal Diffusion Transformer que usa tres codificadores de texto fijos y preentrenados, con normalización QK.

Licencia

  • Licencia Comunitaria: Gratuita para investigación, uso no comercial y uso comercial para organizaciones o individuos con menos de $1M en ingresos anuales totales. Más detalles en el Acuerdo de Licencia Comunitaria. Lea más en https://stability.ai/license.

  • Para individuos y organizaciones con ingresos anuales superiores a $1M: Por favor contáctenos para obtener una Licencia Empresarial.

Fuentes del Modelo

Para uso local o autoalojado, recomendamos ComfyUI para inferencia con UI basada en nodos, o diffusers o GitHub para uso programático.

Detalles de Implementación

  • Normalización QK: Implementa la técnica de normalización QK para mejorar la estabilidad del entrenamiento.

  • Adversarial Diffusion Distillation (ADD) (véase el informe técnico), que permite muestrear con 4 pasos manteniendo alta calidad de imagen.

  • Codificadores de Texto:

  • Datos y Estrategia de Entrenamiento:

    Este modelo fue entrenado con una amplia variedad de datos, incluyendo datos sintéticos y datos públicos filtrados.

Para más detalles técnicos sobre la arquitectura original MMDiT, por favor consulte el artículo de investigación.

Anterior
Pikuson | Estilos de Shiiro - v1.0
Siguiente
Dragonhead - v1.0

Detalles del Modelo

Tipo de modelo

Checkpoint

Modelo base

SD 3.5 Large Turbo

Versión del modelo

Large Turbo

Hash del modelo

fb64610bf8

Creador

Discusión

Por favor log in para dejar un comentario.

Colección de Modelos - Stable Diffusion 3.5 Large Turbo

Imágenes por Stable Diffusion 3.5 Large Turbo - Large Turbo

Perfil lateral de una mujer bella abstracta con maquillaje delicado y adornos tradicionales en el cabello, ambientada en un paisaje urbano nocturno con montañas y una gran luna.
Ilustración abstracta de una mujer con llamativo cabello rojo y pecas, vistiendo ropa oscura, sobre un cielo nocturno detallado con estrellas y patrones celestiales.

Imágenes con modelo base

Escena fotorrealista de personajes no muertos incluyendo zombis y esqueletos caminando por un cementerio tenebroso iluminado por calabazas Jack-o'-lantern brillantes bajo un cielo oscuro y ominoso.

Imágenes con stability ai

Chica de estilo anime rubia con vestido blanco de verano y sombrero grande con decoración de girasol, parada felizmente en un campo de girasoles al atardecer con los brazos levantados.
Personaje Ffixgarnet con cabello largo negro y ojos marrones, vistiendo un traje cruzado naranja con mangas blancas abullonadas y guantes rojos, escalando una escalera de cuerda de madera contra un fondo de cielo azul, sonrojada y mirando hacia atrás
Personaje de anime con cabello fucsia y alas ígneas agachada en una pose dinámica contra un fondo púrpura y de fantasía oscura con rocas afiladas y dentadas.
Vista cercana de múltiples esferas negras texturizadas flotando sobre un fondo cósmico oscuro con luces de bokeh coloridas y oníricas.
Primer plano de un cyborg con casco mate negro sin rostro, cabello largo negro y armadura roja y negra intrincada que brilla débilmente en rojo en un entorno de ambiente oscuro.
Guerrera doncella con coletas verdes empuñando un arma de astil con sierra circular en una fábrica de robots con poca luz, con partes mecánicas y cables, salpicaduras de sangre en el suelo.