Retrato de la Reina Seelie con vestido dorado tejido de granos, coronada con amapolas rojas y cebada, de pie en un huerto fae con luz dorada brillante y espíritus de grano revoloteando.
Primer plano en blanco y negro de una mujer con cabello mojado, besado por la lluvia, parcialmente desintegrándose en partículas coloridas del arcoíris que se desplazan hacia la izquierda.
Un gato atigrado naranja y blanco acurrucado dentro de una botella de vidrio tapada con corcho en una estantería, rodeado de botellas con otros animales atrapados como un tucán, jirafa, elefante y cerdo.
Foto en blanco y negro de una mujer de cabello oscuro con un vestido de encaje oscuro de pie en un bosque iluminado por el sol con rayos de luz y un cielo dramático al fondo.
Un esqueleto steampunk vestido con un abrigo sastre, corbatín con volantes y un sombrero de copa con gafas de filigrana de latón, posando contra un papel tapiz en relieve.
Representación realista del Pokémon Haunter flotando sobre un hombre dormido, absorbiendo sus sueños con energía púrpura oscura.
Husky siberiano fotorrealista con equipo de operaciones especiales en camuflaje nevado de pie en un bosque de pinos nevado con destellos de luz.
Primer plano de un caballero de hielo hiperrealista con armadura de piedra agrietada y casco con cuernos, envuelto en llamas etéreas azul-negras, con un cuervo de escarcha posado en el guantelete del hombro.
Una pequeña criatura Sin Corazón con grandes ojos amarillos y antenas alcanzando un cristal de corazón rojo brillante flotante, ambientado en un fondo oscuro y tenebroso de fantasía con figuras sombrías y un contorno púrpura de Traverse Town.
Pintura surrealista de un gato majestuoso y musculoso listo para atacar, con formas biomórficas inspiradas en Joan Miro y elementos abstractos que recuerdan a Frida Kahlo.

Consejos

Usa la generación de múltiples turnos de GPT-4o para refinar imágenes mediante conversación natural y obtener iteraciones de diseño coherentes.

Aprovecha la capacidad de GPT-4o para combinar símbolos precisos con imágenes para mejorar la comunicación visual.

Utiliza el aprendizaje en contexto cargando imágenes para informar y mejorar nuevas generaciones de imágenes.

Consulta la guía sobre el uso de GPT Image 1 para consejos adicionales.

Patrocinadores del Creador

Originalmente detallado en - https://openai.com/index/introducing-4o-image-generation/

Actualización 8/5: Hemos lanzado un selector de calidad y ajustado los precios! Ahora las imágenes de calidad Media cuestan 100 Buzz ⚡

Consulta nuestra Guía para usar GPT Image 1!

Originalmente detallado en - https://openai.com/index/introducing-4o-image-generation/

Actualización 8/5: Hemos lanzado un selector de calidad y ajustado los precios! Ahora las imágenes de calidad Media cuestan 100 Buzz ⚡

Consulta nuestra Guía para usar GPT Image 1!

Generación útil de imágenes

Desde las primeras pinturas en cuevas hasta las infografías modernas, los humanos han utilizado imágenes visuales para comunicar, persuadir y analizar, no solo para decorar. Los modelos generativos de hoy pueden conjurar escenas surrealistas e impresionantes, pero luchan con las imágenes básicas que las personas usan para compartir y crear información. Desde logotipos hasta diagramas, las imágenes pueden transmitir un significado preciso cuando se complementan con símbolos que hacen referencia a un lenguaje y experiencia compartidos.

La generación de imágenes GPT‑4o sobresale en la representación precisa del texto, el seguimiento exacto de indicaciones y el aprovechamiento de la base de conocimiento inherente a 4o y el contexto del chat, incluyendo la transformación de imágenes cargadas o su uso como inspiración visual. Estas capacidades facilitan la creación exacta de la imagen que imaginas, ayudándote a comunicarte más eficazmente a través de visuales y avanzando la generación de imágenes como una herramienta práctica con precisión y potencia.

Capacidades mejoradas

Entrenamos nuestros modelos en la distribución conjunta de imágenes y textos en línea, aprendiendo no solo cómo las imágenes se relacionan con el lenguaje, sino también cómo se relacionan entre sí. Combinado con un postentrenamiento agresivo, el modelo resultante tiene una fluidez visual sorprendente, capaz de generar imágenes útiles, consistentes y conscientes del contexto.

Representación de texto

Una imagen vale más que mil palabras, pero a veces generar unas pocas palabras en el lugar correcto puede realzar el significado de una imagen. La habilidad de 4o para mezclar símbolos precisos con imágenes convierte la generación de imágenes en una herramienta para la comunicación visual.

Generación de múltiples turnos

Debido a que la generación de imágenes ahora es nativa en GPT‑4o, puedes refinar imágenes mediante conversación natural. GPT‑4o puede construir sobre imágenes y texto en el contexto del chat, asegurando coherencia en todo momento. Por ejemplo, si diseñas un personaje de videojuego, la apariencia del personaje permanece coherente a lo largo de múltiples iteraciones mientras refinas y experimentas.

Seguimiento de instrucciones

La generación de imágenes GPT‑4o sigue indicaciones detalladas con atención al detalle. Mientras otros sistemas luchan con unos 5-8 objetos, GPT‑4o puede manejar hasta 10-20 objetos diferentes. La vinculación más estricta de objetos con sus rasgos y relaciones permite un mejor control.

Aprendizaje en contexto

GPT‑4o puede analizar y aprender de imágenes cargadas por el usuario, integrando sin problemas sus detalles en su contexto para informar la generación de imágenes.

Seguridad

En concordancia con nuestra Especificación del Modelo, buscamos maximizar la libertad creativa apoyando casos de uso valiosos como desarrollo de videojuegos, exploración histórica y educación, manteniendo al mismo tiempo altos estándares de seguridad. Al mismo tiempo, sigue siendo tan importante como siempre bloquear solicitudes que violen esos estándares. A continuación, evaluaciones de áreas de riesgo adicionales en las que trabajamos para permitir contenido seguro y de alta utilidad, y apoyar una expresión creativa más amplia para los usuarios.

Procedencia vía C2PA y búsqueda reversible interna
Todas las imágenes generadas incluyen metadatos C2PA, que identifican la imagen como proveniente de GPT‑4o para brindar transparencia. También hemos desarrollado una herramienta interna de búsqueda que usa atributos técnicos de las generaciones para ayudar a verificar si el contenido proviene de nuestro modelo.

Bloqueo de contenido inapropiado
Continuamos bloqueando solicitudes para imágenes generadas que puedan violar nuestras políticas de contenido, como material de abuso sexual infantil y deepfakes sexuales. Cuando hay imágenes de personas reales en contexto, tenemos restricciones estrictas sobre el tipo de imágenes que pueden crearse, con salvaguardas particularmente robustas en torno a desnudos y violencia gráfica. Como con cualquier lanzamiento, la seguridad nunca termina y es un área de inversión continua. A medida que aprendemos más sobre el uso real de este modelo, ajustaremos nuestras políticas en consecuencia.

Para más información sobre nuestro enfoque, visita el anexo a la tarjeta del sistema GPT‑4o⁠ de generación de imágenes.

Uso del razonamiento para potenciar la seguridad
Similar a nuestro trabajo de alineación deliberativa⁠, entrenamos un LLM de razonamiento para trabajar directamente con especificaciones de seguridad escritas e interpretables por humanos. Usamos este LLM de razonamiento durante el desarrollo para ayudarnos a identificar y resolver ambigüedades en nuestras políticas. Junto con nuestros avances multimodales y técnicas de seguridad existentes desarrolladas para ChatGPT y Sora, esto nos permite moderar⁠ tanto el texto de entrada como las imágenes de salida conforme a nuestras políticas.

Anterior
"Delicate Balance" Estilo Semi-realista [Flux.1 D] por AutoPastel - V1
Siguiente
Leche Vegetal 🌿 - Suite de Modelos - Walnut

Detalles del Modelo

Tipo de modelo

Checkpoint

Modelo base

OpenAI

Versión del modelo

4o Image Gen 1

Hash del modelo

2a6b480dca

Creador

Discusión

Por favor log in para dejar un comentario.

Imágenes por GPT-image-1 de OpenAI - 4o Image Gen 1

Retrato de la Reina Seelie con vestido dorado tejido de granos, coronada con amapolas rojas y cebada, de pie en un huerto fae con luz dorada brillante y espíritus de grano revoloteando.
Primer plano en blanco y negro de una mujer con cabello mojado, besado por la lluvia, parcialmente desintegrándose en partículas coloridas del arcoíris que se desplazan hacia la izquierda.
Un gato atigrado naranja y blanco acurrucado dentro de una botella de vidrio tapada con corcho en una estantería, rodeado de botellas con otros animales atrapados como un tucán, jirafa, elefante y cerdo.
Foto en blanco y negro de una mujer de cabello oscuro con un vestido de encaje oscuro de pie en un bosque iluminado por el sol con rayos de luz y un cielo dramático al fondo.
Un esqueleto steampunk vestido con un abrigo sastre, corbatín con volantes y un sombrero de copa con gafas de filigrana de latón, posando contra un papel tapiz en relieve.
Representación realista del Pokémon Haunter flotando sobre un hombre dormido, absorbiendo sus sueños con energía púrpura oscura.
Husky siberiano fotorrealista con equipo de operaciones especiales en camuflaje nevado de pie en un bosque de pinos nevado con destellos de luz.
Primer plano de un caballero de hielo hiperrealista con armadura de piedra agrietada y casco con cuernos, envuelto en llamas etéreas azul-negras, con un cuervo de escarcha posado en el guantelete del hombro.
Una pequeña criatura Sin Corazón con grandes ojos amarillos y antenas alcanzando un cristal de corazón rojo brillante flotante, ambientado en un fondo oscuro y tenebroso de fantasía con figuras sombrías y un contorno púrpura de Traverse Town.
Pintura surrealista de un gato majestuoso y musculoso listo para atacar, con formas biomórficas inspiradas en Joan Miro y elementos abstractos que recuerdan a Frida Kahlo.

Imágenes con modelo base

Escena fotorrealista de personajes no muertos incluyendo zombis y esqueletos caminando por un cementerio tenebroso iluminado por calabazas Jack-o'-lantern brillantes bajo un cielo oscuro y ominoso.