GPT-image-1 de OpenAI - 4o Image Gen 1
Palabras Clave y Etiquetas Relacionadas
Consejos
Usa la generación de múltiples turnos de GPT-4o para refinar imágenes mediante conversación natural y obtener iteraciones de diseño coherentes.
Aprovecha la capacidad de GPT-4o para combinar símbolos precisos con imágenes para mejorar la comunicación visual.
Utiliza el aprendizaje en contexto cargando imágenes para informar y mejorar nuevas generaciones de imágenes.
Consulta la guía sobre el uso de GPT Image 1 para consejos adicionales.
Patrocinadores del Creador
Originalmente detallado en - https://openai.com/index/introducing-4o-image-generation/
Actualización 8/5: Hemos lanzado un selector de calidad y ajustado los precios! Ahora las imágenes de calidad Media cuestan 100 Buzz ⚡
Consulta nuestra Guía para usar GPT Image 1!
Originalmente detallado en - https://openai.com/index/introducing-4o-image-generation/
Actualización 8/5: Hemos lanzado un selector de calidad y ajustado los precios! Ahora las imágenes de calidad Media cuestan 100 Buzz ⚡
Consulta nuestra Guía para usar GPT Image 1!
Generación útil de imágenes
Desde las primeras pinturas en cuevas hasta las infografías modernas, los humanos han utilizado imágenes visuales para comunicar, persuadir y analizar, no solo para decorar. Los modelos generativos de hoy pueden conjurar escenas surrealistas e impresionantes, pero luchan con las imágenes básicas que las personas usan para compartir y crear información. Desde logotipos hasta diagramas, las imágenes pueden transmitir un significado preciso cuando se complementan con símbolos que hacen referencia a un lenguaje y experiencia compartidos.
La generación de imágenes GPT‑4o sobresale en la representación precisa del texto, el seguimiento exacto de indicaciones y el aprovechamiento de la base de conocimiento inherente a 4o y el contexto del chat, incluyendo la transformación de imágenes cargadas o su uso como inspiración visual. Estas capacidades facilitan la creación exacta de la imagen que imaginas, ayudándote a comunicarte más eficazmente a través de visuales y avanzando la generación de imágenes como una herramienta práctica con precisión y potencia.
Capacidades mejoradas
Entrenamos nuestros modelos en la distribución conjunta de imágenes y textos en línea, aprendiendo no solo cómo las imágenes se relacionan con el lenguaje, sino también cómo se relacionan entre sí. Combinado con un postentrenamiento agresivo, el modelo resultante tiene una fluidez visual sorprendente, capaz de generar imágenes útiles, consistentes y conscientes del contexto.
Representación de texto
Una imagen vale más que mil palabras, pero a veces generar unas pocas palabras en el lugar correcto puede realzar el significado de una imagen. La habilidad de 4o para mezclar símbolos precisos con imágenes convierte la generación de imágenes en una herramienta para la comunicación visual.
Generación de múltiples turnos
Debido a que la generación de imágenes ahora es nativa en GPT‑4o, puedes refinar imágenes mediante conversación natural. GPT‑4o puede construir sobre imágenes y texto en el contexto del chat, asegurando coherencia en todo momento. Por ejemplo, si diseñas un personaje de videojuego, la apariencia del personaje permanece coherente a lo largo de múltiples iteraciones mientras refinas y experimentas.
Seguimiento de instrucciones
La generación de imágenes GPT‑4o sigue indicaciones detalladas con atención al detalle. Mientras otros sistemas luchan con unos 5-8 objetos, GPT‑4o puede manejar hasta 10-20 objetos diferentes. La vinculación más estricta de objetos con sus rasgos y relaciones permite un mejor control.
Aprendizaje en contexto
GPT‑4o puede analizar y aprender de imágenes cargadas por el usuario, integrando sin problemas sus detalles en su contexto para informar la generación de imágenes.
Seguridad
En concordancia con nuestra Especificación del Modelo, buscamos maximizar la libertad creativa apoyando casos de uso valiosos como desarrollo de videojuegos, exploración histórica y educación, manteniendo al mismo tiempo altos estándares de seguridad. Al mismo tiempo, sigue siendo tan importante como siempre bloquear solicitudes que violen esos estándares. A continuación, evaluaciones de áreas de riesgo adicionales en las que trabajamos para permitir contenido seguro y de alta utilidad, y apoyar una expresión creativa más amplia para los usuarios.
Procedencia vía C2PA y búsqueda reversible interna
Todas las imágenes generadas incluyen metadatos C2PA, que identifican la imagen como proveniente de GPT‑4o para brindar transparencia. También hemos desarrollado una herramienta interna de búsqueda que usa atributos técnicos de las generaciones para ayudar a verificar si el contenido proviene de nuestro modelo.
Bloqueo de contenido inapropiado
Continuamos bloqueando solicitudes para imágenes generadas que puedan violar nuestras políticas de contenido, como material de abuso sexual infantil y deepfakes sexuales. Cuando hay imágenes de personas reales en contexto, tenemos restricciones estrictas sobre el tipo de imágenes que pueden crearse, con salvaguardas particularmente robustas en torno a desnudos y violencia gráfica. Como con cualquier lanzamiento, la seguridad nunca termina y es un área de inversión continua. A medida que aprendemos más sobre el uso real de este modelo, ajustaremos nuestras políticas en consecuencia.
Para más información sobre nuestro enfoque, visita el anexo a la tarjeta del sistema GPT‑4o de generación de imágenes.
Uso del razonamiento para potenciar la seguridad
Similar a nuestro trabajo de alineación deliberativa, entrenamos un LLM de razonamiento para trabajar directamente con especificaciones de seguridad escritas e interpretables por humanos. Usamos este LLM de razonamiento durante el desarrollo para ayudarnos a identificar y resolver ambigüedades en nuestras políticas. Junto con nuestros avances multimodales y técnicas de seguridad existentes desarrolladas para ChatGPT y Sora, esto nos permite moderar tanto el texto de entrada como las imágenes de salida conforme a nuestras políticas.
Detalles del Modelo
Tipo de modelo
Modelo base
Versión del modelo
Hash del modelo
Creador
Discusión
Por favor log in para dejar un comentario.
