OpenAI está lanzando una nueva versión de ChatGPT Images que promete un mejor seguimiento de instrucciones, edición más precisa y velocidades de generación de imágenes hasta 4 veces más rápidas.
El nuevo modelo, denominado GPT-Image-1.5, está disponible a partir del martes para todos los usuarios de ChatGPT y a través de la API. Es la última escalada en la competencia con Gemini de Google, después de que el mes pasado el CEO de OpenAI, Sam Altman, declarara un “código rojo” en un memorando interno filtrado. El memorando detallaba los planes de OpenAI para recuperar su posición como líder en IA después de que Google comenzara a ganar cuota de mercado tras el lanzamiento de Gemini 3, su último modelo insignia, y Nano Banana Pro, la versión más reciente del generador de imágenes viral de Google, ambos encabezando el ranking de LMArena en múltiples benchmarks.
Google mantiene su liderazgo incluso después de que OpenAI respondiera a su éxito la semana pasada con el lanzamiento de GPT-5.2, presentándolo como su modelo más avanzado hasta la fecha para desarrolladores y uso profesional cotidiano. Según se informa, OpenAI había planeado lanzar un nuevo generador de imágenes a principios de enero, acelerando esos planes con el anuncio de esta semana. Su último lanzamiento de modelo de imágenes fue GPT-Image-1 en abril.
GPT-Image-1.5 llega en un momento en que los generadores de imágenes y videos avanzan más allá de los prototipos y adquieren capacidades más listas para producción. Al igual que Nano Banana Pro, ChatGPT Images ofrece funciones de postproducción, proporcionando controles de edición más detallados para mantener la coherencia visual, como la semejanza facial, la iluminación, la composición y el tono de color a lo largo de las ediciones.
La misma imagen mostrada arriba con diferentes ediciones para demostrar la mejora en el seguimiento de instrucciones de GPT-Image-1.5. Créditos de la imagen:OpenAI La mayoría de las herramientas GenAI de imágenes son malas en la iteración, por lo que esto sería un gran avance. Cuando se solicita un cambio específico, como ‘ajustar la expresión facial’ o ‘hacer la iluminación más fría’, los modelos a menudo reinterpretan toda la imagen, lo que lleva a una falta de coherencia.
La actualización no solo trata de nuevas funciones. ChatGPT Images también será accesible ahora a través de un punto de entrada dedicado en la barra lateral de ChatGPT que funciona “más como un estudio creativo”, escribió Fidji Simo, CEO de aplicaciones de OpenAI, en una publicación de blog el martes.
“Las nuevas pantallas de visualización y edición de imágenes facilitan la creación de imágenes que coincidan con tu visión o encontrar inspiración en tendencias y filtros preestablecidos”, escribió Simo.
Únete a la lista de espera de Disrupt 2026
Añádete a la lista de espera de Disrupt 2026 para ser el primero en la fila cuando salgan las entradas Early Bird. Disrupts anteriores han traído a Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil y Vinod Khosla al escenario — parte de más de 250 líderes de la industria impulsando más de 200 sesiones diseñadas para impulsar tu crecimiento y afilar tu ventaja. Además, conoce a cientos de startups que innovan en todos los sectores.
Únete a la lista de espera de Disrupt 2026
Añádete a la lista de espera de Disrupt 2026 para ser el primero en la fila cuando salgan las entradas Early Bird. Disrupts anteriores han traído a Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil y Vinod Khosla al escenario — parte de más de 250 líderes de la industria impulsando más de 200 sesiones diseñadas para impulsar tu crecimiento y afilar tu ventaja. Además, conoce a cientos de startups que innovan en todos los sectores.
Además del nuevo generador de imágenes, OpenAI está introduciendo nuevas formas de mejorar la experiencia de ChatGPT con más elementos visuales. El plan es hacer que las consultas de búsqueda muestren más elementos visuales con fuentes claras, lo que podría ser útil para tareas como convertir medidas o consultar resultados deportivos, según Simo.
“Cuando estés creando, deberías poder ver y dar forma a lo que estás haciendo. Cuando los elementos visuales cuentan una historia mejor que solo palabras, ChatGPT debería incluirlos”, escribió Simo. “Cuando necesites una respuesta rápida o el siguiente paso esté en otra herramienta, debería estar justo ahí. A medida que hacemos esto, podemos seguir acortando la distancia entre lo que tienes en mente y tu capacidad para hacerlo realidad.”


