OpenAI Introduce Nuevas Capacidades Visuales y de Manipulación de Imágenes en ChatGPT

0
Fotografía de archivo de una computadora con la portada de ChatGPT, un programa de inteligencia artificial desarrollada por la empresa OpenAI. EFE/ Latif Kassidi

NUEVA YORK, 17 de abril — La empresa tecnológica OpenAI anunció este miércoles una actualización significativa para su popular chatbot de inteligencia artificial (IA), ChatGPT, que ahora puede interpretar y manipular imágenes, incluso si estas son de baja calidad o están borrosas. Esta nueva funcionalidad marca un avance importante en la capacidad del modelo para interactuar con contenido visual.


Nuevos Modelos: o3 y o4-mini

La compañía lanzó dos nuevos modelos de razonamiento avanzado, llamados o3 y o4-mini, diseñados para permitir que ChatGPT no solo «vea» imágenes, sino que también las «piense» y las manipule dinámicamente. Estos modelos pueden analizar fotografías, diagramas de libros, esquemas técnicos e incluso dibujos hechos a mano. Además, tienen la capacidad de editar imágenes sobre la marcha, girándolas, ampliándolas o realizando otras modificaciones según sea necesario.

Según OpenAI, dirigida por Sam Altman, el modelo o3 es el más potente desarrollado hasta la fecha y destaca especialmente en tareas visuales complejas, como el análisis de imágenes, tablas y gráficos. En comparación con su predecesor, o1, el nuevo modelo comete un 20 % menos de errores en áreas como la programación y la consultoría empresarial. Por otro lado, o4-mini ofrece mejor rendimiento en campos específicos como la ciencia de datos, manteniendo respuestas más naturales y personalizadas.

«El modelo no solo ve las imágenes, sino que también piensa con ellas», señaló OpenAI en un comunicado.


Mejoras en la Interacción y Personalización

Ambos modelos, o3 y o4-mini, están diseñados para seguir instrucciones de manera más precisa y ofrecer respuestas más fluidas y conversacionales. Esto los hace ideales para aplicaciones prácticas en diversos sectores, desde la consultoría empresarial hasta la educación y la ciencia de datos.

Además, los nuevos modelos pueden combinar dinámicamente todas las herramientas disponibles en ChatGPT, como la búsqueda en internet, el análisis de archivos y otros datos, para producir respuestas detalladas y resolver problemas más complejos en menos de un minuto.


Un Paso hacia la IA Multimodal

Esta actualización representa un paso crucial hacia una IA multimodal, donde los sistemas de inteligencia artificial pueden procesar y combinar múltiples tipos de datos (texto, imágenes, audio, etc.) de manera integrada. Según OpenAI, esta es la primera vez que sus modelos de razonamiento pueden utilizar de forma combinada todas las herramientas disponibles en ChatGPT, lo que amplía considerablemente su utilidad en situaciones del mundo real.


Posible Adquisición de Windsurf

En noticias relacionadas, el portal especializado CNBC informó que OpenAI está en negociaciones para adquirir Windsurf, una herramienta de IA enfocada en la codificación, por aproximadamente 3,000 millones de dólares. Windsurf compite con funciones de codificación de empresas como Microsoft y Anthropic, así como con las propias capacidades de OpenAI.

Esta posible adquisición podría reforzar aún más la posición de OpenAI en el campo de la inteligencia artificial, especialmente en áreas como la automatización de software y la generación de código.


Conclusión: Un Futuro Más Visual para la IA

¿Qué significa esta actualización? La capacidad de ChatGPT para interpretar y manipular imágenes abre nuevas posibilidades en campos como la educación, la medicina, la ingeniería y la consultoría empresarial. Además, refuerza la tendencia hacia modelos de IA más versátiles y multimodales, capaces de procesar información de diversas formas.

Con estos avances, OpenAI sigue consolidándose como uno de los líderes en el desarrollo de tecnologías de inteligencia artificial, mientras explora nuevas formas de integrar herramientas avanzadas en aplicaciones prácticas. Sin embargo, la posible compra de Windsurf también sugiere que la competencia en el sector de la IA está intensificándose, lo que podría llevar a innovaciones aún más rápidas en los próximos años.

El futuro de la IA parece cada vez más visual, interactiva y accesible, y ChatGPT está a la vanguardia de esta transformación.

Publicidad