OpenAI presenta Operator, una IA que reserva restaurantes, hace la compra, compra vuelos y más
OpenAI ha lanzado oficialmente su primer agente de inteligencia artificial denominado Operator. Esta herramienta está diseñada para realizar tareas en la web de manera automatizada, facilitando la ejecución de diversas acciones con tan solo un clic.
Operator es un «Computer Using Agent» (CUA), es decir, un agente que utiliza las habilidades visuales del modelo GPT-4o para navegar y buscar información en la web.
Gracias a su capacidad multimodal, puede comprender el contexto de las búsquedas y procesar la información visual de las páginas web mientras interactúa con ellas. .
Este innovador agente de IA permite realizar múltiples tareas, como reservar una cena, completar formularios extensos, comprar productos en supermercados o incluso gestionar la reserva de vuelos. Operator es capaz de utilizar plataformas como OpenTable para encontrar y confirmar reservas en restaurantes, guiando al usuario a lo largo del proceso.
Aunque Operator se encuentra en sus primeras etapas de desarrollo, OpenAI ha impuesto algunas limitaciones a su uso. La compañía ha presentado una demostración en la que se observa al agente interactuar con un navegador web de manera similar a como lo haría un usuario humano. Sin embargo, aún no se ha probado su rendimiento en entornos reales de uso.
OpenAI ha destacado que Operator es uno de sus primeros agentes con capacidad para realizar tareas de manera independiente. Según la compañía, se trata de un paso importante hacia la automatización de procesos mediante IA, con más agentes en desarrollo que ampliarán estas funcionalidades en el futuro.
Operator se basa en el modelo CUA, que combina las habilidades visuales de GPT-4o con un avanzado razonamiento lógico. Esta tecnología le permite interpretar y utilizar elementos de la interfaz de un navegador, como la barra de búsqueda, botones y contenido en pantalla.
El agente puede «ver» mediante capturas de pantalla e «interactuar» con los elementos del navegador utilizando acciones similares a las de un teclado y ratón. Esto le permite completar tareas con un alto nivel de precisión y, según OpenAI, incluso corregirse a sí mismo en caso de errores durante la ejecución de las tareas.
Actualmente, Operator está disponible únicamente para suscriptores de ChatGPT Pro en los Estados Unidos. OpenAI ha anunciado que, en el futuro, se expandirá a otros países y será integrado en la suscripción ChatGPT Plus. Sin embargo, la llegada a regiones como Europa podría demorar más tiempo.
Operator marca un paso significativo en la evolución de los agentes de IA, ofreciendo una solución avanzada para la automatización de tareas en la web. Aunque todavía se encuentra en fase de prueba, su potencial para transformar la forma en que interactuamos con la tecnología es prometedor.