OpenAI presenta GPT-4o, que ahora escucha, mira y habla
OpenAI ha dado a conocer la última versión de la tecnología que sustenta su chatbot de IA, ChatGPT, bajo el nombre de GPT-4o. Esta actualización se implementará para todos los usuarios de ChatGPT, incluso los no suscriptores.
Una de las características destacadas de GPT-4o es su mayor velocidad en comparación con modelos anteriores, además de haber sido programado para sonar más conversacional.
La nueva versión tiene la capacidad de leer e interpretar imágenes, traducir idiomas e identificar emociones a partir de expresiones visuales. También cuenta con memoria para recordar interacciones previas.
Acepta como entrada cualquier combinación de texto, audio e imagen y genera cualquier combinación de salidas de texto, audio e imagen. Puede responder a entradas de audio en tan solo 232 milisegundos, con una media de 320 milisegundos, lo que es similar al tiempo de respuesta humano en una conversación.
Durante una demostración en vivo utilizando la versión vocal de GPT-4o, proporcionó sugerencias útiles sobre cómo resolver una simple ecuación escrita en un papel, en lugar de simplemente resolverla. También analizó código informático, tradujo entre italiano e inglés e interpretó las emociones en un selfie de un hombre sonriente.
Aunque no es perfecto, GPT-4o muestra la dirección que está tomando OpenAI. Sin embargo, hay aspectos importantes que considerar, como el consumo energético de la IA, que es más alto que el de las tareas computacionales tradicionales. La sostenibilidad no fue mencionada durante la presentación, lo que plantea interrogantes sobre el coste ambiental de esta tecnología.
A medida que GPT-4o se implemente a gran escala, será interesante ver cómo maneja el alto volumen de usuarios que ya utilizan ChatGPT. Aunque se han mencionado rumores sobre una asociación entre OpenAI y Apple, aún no se ha confirmado.
El evento de OpenAI tuvo lugar 24 horas antes de que su rival Google presente sus últimos desarrollos en IA en su conferencia anual, Google IO, lo que muestra la competencia continua y el avance acelerado en este campo tecnológico.