Olvida ChatGPT: NExT-GPT puede leer y generar texto, imágenes y vídeo
El panorama de la IA está dominado por gigantes como ChatGPT y Google Bard, pero un nuevo gran modelo lingüístico (LLM), NExT-GPT, ha llegado para cambiar las cosas y ofrecer una amplia gama de resultados de texto, imagen, audio y vídeo.
NExT-GPT es una creación de investigadores de la Universidad Nacional de Singapur y la Universidad de Tsinghua. NExT-GPT, que se presenta como un sistema «cualquiera-a-cualquiera», acepta entradas en distintos formatos y ofrece respuestas de vídeo, audio, imagen y texto.
Esto significa que se puede introducir una pregunta de texto y NExT-GPT puede procesar esa pregunta en un vídeo, o se le puede dar una imagen y convertirla en una salida de audio. Puedes dirigirte a la página de GitHub o a la página de demostración para probarlo por ti mismo.
ChatGPT acaba de anunciar la capacidad de «ver, oír y hablar», que es similar a la que ofrece NExT-GPT, pero ChatGPT apuesta por una versión más adaptada a los móviles de este tipo de funciones y aún no ha introducido las capacidades de vídeo.