Olvida ChatGPT: NExT-GPT puede leer y generar texto, imágenes y vídeo

El panorama de la IA está dominado por gigantes como ChatGPT y Google Bard, pero un nuevo gran modelo lingüístico (LLM), NExT-GPT, ha llegado para cambiar las cosas y ofrecer una amplia gama de resultados de texto, imagen, audio y vídeo.

NExT-GPT es una creación de investigadores de la Universidad Nacional de Singapur y la Universidad de Tsinghua. NExT-GPT, que se presenta como un sistema «cualquiera-a-cualquiera», acepta entradas en distintos formatos y ofrece respuestas de vídeo, audio, imagen y texto.

Esto significa que se puede introducir una pregunta de texto y NExT-GPT puede procesar esa pregunta en un vídeo, o se le puede dar una imagen y convertirla en una salida de audio. Puedes dirigirte a la página de GitHub o a la página de demostración para probarlo por ti mismo.

ChatGPT acaba de anunciar la capacidad de «ver, oír y hablar», que es similar a la que ofrece NExT-GPT, pero ChatGPT apuesta por una versión más adaptada a los móviles de este tipo de funciones y aún no ha introducido las capacidades de vídeo.

¿Cuál es tu reacción?

Sorprendido

50%

Feliz

50%

Indiferente

Triste

Enfadado

Aburrido

Incrédulo

¡Buen trabajo!

✏️ Ver comentarios

Sobre el Autor

Luis A.

Luis es el creador y editor jefe de Teknófilo. Se aficionó a la tecnología con un Commodore 64 e hizo sus pinitos programando gracias a los míticos libros de 🛒 'BASIC para niños' con 11 años. Con el paso de los años, la afición a los ordenadores se ha extendido a cualquier cacharrito que tenga una pantalla y CPU.

Comentarios

Deja un comentario

Olvida ChatGPT: NExT-GPT puede leer y generar texto, imágenes y vídeo

Deja un comentarioCancelar respuesta