El modo de voz avanzado de ChatGPT imita hasta las pausas para respirar

🎃 ¡Rebajas de Halloween! ¡Office 2021 para siempre por sólo 29,11€/PC! [ Saber más ]

OpenAI ha comenzado a implementar una versión alfa de su nuevo Modo de Voz Avanzada para un grupo reducido de suscriptores de ChatGPT Plus.

Esta función, que fue presentada por primera vez en mayo con el lanzamiento de GPT-4o, busca hacer que las conversaciones con la inteligencia artificial sean más naturales. Las primeras pruebas compartidas en las redes sociales resultan impresionantes

TE INTERESA:
OpenAI afirma que 200 millones de personas usan ChatGPT cada semana

 

Conversaciones en tiempo real y respuesta a emociones

Los usuarios con acceso han reportado que el Modo de Voz Avanzada permite mantener conversaciones en tiempo real con ChatGPT, incluso pudiendo interrumpir a la IA casi al instante. Este modo puede detectar y responder a las señales emocionales del usuario a través del tono de voz y la forma de hablar, y también puede añadir efectos de sonido al contar historias.

Una de las características que ha sorprendido a muchos es la capacidad de las voces para simular la respiración mientras hablan.

El escritor tecnológico Cristiano Giardina, en la plataforma X, compartió su experiencia con el Modo de Voz Avanzada pidiendo a ChatGPT que contara lo más rápido que pudiera hasta 10, y luego hasta 50. Lo impresionante es cómo se detuvo para tomar aire como lo haría un humano.

 

Esta simulación de pausas audibles para respirar se debe a que el modelo ha sido entrenado con muestras de audio humano que incluyen esta característica. Después de haber sido expuesto a innumerables ejemplos de habla humana, el modelo ha aprendido a imitar inhalaciones en momentos apropiados.

Giardina también compartió otras impresiones sobre el Modo de Voz Avanzada, incluyendo observaciones sobre acentos en otros idiomas y efectos de sonido. «Es muy rápido, prácticamente no hay latencia desde que dejas de hablar hasta que responde,» escribió.

«Cuando le pides que haga ruidos, siempre hace que la voz ‘interprete’ los ruidos (con resultados divertidos). Puede hacer acentos, pero al hablar otros idiomas siempre tiene un acento americano.»

 

Es importante tener en cuenta que, al estar basado en un modelo de lenguaje grande, ocasionalmente puede generar respuestas incorrectas en temas o situaciones donde su «conocimiento» (basado en el conjunto de datos de entrenamiento de GPT-4o) es limitado. Sin embargo, el Modo de Voz Avanzada parece ejecutar con éxito muchas de las tareas presentadas en la demostración de OpenAI en mayo.

OpenAI planea expandir el acceso a más usuarios de ChatGPT Plus en las próximas semanas, con un lanzamiento completo para todos los suscriptores Plus previsto para este otoño.

🎃 ¡Rebajas de Halloween! ¡Office 2021 para siempre por sólo 29,11€/PC! [ Saber más ]

¿Cuál es tu reacción?
Sorprendido
0%
Feliz
0%
Indiferente
0%
Triste
0%
Enfadado
0%
Aburrido
0%
Incrédulo
0%
¡Buen trabajo!
0%
Sobre el Autor
Luis A.
Luis es el creador y editor jefe de Teknófilo. Se aficionó a la tecnología con un Commodore 64 e hizo sus pinitos programando gracias a los míticos libros de 🛒 'BASIC para niños' con 11 años. Con el paso de los años, la afición a los ordenadores se ha extendido a cualquier cacharrito que tenga una pantalla y CPU.
Comentarios
Deja un comentario

Deja un comentario