🎃 ¡Rebajas de Halloween! ¡Office 2021 para siempre por sólo 29,11€/PC! [ Saber más ]
La tecnología de cancelación de ruido en los auriculares ha avanzado considerablemente. Sin embargo, permitir que ciertos sonidos del entorno del usuario se filtren a través de la cancelación sigue siendo un reto.
Un equipo de la Universidad de Washington ha desarrollado un sistema de inteligencia artificial que permite a un usuario que lleva auriculares mirar a una persona que habla durante tres a cinco segundos para «inscribirlos».
El sistema, llamado «Audición de Discurso Objetivo», cancela todos los demás sonidos del entorno y reproduce solo la voz del orador inscrito en tiempo real, incluso cuando el oyente se mueve en lugares ruidosos y ya no mira al orador.
El código del dispositivo de prueba de concepto está disponible para que otros lo desarrollen. El sistema no está disponible comercialmente.
Tendemos a pensar en la inteligencia artificial ahora como chatbots basados en web que responden preguntas. Pero en este proyecto, desarrollamos IA para modificar la percepción auditiva de cualquier persona que lleve auriculares, dadas sus preferencias. Con nuestros dispositivos, ahora puedes escuchar claramente a un solo orador incluso si estás en un entorno ruidoso con muchas otras personas hablando.
Para usar el sistema, una persona que lleva auriculares equipados con micrófonos presiona un botón mientras dirige su cabeza hacia alguien que habla. Las ondas sonoras de la voz de ese orador deberían llegar a los micrófonos en ambos lados del auricular simultáneamente; con un margen de error de 16 grados.
Los auriculares envían esa señal a un ordenador integrado, donde el software de IA aprende los patrones vocales del orador deseado. El sistema se «engancha» a la voz de ese orador y continúa reproduciéndola para el oyente, incluso mientras las dos personas se mueven. La capacidad del sistema para centrarse en la voz registrada mejora a medida que el orador sigue hablando, lo que proporciona más datos de entrenamiento.
Este trabajo se basa en la investigación previa de «audición semántica» del equipo, que permitía a los usuarios seleccionar clases de sonido específicas, como pájaros o voces, que querían escuchar y cancelar otros sonidos en el entorno.
Actualmente, el sistema TSH solo puede inscribir a un orador a la vez y solo puede inscribir a un orador cuando no hay otra voz alta proveniente de la misma dirección que la voz del orador objetivo. Si un usuario no está satisfecho con la calidad del sonido, puede realizar otra inscripción en el orador para mejorar la claridad.
El equipo está trabajando para expandir el sistema a auriculares y audífonos en el futuro.