Así utiliza el HomePod la IA para entender las órdenes en ambientes muy ruidosos

🎃 ¡Rebajas de Halloween! ¡Office 2021 para siempre por sólo 29,11€/PC! [ Saber más ]

Cuando analizamos el HomePod hace unos meses, pusimos de manifiesto que el altavoz inteligente de Apple es un pequeño prodigio tecnológico en lo que a reproducción de sonido se refiere.

El altavoz es capaz de determinar la forma de la habitación en la que está ubicado y emite el sonido de forma que la voz o instrumento principal llegue directamente a nuestros oídos mientras que el sonido de los instrumentos secundarios o el coro parezca rebote en las paredes y parezca llegar de todas partes.

Entrada Relacionada

La tecnología de sonido del HomePod no se limita únicamente a la reproducción sino también a la capacidad de escuchar con precisión las órdenes de un usuario desde el otro lado de la habitación, incluso cuando suena a la vez música, un programa de televisión o conversaciones de otras personas.

Recientemente, Apple ha dado detalles sobre cómo el HomePod aprovecha la Inteligencia Artificial para monitorizar constantemente los sonidos captados por sus seis micrófonos, y procesar sus diferentes entradas mediante algoritmos de machine learning

Uno de los mayores retos a la hora de discernir las órdenes de un usuario del ruido ambiental es eliminar el sonido que emite el propio HomePod, sobre todo si estamos escuchando música.

El altavoz de Apple puede sonar a volúmenes muy altos, y sus micrófonos están completamente pegados a los altavoces. En consecuencia, no hay una manera sencilla de eliminar el propio sonido que emite el HomePod del sonido captado por los micrófonos.

Apple utilizó grabaciones de ecos de altavoces para entrenar una red neural profunda capaz de suprimir los sonidos propios de HomePod. También aplica un modelo de eliminación de reverberaciones específico de la habitación en la que se encuentra, y que es calculado periódicamente por el altavoz.

Otro truco interesante es el conformado de haces para determinar dónde se encuentra el usuario que habla, enfocar los micrófonos hacia esa persona y aplicar filtrado espacial para eliminar los sonidos de otras fuentes.

Apple construyó un sistema que se centra en la voz y trata de anular las interferencias. Además, entrenó a la red neural utilizando una variedad de ruidos comunes que iban desde ruidos difusos hasta direccionales, de modo que el filtrado pudiera aplicarse a un gran número de fuentes de interferencias.

Otra capacidad interesante de HomePod es determinar cuál de las múltiples personas que hablan es la fuente de las órdenes, para dirigir los micrófonos hacia ella y eliminar el ruido.

Un truco es usar la frase de activación «Oye Siri», que permite determinar quién y de dónde vienen las órdenes, pero Apple también desarrolló técnicas para separar a las diferentes personas que hablan a la vez en flujos de audio individuales, y luego usar machine learning para determinar qué hablante está dando órdenes.

Si tienes curiosidad por saber más, Apple ha dado detalles sobre el funcionamiento del HomePod en su publicación Machine Learning Journal.

Dejar un comentario

Tu dirección de e-mail nunca será publicada Los campos requeridos están marcados*

Esta web usa cookies para elaborar información estadística y mostrar publicidad personalizada.

Saber más