Cómo utiliza HomePod el aprendizaje automático para aumentar la precisión de Siri en el campo lejano

En una nueva publicaci√≥n publicada el lunes a trav√©s de su blog Machine Learning Journal, Apple contin√ļa explicando c√≥mo HomePod, su altavoz inal√°mbrico inteligente, utiliza el aprendizaje autom√°tico para aumentar la precisi√≥n en el campo lejano, lo que ayuda a Siri a ignorar o suprimir los sonidos de fondo para comprender mejor su conversaci√≥n Solicitudes en ambientes ruidosos.

Del artículo:

El entorno de audio típico para HomePod tiene muchos desafíos: eco, reverberación y ruido. A diferencia de Siri en iPhone, que funciona cerca de la boca del usuario, Siri en HomePod debe funcionar bien en una configuración de campo lejano. Los usuarios quieren invocar a Siri desde muchos lugares, como el sofá o la cocina, sin importar dónde se sienta HomePod.

Un sistema en l√≠nea completo, que aborda todos los problemas medioambientales que puede experimentar HomePod, requiere una estrecha integraci√≥n de varias tecnolog√≠as de procesamiento de se√Īal multicanal. En consecuencia, los equipos de Audio Software Engineering y Siri Speech crearon un sistema que integra modelos de aprendizaje profundo supervisados ‚Äč‚Äčy algoritmos de aprendizaje en l√≠nea sin supervisi√≥n y que aprovecha m√ļltiples se√Īales de micr√≥fono.

El sistema selecciona el flujo de audio óptimo para el reconocedor de voz utilizando el conocimiento de arriba hacia abajo de los detectores de frase de activación "Hey Siri".

El resto del art√≠culo trata sobre el uso de las diversas t√©cnicas de aprendizaje autom√°tico para el procesamiento de se√Īales en l√≠nea, as√≠ como los desaf√≠os que enfrent√≥ Apple y sus soluciones para lograr una robustez ambiental y algor√≠tmica al tiempo que garantiza la eficiencia energ√©tica.

En pocas palabras, Siri en HomePod implementa el algoritmo de cancelaci√≥n de eco multicanal (MCEC) que utiliza un conjunto de filtros adaptativos lineales para modelar las m√ļltiples rutas ac√ļsticas entre los altavoces y los micr√≥fonos para cancelar el acoplamiento ac√ļstico.

Debido a la proximidad de los altavoces a los micr√≥fonos de HomePod, la se√Īal de reproducci√≥n puede ser significativamente m√°s alta que el comando de voz de un usuario en las posiciones del micr√≥fono, especialmente cuando el usuario se aleja del dispositivo. De hecho, las se√Īales de eco pueden ser 30-40 dB m√°s altas que las se√Īales de voz de campo lejano, lo que hace que la frase de activaci√≥n no sea detectable en los micr√≥fonos durante la reproducci√≥n de m√ļsica a todo volumen.

TLDR: solo MCEC no puede eliminar la se√Īal de reproducci√≥n completamente de su comando de voz.

El comando Siri se graba en presencia de m√ļsica de reproducci√≥n alta: se√Īal de micr√≥fono (arriba), salida de MCEC (centro) y se√Īal mejorada por la supresi√≥n de eco basada en la m√°scara de Apple (abajo)

Para eliminar el contenido de reproducción restante después de MCEC, HomePod utiliza un enfoque de supresor de eco residual (RES) con un poco de ayuda del modelo de aprendizaje automático bien entrenado de Apple. Para una detección exitosa de la frase de activación, el RES hace cosas como mitigar el eco lineal residual, especialmente en presencia de cambios en la doble conversación y en la ruta del eco.

Aseg√ļrese de leer la publicaci√≥n completa y despl√°cese hacia abajo hasta la Secci√≥n 7, donde tiene im√°genes de m√ļltiples formas de onda coloridas junto con los enlaces debajo de ellas, lo que le permite escuchar por s√≠ mismo qu√© parte de la solicitud de un usuario queda suprimida por la m√ļsica que se reproduce a un volumen alto. Se√Īal de reproducci√≥n generada por los tweeters y woofer de HomePod.

Tidbit: el procesamiento de la se√Īal multicanal de Apple se ejecuta en un n√ļcleo del silicio A8 de doble n√ļcleo de 1.4GHz y consume hasta el 15 por ciento del rendimiento del chip √ļnico del chip.

HomePod utiliza el aprendizaje autom√°tico para muchas cosas, no solo para Siri.

Los algoritmos de recomendación de contenido que se ejecutan en el dispositivo se benefician del aprendizaje automático, al igual que las técnicas de optimización de sonido y procesamiento de audio digital de HomePod.


La noticia fue creada por el AUTOR ORIGINAL del link de arriba, auspiciamos al desarrollador original de la noticia sin perjudicar su reputación ni posicionamiento web.