Cómo utiliza HomePod el aprendizaje automático para aumentar la precisión de Siri en el campo lejano

3
iDB
Cómo utiliza HomePod el aprendizaje automático para aumentar la precisión de Siri en el campo lejano
4.7 (93.33%) 3 votos

En una nueva publicación publicada el lunes a través de su blog Machine Learning Journal, Apple continúa explicando cómo HomePod, su altavoz inalámbrico inteligente, utiliza el aprendizaje automático para aumentar la precisión en el campo lejano, lo que ayuda a Siri a ignorar o suprimir los sonidos de fondo para comprender mejor su conversación Solicitudes en ambientes ruidosos.

Del artículo:

El entorno de audio típico para HomePod tiene muchos desafíos: eco, reverberación y ruido. A diferencia de Siri en iPhone, que funciona cerca de la boca del usuario, Siri en HomePod debe funcionar bien en una configuración de campo lejano. Los usuarios quieren invocar a Siri desde muchos lugares, como el sofá o la cocina, sin importar dónde se sienta HomePod.

Un sistema en línea completo, que aborda todos los problemas medioambientales que puede experimentar HomePod, requiere una estrecha integración de varias tecnologías de procesamiento de señal multicanal. En consecuencia, los equipos de Audio Software Engineering y Siri Speech crearon un sistema que integra modelos de aprendizaje profundo supervisados ​​y algoritmos de aprendizaje en línea sin supervisión y que aprovecha múltiples señales de micrófono.

El sistema selecciona el flujo de audio óptimo para el reconocedor de voz utilizando el conocimiento de arriba hacia abajo de los detectores de frase de activación "Hey Siri".

El resto del artículo trata sobre el uso de las diversas técnicas de aprendizaje automático para el procesamiento de señales en línea, así como los desafíos que enfrentó Apple y sus soluciones para lograr una robustez ambiental y algorítmica al tiempo que garantiza la eficiencia energética.

Recomendamos:
▷ Apple ha embarcado un número estimado de 36,4 millones de iPhones en el mundo en el primer trimestre de 2019, un descenso del 30% con respecto al año anterior

En pocas palabras, Siri en HomePod implementa el algoritmo de cancelación de eco multicanal (MCEC) que utiliza un conjunto de filtros adaptativos lineales para modelar las múltiples rutas acústicas entre los altavoces y los micrófonos para cancelar el acoplamiento acústico.

Debido a la proximidad de los altavoces a los micrófonos de HomePod, la señal de reproducción puede ser significativamente más alta que el comando de voz de un usuario en las posiciones del micrófono, especialmente cuando el usuario se aleja del dispositivo. De hecho, las señales de eco pueden ser 30-40 dB más altas que las señales de voz de campo lejano, lo que hace que la frase de activación no sea detectable en los micrófonos durante la reproducción de música a todo volumen.

TLDR: solo MCEC no puede eliminar la señal de reproducción completamente de su comando de voz.

El comando Siri se graba en presencia de música de reproducción alta: señal de micrófono (arriba), salida de MCEC (centro) y señal mejorada por la supresión de eco basada en la máscara de Apple (abajo)

Para eliminar el contenido de reproducción restante después de MCEC, HomePod utiliza un enfoque de supresor de eco residual (RES) con un poco de ayuda del modelo de aprendizaje automático bien entrenado de Apple. Para una detección exitosa de la frase de activación, el RES hace cosas como mitigar el eco lineal residual, especialmente en presencia de cambios en la doble conversación y en la ruta del eco.

Asegúrese de leer la publicación completa y desplácese hacia abajo hasta la Sección 7, donde tiene imágenes de múltiples formas de onda coloridas junto con los enlaces debajo de ellas, lo que le permite escuchar por sí mismo qué parte de la solicitud de un usuario queda suprimida por la música que se reproduce a un volumen alto. Señal de reproducción generada por los tweeters y woofer de HomePod.

Recomendamos:
▷ TSMC en curso para garantizar pedidos de chips 5nm para iPhones 2020

Tidbit: el procesamiento de la señal multicanal de Apple se ejecuta en un núcleo del silicio A8 de doble núcleo de 1.4GHz y consume hasta el 15 por ciento del rendimiento del chip único del chip.

HomePod utiliza el aprendizaje automático para muchas cosas, no solo para Siri.

Los algoritmos de recomendación de contenido que se ejecutan en el dispositivo se benefician del aprendizaje automático, al igual que las técnicas de optimización de sonido y procesamiento de audio digital de HomePod.

Fuente
La noticia fue creada por el AUTOR ORIGINAL del link de arriba, auspiciamos al desarrollador original de la noticia sin perjudicar su reputación ni posicionamiento web.