Apple investigar sensores ultrasónicos para autenticar las voces de los usuarios

Una nueva investigación revela que Apple está buscando cómo hacer que Siri detecte voces particulares y también determine su ubicación, únicamente a través de vibraciones.

Dos solicitudes de patente recientemente reveladas muestran que Apple está investigando diferentes formas en que los dispositivos pueden detectar personas o interactuar con ellas. El principal haría que Siri pudiera reconocer a personas individuales y sus comandos hablados, sin que el dispositivo necesitara un micrófono normal.

“Sensores de interferometría de automezcla utilizados para detectar la vibración de un componente estructural o de la carcasa que define una superficie exterior de un dispositivo”, se refiere al uso de interferometría de automezcla (SMI). SMI implica detectar una señal “resultante de la reflexión [or] retrodispersión de la luz emitida “desde un dispositivo.

  

“A medida que el reconocimiento de voz mejora y se vuelve más disponible, los micrófonos son cada vez más importantes como dispositivos de entrada para interactuar con los dispositivos (haciendo que los dispositivos sean dispositivos interactivos)”, dice la solicitud de patente.

Sin embargo, continúa, esto tiene sus desventajas.

“En un micrófono convencional, las ondas sonoras se convierten en vibraciones acústicas en la membrana del micrófono, lo que requiere un puerto para que el aire entre y salga del dispositivo debajo del micrófono”, dice la aplicación. “El puerto puede hacer que el dispositivo sea susceptible a daños por agua, obstrucciones y humedad, y puede ser una distracción cosmética”.

En consecuencia, debido a “sensibilidades que son mucho mejores que la longitud de onda de la luz utilizada”, Apple propone que se utilice una serie de sensores SMI. “Un sensor SMI puede detectar vibraciones inducidas por sonidos y / o golpes en una superficie. A diferencia de un micrófono de diafragma convencional, un sensor SMI puede operar en un ambiente hermético (o sellado)”.

Estos sensores SMI no solo necesitan detectar vibraciones, como las causadas por el sonido. Tampoco es necesario que sean el único sensor de un dispositivo.

“A modo de ejemplo”, dice Apple, “los sistemas de sensores pueden incluir un sensor SMI, un sensor de calor, un sensor de posición, un sensor óptico o de luz, un acelerómetro, un transductor de presión, un giroscopio, un magnetómetro, un sensor de control de la salud y un sensor de calidad del aire sensor, etc. ”

Detalle de la patente que muestra cómo los sensores SMI también podrían usarse en la parte posterior de un Apple Watch

Detalle de la patente que muestra cómo los sensores SMI también podrían usarse en la parte posterior de un Apple Watch

Lo que esto significaría en la práctica es que un dispositivo podría “configurarse para detectar uno o más tipos de parámetros, como, entre otros, vibración; luz; tacto; fuerza; calor; movimiento; movimiento relativo; datos biométricos (p. Ej., parámetros biológicos) de un usuario; calidad del aire; proximidad; posición; conectividad; etc. ”

Apple describe cómo un dispositivo, como un Apple Watch, puede determinar dónde está y qué hay cerca.

“Por ejemplo, si se determina que la fuente está dentro de una habitación en la que [a] El televisor está instalado “, dice la solicitud de patente,” el televisor puede cambiar su pantalla electrónica de un estado de energía baja o sin energía a un estado de energía operativa después de identificar … una voz de una persona transmitida en la forma de onda vibratoria, o una voz de una persona en particular “.

Para que pueda entrar en su sala de estar y pedirle a su reloj que encienda la televisión. Reconocería un comando hablado, incluso si el reloj no tuviera un micrófono tradicional.

También lo identificaría específicamente. Sabiendo tanto que está autorizado para usar el televisor como qué televisor está cerca, el dispositivo podría encender ese televisor.

AppleLa propuesta es una combinación de diferentes formas de detectar las solicitudes de un usuario, e incluso calcular las probabilidades de que una vibración provenga de una persona. Dichos dispositivos, ya sean portátiles o estáticos como un Apple TV, determinaría “a partir de la fuente de una forma de onda vibratoria es probable que sea una persona”.

Lo haría “basándose en la información contenida en la forma de onda vibratoria”, que incluye “una dirección o distancia determinada de una fuente”. Dicha información también incluiría cualquier cambio en la ubicación, como “pasos que sugieran que una persona se está moviendo a una ubicación predeterminada para ver o escuchar”.

Apple se refiere al dispositivo que tiene “un recinto que define un espacio de entrada tridimensional” y sugiere que efectivamente mapearía su entorno. Eso es similar a lo que hace el HomePod original cuando se configura por primera vez.

Y es similar a Apple y la investigación “Listen Learner” de la Universidad Carnegie Mellon. Ese documento propone un “reconocimiento de actividad” que ve a Siri mapeando la habitación.

Esta primera de dos patentes recientemente reveladas sobre temas similares se atribuye a tres inventores, Ahmet Fatih Cihan, Mark T. Winkler y Mehmet Mutlu. Los dos últimos se acreditaron previamente en una solicitud de patente relacionada con varios dispositivos que detectan la ubicación de cada uno.

Mehmet Mutlu es también uno de los tres inventores acreditados en la aplicación separada pero relacionada “Dispositivos de entrada que utilizan interferometría de mezcla automática para determinar el movimiento dentro de un recinto”.

Detalle de la patente que muestra (izquierda) una vista frontal y superior (derecha) de un dedo detectado sin sensores táctiles

Detalle de la patente que muestra (izquierda) una vista frontal y superior (derecha) de un dedo detectado sin sensores táctiles

Creando nuevos teclados virtuales

La primera solicitud de patente trata, en última instancia, de formas de utilizar sensores de interferometría de mezcla automática para detectar lo que sucede alrededor de un dispositivo. En cambio, esta segunda aplicación se ocupa de detectar lo que sucede dentro de un dispositivo, o un “espacio de entrada tridimensional” específico.

“Los diferentes dispositivos de entrada se adaptan a diferentes aplicaciones”, dice Apple. “Muchos dispositivos de entrada pueden implicar que un usuario toque una superficie que está configurada para recibir entrada, como una pantalla táctil. Tal dispositivo de entrada puede ser menos adecuado para aplicaciones en las que un usuario puede estar tocando otra superficie”.

Los teclados virtuales típicos presentan al usuario una imagen de teclas y se basan en sensores táctiles para registrar las pulsaciones reales. Con SMI, el “movimiento de la parte del cuerpo”, por ejemplo, un dedo, podría detectarse en su lugar.

“En algunos ejemplos, el desplazamiento de una parte del cuerpo o la velocidad de una parte del cuerpo y una distancia absoluta a la parte del cuerpo pueden determinarse utilizando la señal de interferometría de automezcla y utilizarse para determinar una entrada”, continúa Apple.

Usar SMI de esta manera significaría que el dispositivo no necesita tener una pantalla sensible al tacto. Por lo tanto, podría ser más delgado o podría ser un dispositivo que solo se usa ocasionalmente para la entrada.