6 Maneras de utilizar el aprendizaje profundo para mejorar el uso de dispositivos móviles

Este art√≠culo se public√≥ originalmente en M Liquido.com el 23 de enero de 2020 y fue escrito por RadosŇāaw Holewa.

Con la creciente demanda global de experiencias móviles mejoradas y más personalizadas, la IA generalizada y la adaptación de aprendizaje profundo en la industria del desarrollo de aplicaciones móviles es inevitable. Olvídese de los frustrantes problemas de latencia que surgen a través de la detección móvil y la computación en la nube. El tiempo de respuesta es casi cero con velocidades de gestión en tiempo real para obtener mejores resultados.

El avanzado conjunto de chips para teléfonos inteligentes Bionic de Apple con dispositivos de procesamiento neuronal integrados ayuda a las redes neuronales a trabajar directamente en el dispositivo a velocidades increíbles. Con el Core ML de Apple, las plataformas ML Kit de Google y las bibliotecas de aprendizaje profundo como TensorFlow Lite y Keras, los desarrolladores móviles pueden crear aplicaciones con menos tiempo de respuesta, menos errores y un procesamiento de datos más rápido.

  

La principal ventaja del aprendizaje autom√°tico en el dispositivo es que proporciona a los usuarios una experiencia de usuario fluida y precisa. Dado que no hay problemas para enviar datos a servidores externos para su procesamiento, obtiene una mejor protecci√≥n de datos, seguridad y privacidad del usuario. Las redes neuronales en dispositivos m√≥viles tampoco requieren una conexi√≥n a Internet para acceder a todas las funciones de sus aplicaciones. Por supuesto, a√ļn necesitar√° Internet para la mayor√≠a de las caracter√≠sticas est√°ndar.

El uso de capacidades informáticas para dispositivos móviles para implementar algoritmos de aprendizaje profundo ha mejorado la usabilidad de los dispositivos móviles. Así es como:

1. Reconocimiento de voz en el dispositivo.

El reconocimiento de voz implica convertir o convertir secuencias en secuencias con redes neuronales repetitivas (RNN), redes neuronales internas (CNN), redes nerviosas profundas (DNN) y otras estructuras. Los desarrolladores tuvieron un problema de latencia, que creó retrasos entre su solicitud y la respuesta automática, pero ahora podemos superarlos con la ayuda de la tecnología RNN-T incorporada en dispositivos móviles.

RNN-Ts son modelos de secuencia a secuencia. En lugar de seguir el método habitual de manejar una secuencia de entrada completa antes de producir una salida, mantiene una continuidad uniforme en el procesamiento del flujo de entrada y salida. Esto facilita el reconocimiento y procesamiento de voz en tiempo real. Ves esto con Google Assistant, Quién puede procesar comandos de voz consecutivos sin tropezar y sin pedirle que llame "Hola, Google" después de cada solicitud.

Es una conversaci√≥n bidireccional m√°s natural, y el asistente sigue sus instrucciones a T. ¬ŅDesea configurar un asunto de correo electr√≥nico, encontrar una imagen en una de sus carpetas y guiarlo al lugar de su hermana? Implementado.

Avanzando con el tel√©fono Pixel 4 Lo nuevo de Google y la funci√≥n "Live Caption" pueden proporcionar traducciones de notas de voz, podcasts y videos en tiempo real, y debido a que el procesamiento en el dispositivo, tambi√©n est√° en modo avi√≥n. Entonces, por ejemplo, si se muestra un video en Twitter En resumen, puede ver de qu√© se tratan los subt√≠tulos sin tener que apagar el sonido. Live Caption a√ļn no funciona con m√ļsica o llamadas telef√≥nicas.

2. Aumente la eficiencia mientras reconoce los gestos

Usando modelos de gestión de aprendizaje automático en el dispositivo, puede entrenar su dispositivo móvil para detectar, rastrear y reconocer gestos con las manos y el cuerpo. La cámara del dispositivo graba y almacena tus gestos y movimientos como datos de imágenes en 3D. Posteriormente, los algoritmos de aprendizaje profundo para redes neuronales utilizan esta biblioteca de gestos para identificar y decodificar gestos estáticos y dinámicos específicos. Luego los unen en tiempo real a su intención y ejecutan las órdenes que desea.

Google Pix 4 smartphones Viene con un chip Soli que facilita la interacción compleja y no verbal con su teléfono. Este mini sensor de radar en la parte superior del teléfono impulsa la tecnología Motion Sense que puede detectar su presencia y gestos con las manos y el cuerpo para permitir la interacción del teléfono. Con un lavado de manos, incluso sin tocar el teléfono, puede decirle que espere, silencie una alarma o vaya a la siguiente canción de su lista de reproducción.

3. Las capacidades m√°s profundas de la realidad aumentada

Con la ayuda de ARCore y Google Apple Desde las plataformas ARKit, los desarrolladores pueden crear aplicaciones de realidad aumentada que pueden combinar objetos y entornos digitales con configuraciones realistas. La capacidad de profundizaci√≥n de la realidad aumentada tiene un gran impacto en el comercio minorista, el entretenimiento, los viajes y otras industrias. Marcas como Lacoste y Sephora ahora permiten a sus clientes probar o previsualizar productos con aplicaciones de realidad aumentada, y un n√ļmero cada vez mayor de compradores prefieren verificar los productos en sus tel√©fonos antes de decidirse a comprarlos.

Juegos interactivos de realidad aumentada como Pokemon, Ingress y Ghostbusters World han recibido amplia prensa y seguimiento dedicado. Si desea orientarse por la ciudad, Google Maps Live View le proporcionará navegación en tiempo real.

C√°mara Leica Quad en Huawei P30 Pro.

4. Im√°genes de alta calidad.

La alta calidad de imagen es un criterio importante para los compradores al elegir smartphones, Que pueden obtener con muchos de los √ļltimos modelos. Estos est√°n equipados con componentes de hardware: unidades centrales de procesamiento (CPU), procesadores de se√Īal de imagen, algoritmos de im√°genes de aprendizaje profundo y unidades de procesador neural, que han saltado smartphones En un mundo que es completamente diferente de las c√°maras tradicionales cuando se trata de tomar fotos. Con estos smartphones Pueden mostrar m√°s conciencia en el nivel de calificaci√≥n de p√≠xeles de lo que ven para tomar im√°genes de alta resoluci√≥n.

Teléfonos Google Pixel Apple Los iPhone usan muchas cámaras y algoritmos sofisticados de aprendizaje automático para identificar personas y objetos, crear mapas de profundidad, unir sin problemas exposiciones largas y calcular el balance de color preciso.

Al entrenar redes neuronales en un conjunto de datos de imágenes, los algoritmos aprenden cómo responder a los requisitos de imágenes individuales y refinar imágenes en tiempo real. El sistema de corrección automática desarrollado por investigadores del MIT y Google permite a los fotógrafos aplicar diferentes estilos a la imagen antes de tomar la imagen.

Después de que una cuadrícula interna procesa imágenes de baja resolución, el método de mapeo conocido se ajusta para asociar la conversión de color con los colores de los píxeles. La cuadrícula almacena estos formatos transformativos en una cuadrícula tridimensional que luego permite la salida de una imagen de alta resolución. Todo esto sucede en milisegundos.

Los teléfonos inteligentes ahora también superan a las cámaras DSLR en condiciones de poca luz y de noche. Al integrar redes y sensores nerviosos profundos, las cámaras de los teléfonos inteligentes pueden capturar imágenes más claras en más colores de los que el ojo humano puede ver.

Huawei, que ha creado imágenes viables con el P20 Pro, utiliza filtros RYYB, sensores grandes e imágenes AI en la serie Mate 30 para ofrecer imágenes de video de alta calidad, con poca luz y con poca luz. Google Pixel se acerca 4 Con el modo Night Sight que puede tomar fotos en el rango Lux 0.3-3 Y la astrofotografía puede capturar un cielo estrellado oscuro. Además del modo nocturno activado automáticamente en la oscuridad, el nuevo sistema Deep Fusion de Apple se adaptará a los niveles de iluminación y llevará la fotografía del iPhone a un nivel más impresionante.

Incluso si no entiende la fotografía, puede tomar excelentes fotografías con ellos. smartphones.

5. Mayor seguridad y privacidad.

El aprendizaje automático facilita el cumplimiento de GDPR y la Ley de Privacidad del Consumidor de California (CCPA). Garantiza la seguridad de los datos, ya que no necesita cargar datos biométricos, cifrados o subtítulos en vivo en un servidor o en la nube para su procesamiento.

El cifrado autom√°tico en su dispositivo es otra caracter√≠stica √ļtil del tel√©fono inteligente que protege su contenido con un PIN, contrase√Īa o patr√≥n y solo accede a sus datos cuando desbloquea su tel√©fono. Entonces, si su dispositivo se pierde o es robado, la posibilidad de que alguien obtenga su informaci√≥n es insignificante.

Un ejemplo de la experiencia de teléfono inteligente más segura es Face ID para iPhone Redes neuronales en el dispositivo en Apple Administre chips de teléfonos inteligentes de forma segura y almacene los datos faciales del usuario. La identificación se realiza en su dispositivo, por lo que su privacidad y seguridad siguen siendo ilimitadas.

Desbloqueo facial se utiliza en Google Pixel 4 Facilitado por el chip Soli, establezca la profundidad IR 3D para crear patrones faciales para su reconocimiento facial y guárdelos en el chip de seguridad Titan M6 en el dispositivo. Face Unlock funciona bien con 1Password para proporcionar seguridad biométrica a los usuarios al eliminar la posibilidad de fraude de identidad. Cómo configurar la aplicación 1Password en Pixel 4 Simplemente ingrese sus datos en Autocompletar y use Desbloqueo facial para iniciar sesión en lugar de la función Desbloqueo por huella digital.

6. Mayor precisión en el reconocimiento de imágenes.

Al vincular el aprendizaje autom√°tico al dispositivo con la tecnolog√≠a de clasificaci√≥n de im√°genes, puede seleccionar informaci√≥n detallada y obtenerla en tiempo real sobre casi todo lo que encuentre. ¬ŅQuieres leer un texto en un idioma extranjero? Escanee con su tel√©fono para una traducci√≥n instant√°nea y precisa. ¬ŅHas recogido tu colecci√≥n de fantas√≠a o muebles? Escanee para obtener informaci√≥n sobre precios y d√≥nde comprarlo. ¬ŅHay un plato nuevo y atractivo en el men√ļ del restaurante? Puede usar su tel√©fono para conocer sus ingredientes e informaci√≥n nutricional.

Al facilitar el reconocimiento de imágenes en tiempo real, aplicaciones como Google Lens, Calorie Mama y Leafsnap aumentan la usabilidad, aprenden de los dispositivos móviles y mejoran la experiencia del usuario.

El potencial para el aprendizaje autom√°tico en el dispositivo es enorme. Con algoritmos inteligentes cada vez m√°s eficientes, redes neuronales m√°s profundas y chips de inteligencia artificial m√°s potentes, el aprendizaje profundo de las aplicaciones m√≥viles ser√° est√°ndar en banca, comercio minorista, atenci√≥n m√©dica, an√°lisis de datos, tecnolog√≠a de la informaci√≥n, comunicaciones, espacio y muchas otras industrias. Seg√ļn una investigaci√≥n de mercado aprobada, es probable que el mercado global de aprendizaje profundo alcance los $ 26.64 mil millones para 2026, con el mercado de tecnolog√≠a de chips de aprendizaje profundo llegando a 2.9 Miles de millones de dolares. A medida que la capacidad de aprendizaje profundo contin√ļa mejorando, las funciones de usabilidad en dispositivos m√≥viles se desarrollar√°n una al lado de la otra y generar√°n m√°s innovaci√≥n.

¬ŅQu√© opinas sobre el uso del aprendizaje profundo para mejorar los dispositivos m√≥viles? H√°ganos saber en los comentarios a continuaci√≥n o en Twitter, Facebook o MeWe.