Amazon anunció el miércoles un gran lote de nuevos productos, dejando en claro una vez más que quiere distribuir su asistente digital Alexa en la mayor cantidad posible de categorías tecnológicas de consumo, no solo altavoces inteligentes, sino todo, desde auriculares hasta anteojos y anillos . Pero había otra historia entretejida en los anuncios en Seattle. Más inteligencia artificial, específicamente IA de lenguaje natural, está llegando a Alexa y de más maneras.
Para empezar, Amazon dice que ha estado utilizando redes neuronales para hacer que la voz de Alexa suene más humana cuando traduce texto (como sus mensajes de texto) en voz. Rohit Prasad, quien dirige el aprendizaje automático y la inteligencia artificial de Alexa, me dijo que esta tecnología le ha permitido a Amazon adoptar un enfoque totalmente diferente para generar el habla.
En el pasado, los algoritmos de Alexa descomponían el lenguaje en partes de palabras o sonidos vocales, luego trataban de unirlos lo más suavemente posible. Pero siempre sonaba algo entrecortado y robótico. Ahora, Amazon está utilizando redes neuronales que pueden generar oraciones completas de texto en tiempo real, dice Prasad. Esto crea un sonido vocal que es más fluido y más humano. (Siri de Apple y Asistente de Google también han logrado voces más naturales recientemente a través de medios similares).
Es este mismo modelo de lenguaje natural el que muy pronto le dará a Alexa voces completamente diferentes. Amazon dice que comenzará con las celebridades, siendo Samual L. Jackson el primero. Amazon venderá Jackson-as-Alexa como un servicio adicional a partir de este año.
La voz Jackson de Amazon está impulsada, al menos en parte, por un modelo de lenguaje natural. El modelo aprende de la voz de Jackson (grabó un montón de muestras en un estudio) para generar una voz que imita su tono distintivo al tiempo que proporciona las respuestas y la información que el asistente normalmente proporcionaría. Pero Amazon también "seleccionó" un conjunto de expresiones completas de Jackson para que el asistente las use cuando sea el momento adecuado.
Jackson probablemente será la primera de muchas voces de celebridades que Amazon ofrecerá como alternativas a la voz estándar de Alexa. (Google, mientras tanto, dejó que el Asistente de Google hablara como John Legend a principios de este año, también debido a los avances en el uso de IA para sintetizar voces).
Amazon también agregó algunos trucos de aprendizaje automático a sus cámaras de timbre Ring. En un nuevo servicio que Amazon llama "Conserje de timbre", los dispositivos pronto podrán detectar varios tipos de personas que se presentan en la puerta de entrada sin previo aviso. La demostración que vi presentaba tres tipos de visitantes: un chico que entregaba un paquete, una Girl Scout que vendía galletas y un hombre no identificado. El Anillo los involucró a todos en un breve diálogo para descubrir lo que querían, y una red neuronal en el fondo usó lo que dijeron para determinar qué tipo de llamada eran. Lo hizo basándose solo en lo que dijeron, no en las imágenes de la cámara. La categorización luego informó al dispositivo Ring qué decirle a cada uno. Por ejemplo, le dijo al repartidor dónde colocar el paquete, luego de preguntarle si necesitaba una firma.
La nueva función Concierge aún no está lista para el mercado. Cuando se lance, es probable que pueda reconocer un pequeño conjunto de tipos de llamadas. Pero ese conjunto probablemente crecerá.
El año pasado, Amazon expandió la audición de Alexa para detectar más que solo comandos humanos. Como parte de su modo de seguridad para el hogar Guard, el sensible conjunto de micrófonos utilizado en los altavoces Echo comenzó a escuchar los sonidos de rotura de vidrios y alarmas de humo cuando nadie estaba en un hogar. Ahora Amazon ha agregado la capacidad de escuchar sonidos relacionados con los humanos en el hogar mientras Guard está configurado en su modo "ausente". Estos incluyen los sonidos de pasos, tos y puertas cerradas cuando se supone que no hay nadie en casa. Alexa puede enviar una alerta a un usuario si detecta uno de estos sonidos.
En todos estos casos, un modelo de aprendizaje profundo está tomando la entrada de audio de los micrófonos y marcando sonidos potencialmente peligrosos. Amazon podría entrenar al asistente para escuchar muchos otros tipos de sonidos. Por ejemplo, los dispositivos Alexa podrían comenzar a escuchar los sonidos de caídas o respiración dificultosa en lugares donde viven personas mayores. Nadie sabe si Amazon se mueve en esta dirección, pero el hecho de que la compañía esté agregando constantemente cosas que Alexa puede escuchar es revelador.
Un área relativamente nueva en la investigación del lenguaje natural es el uso de redes neuronales para detectar emociones a través de palabras y entonaciones. Amazon se ha centrado en el sonido de la frustración en las voces de las personas que hablan con Alexa. Cuando detecta frustración, Alexa puede concluir que recibe una respuesta que no le gustó al usuario y luego buscar otra forma de responder. Prasad dijo que Amazon tiene su propio conjunto de grabaciones etiquetadas de personas que parecen frustradas, que utiliza para entrenar las redes neuronales.
Pero es un problema difícil. El asistente debe saber cómo reaccionar después de detectar a una persona frustrada. Y si se necesita otra puñalada para proporcionar una respuesta, es mejor que el asistente esté bastante seguro de que la segunda respuesta es útil. Y hay momentos en que el asistente tiene que decir "Lo siento, no tengo la respuesta".
"Estamos comenzando a experimentar con estas diferentes formas de responder, y una vez que se lance, verá muchos sabores diferentes", dijo Prasad.
Este tipo de conciencia emocional probablemente comenzará a aparecer en muchos tipos de asistentes. Cualquier asistente debe ser capaz de saber cuándo se ha hecho algo mal y ser capaz de abrir un ciclo de retroalimentación para mejorar.
La función de detección de frustración probablemente aparecerá en Alexa el próximo año.
El directorio en línea más completo para encontrar detalles de negocios, contactos, productos, servicios y precios.
info@chileguia.cl