Как работает Алекса? Объяснение технологии виртуального помощника Amazon

Динамик Amazon Echo Dot Alexa с включенным световым кольцом, фото 1
Эдгар Сервантес / Android Authority

У нас есть несколько руководств по использованию Amazon Alexa на Управление Android, но вам может быть интересно узнать о технологии, лежащей в основе голосового помощника. Вот краткое объяснение того, как работает Alexa, от ее общей структуры до того, как она слышит голосовые команды и реагирует на них.

Как работает Alexa: обзор

Amazon Echo Show 15 на стене.
Амазонка

Базовыми компонентами Alexa, с точки зрения пользователя, являются учетная запись Amazon и устройство с поддержкой Alexa, подключенное к Интернету, обычно умный динамик или дисплей. Учетная запись позволяет создавать профиль, сохранять настройки программного и аппаратного обеспечения и связывать совместимые устройства, службы и аксессуары. Устройства Alexa прослушивают голосовые команды, загружают их на серверы Amazon для перевода, а затем предоставляют результаты в виде аудио или видео. Некоторые модели также служат концентраторами Thread или Zigbee для совместимых продуктов для умного дома.

Все голосовые команды начинаются со слова пробуждения, которое заставляет устройство слушать. По умолчанию, конечно, «Алекса», но с помощью приложения помощника для Android или iPhone/iPad вы можете изменить его на «Амазон», «Компьютер», «Эхо» или (в некоторых регионах) «Зигги». Фактически приложение является третьим базовым компонентом, поскольку оно необходимо для настройки устройства и привязки вещей к вашей учетной записи Amazon.

Есть много, много возможных команд Alexa, поэтому мы не будем погружаться здесь слишком далеко, но это голосовые запросы на естественном языке, охватывающие все, от вопросов о знаниях до воспроизведения мультимедиа и управления умным домом. Например:

  • «Алекса, какая погода на улице?»
  • «Алекса, перетасуйте лучший эмбиентный плейлист, который вы найдете на Spotify».
  • «Алекса, установи термостат в гостиной на 72 градуса».
  • «Алекса, как близко ближайшая звезда?»

Некоторые функции требуют включения «навыков», будь то через веб-сайт Amazon или приложение Alexa. Используя приведенные выше команды в качестве примеров, музыкальная не будет работать без навыка, связанного с вашей учетной записью Spotify, а для управления термостатом потребуется соответствующий навык бренда, такой как Ecobee или Nest.

Большинство навыков бесплатны, так как на самом деле они просто поддерживают существующие продукты и услуги. Платные навыки редки, но они существуют и, как правило, являются самодостаточными развлекательными продуктами, такими как голос Мелиссы Маккарти.

Связанный: Лучшие навыки и приложения для Alexa

Приложение Alexa также включает подпрограммы, что является еще одним словом для автоматизации. Вы можете узнать больше о них в нашем руководстве по процедурам. Краткая версия заключается в том, что они создаются пользователем и запускают действия на основе голосовых команд или различных условий, таких как местоположение, статус аксессуара или время суток. Например, процедура «Доброе утро» может включать свет, воспроизводить новости NPR и нагревать кофеварку с помощью умной розетки, когда вы говорите «Алекса, начни мой день».

Чтобы Alexa управляла аксессуарами для умного дома, они должны специально поддерживать платформу или универсальный стандарт Matter. Однако доступны практически любые типы аксессуаров. Помимо розеток, термостатов и умных лампочек, вы можете получить все, от очистителей воздуха до роботов-пылесосов. Они соединяются с помощью приложения Alexa, независимо от того, подключаются ли они через навыки, Thread или Zigbee.

Более: Как использовать Амазон Алекса

Как Алекса слышит?

Боковой профиль Amazon Echo Show 8 с элементами управления умным домом
Дхрув Бхутани / Android Authority

Хотя все устройства, оснащенные Alexa, имеют как минимум один микрофон, на интеллектуальных динамиках и дисплеях часто их два или более. Это упрощает выделение голосов из окружающего шума, поскольку создает данные о направлении, которые можно сравнивать и фильтровать с помощью алгоритмов обработки сигналов. Конечно, существуют конечные пределы — вы не можете стоять рядом с громким телевизором или посудомоечной машиной и ожидать, что динамик Echo поймет.

Вопреки тому, что вам, возможно, сказали, Alexa не записывает постоянно все, что вы говорите. Это является постоянно прислушиваясь к своему пробуждающему слову, и последующий звук (заканчивающийся после того, как вы перестаете говорить) обычно отправляется в Amazon для интерпретации. Мы говорим «нормально», потому что Amazon все больше склоняется к офлайн-обработке. Однако вам нужны новейшие устройства, такие как Echo или Echo Show 10 4-го поколения, которые имеют один из процессоров AZ Neural Edge компании. Эта функция также должна быть включена вручную, и устройства по-прежнему будут загружать стенограммы.

Amazon заявляет, что шифрует загруженные аудиозаписи, но сохраняет их по умолчанию и анализирует «чрезвычайно маленькую выборку» анонимных клипов, чтобы улучшить производительность Alexa. Записи использовались в уголовных делах, и некоторые звуки или фразы могут быть неверно истолкованы как слова пробуждения, поэтому, если вы беспокоитесь о конфиденциальности, вам следует отказаться от сохранения или регулярно удалять историю голосовых сообщений. Прочтите наше руководство по конфиденциальности для умного дома, чтобы узнать подробности и сравнить.

Смотрите также: Как настроить Alexa для экстренных случаев

Как отреагирует Алекса?

Amazon Echo Dot 4-го поколения в 2020 году
Амазонка

Причина, по которой Alexa до недавнего времени полностью зависела от облака, заключается в требованиях обработки естественного языка. Каждая команда разбивается на отдельные речевые единицы, называемые фонемами, а затем эти единицы сравниваются с базой данных, чтобы найти наиболее близкие совпадения слов. Кроме того, программное обеспечение должно определять структуру предложения, а также термины, относящиеся к различным подсистемам. Если вы скажете «установите термостат на охлаждение», Alexa знает, что перенаправит это в API умного дома (интерфейс прикладного программирования).

Это основная причина, по которой Alexa может различать акценты и диалекты. Существуют уникальные базы данных для каждого поддерживаемого Amazon языка, включая региональные варианты, и пользователям необходимо выбрать их в приложении Alexa, если их устройство не поставляется с предварительно загруженными. Динамик American Echo не поймет немецкий сразу, как может подтвердить любой, кто спрашивал песни Nachtmahr.

Машинное обучение также играет решающую роль, поскольку контекст и история позволяют Alexa лучше угадывать ваши намерения. Вот почему Amazon так много внимания уделяет анализу записей реальных клиентов. Люди склонны использовать контекст и историю для оценки смысла разговора, и с помощью только компьютерной логики Alexa может интерпретировать что-то вроде «включи музыку Chvrches» (шотландская синти-поп-группа) как просьбу послушать музыку в исполнении церковного хора. Alexa может ошибаться и делает ошибки, но у Amazon есть доступ к огромному количеству данных, к которым помощник со временем совершенствуется.

В ответах используется синтезированная речь на основе записанных образцов голоса. В частном порядке Amazon экспериментирует со звуковой имитацией, включая даже мертвые голоса.

Продолжать: Лучшие Alexa-совместимые устройства для вашего дома

Часто задаваемые вопросы

Эффективно. В то время как некоторые устройства могут разрешать автономное голосовое управление громкостью и подключенными к концентратору аксессуарами для умного дома, а также проверять и отменять такие вещи, как таймеры и напоминания, почти все остальное требует связи с серверами Amazon и/или связанными сторонними службами. Даже устройства, которые могут обрабатывать звук локально, по-прежнему загружают стенограммы.

Да, если вы не отключили микрофон(ы) устройства. Это необходимо для того, чтобы отреагировать на свое слово пробуждения.

Важно, однако, что он не записывает все. Запись запускается только после обнаружения пробуждающего слова и заканчивается, когда вы перестаете говорить (или, во всяком случае, Alexa думает, что вы это сделали). Если вы беспокоитесь о конфиденциальности, вам нужно отказаться от сохранения этих записей или регулярно удалять голосовую историю.

По некоторым определениям. Он способен к ограниченному обучению и решению проблем, например, к интерпретации голосовых команд, для которых он не был предварительно запрограммирован.

Тем не менее, в конечном итоге это пример того, что называется «слабым» ИИ. Он не проявляет такой же гибкости или приспособляемости, как разум человека или животного. У вас не может быть настоящего разговора, и его обучение происходит постепенно, а не на лету. Это определенно далеко не разумно, как бы трудно это ни было определить.


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *