Рынок умных колонок и голосовых ассистентов в россии и мире

Содержание

Как включить голосовой помощник Siri

Для активации голосового ассистента на айфоне или айпаде, вам нужно:

  1. Открыть «Настройки», выбрать раздел «Основные», а затем «Siri».
  2. Включить “Слушать «Привет, Siri!”. Для этого переключите тумблер в активное положение.
  3. Нажать кнопку «Настроить» и повторить простые выражения, чтобы голосовой ассистент смог запомнить ваш голос.

Что делать, если не работает голосовой помощник 

Бывают случаи, что даже после активации голосовой помощник не реагирует на ваши команды. В этом случае Google, Apple и Яндекс предлагают несколько вариантов решения проблемы. Подробности узнайте далее.

«ОК, Google»

  1. Убедитесь, что Google Ассистент действительно включен на Андроид. Затем следует нажать и удержать кнопку «Домой» на своем смартфоне либо планшете. Когда Google спрашивает вас, нужна ли вам помощь, значит голосовой помощник активирован. Заметьте, что на телефоне Pixel нельзя использовать команду «Окей, Google», пока не будет включен Ассистент.
  2. Отключите функцию Adaptive Battery и режим Battery Saver. Для этого вам нужно открыть «Настройки» на вашем гаджете и выбрать «Батарея». Выберите «Адаптивное энергопотребление» и отключите его, нажав соответствующий параметр. Кликните на «Режим энергосбережения» и отключите его.
  3. Проверьте список обновлений для Google-приложений. Кликните на «Обновить», открыв страницу программы. Если приложение уже обновлено, то вы увидите соответствующую надпись «Установлено».

В завершение, после исключения возможных вариантов проблем, скажите «ОК, Google», стараясь устранить все посторонние звуки и шумы.

Алиса

Как правило, голосовой помощник может не работать по нескольким причинам:

  1. Нет доступа к интернету. Для устранения ошибки проверьте подключение к мобильному интернету, Wi-Fi или LTE. Сервис не сможет работать, если нет доступа к беспроводной сети. Ведь функция распознавания голоса требует двухсторонний доступ к серверу.
  2. Ассистент не запускается после перезагрузки гаджета. Чтобы возобновить работу, выберите в панели управления «Пуск», а затем в поиске введите «Голосовой помощник».

Siri 

Если функция голоса не распознается, выполните на телефоне следующие шаги:

  1. Проверьте подключение к сети.
  2. Проверьте, включена ли функция Siri. В разделе «Настройки» найдите «Siri и поиск» и проверьте, чтобы были включены такие функции: «Вызов Siri кнопкой «Домой»», «Слушать «Привет, Siri»» и «Вызов Siri боковой кнопкой»*.
  3. Проверьте ограничения. Убедитесь, что функция голосового помощника не была отключена в ограничениях.
  4. Убедитесь в исправности микрофонов. Если голосовой помощник не отвечает вам, попробуйте снять защитную пленку и чехлы с микрофона и задайте вопрос снова. В случае использования AirPods проверьте подключенный гаджет iOS.
  5. Проверьте параметр «Аудиоотзыв». Для этого зайдите в раздел «Настройки». Далее откройте «Siri и Поиск», а потом «Аудиоотзыв».
  6. Проверьте громкость. Siri может не давать вам ответ, если отключен звук на устройстве. Для решения проблемы просто добавьте громкость на устройстве. 

Кроме того, функция голосового помощника может не работать по таким причинам:

  • айфон или айпад лежит экраном вниз;
  • закрыта крышка чехла;
  • активирован режим Battery Saver;
  • айпад либо айфон 6 (и ранние модели) не подключены к зарядке.

В нашей предыдущей статье вы можете узнать как выключить голосовой помощник в iOS, Android и Алиса.

Теперь вы знаете, как включить самые популярные голосовые помощники — Google, Siri и Алису. Их активация настолько проста, что ее может выполнить ребенок. А какой голосовой ассистент используете Вы?

Cortana для Windows

«Cortana» — голосовой помощник, интегрированный в операционную систему и созданный компанией Microsoft. Помощница предназначается прежде всего для Windows, но также в качестве приложений работает на платформах iOS, Android, Xbox One, Microsoft Phone, Microsoft Band. «Cortana» поможет систематизировать и распланировать ваши задачи и планы на определенный период, напоминает о выполнении каких-либо действий, предоставляет по вашему запросу информацию.  Также имеет встроенный функционал для ответов на общие вопросы, используя поиск Bing. В функционал входит прокладка маршрута, информация о состоянии дорог, поможет не опаздывать. Вводить информацию можно с помощью голоса и клавиатуры в текстовой форме. Она поддерживает разговор: поет песни, присылает анекдоты – не лишена чувства юмора.

К особенностям можно отнести такую функцию, как предугадывание желаний пользователя. Если дать доступ к личным данным, виртуальный помощник от Microsoft будет «подстраиваться» под вас, постоянно анализируя ваши действия: места, в которых вам нравится находиться; ваши предпочтения в тех или иных вещах; ваши долгосрочные интересы, хобби и многое другое.

Виртуальный ассистент Cortana тесно связана с операционной системой и может управлять Windows 10 и отдельными приложениями во время вашей работы: поможет прочитать Ваши электронные письма, отследить местоположение, проверить список контактов, следить за календарем, управлять музыкой и напоминания, охватывая многочисленные музыкальные приложения и контролируя звук в соответствии с  предпочтениями пользователя.

Есть возможно синхронизации нескольких устройств. Cortana будет поддерживать актуальность на нескольких компьютерах одновременно.

Что это такое

Голосовой помощник – это своего рода бот, реагирующий на голосовые запросы и команды. Работает бот на основе искусственного интеллекта, он способен узнавать голос юзера и обрабатывать полученные данные. Более продуманные программы способны вести диалог, есть версии, запрограммированные шутить, рассказывать сказки и даже петь песни. Основная необходимость в таких помощниках – выполнение срочных запросов и быстрый поиск информации.

При необходимости получить нужные сведения, включить музыку или позвонить кому-либо юзеру не придется использовать клавиатуру, а достаточно просто произнести задачу, предварительно вызвав помощника. Чтобы запустить голосовой интерфейс, иногда достаточно позвать его, а в некоторых случаях – нажать на кнопку. Для того, чтобы программа работала и выполняла задачи, в большинстве случаев требуется доступ в интернет.

Руководство по эксплуатации Siri

По инструкции, «Сири» включают двумя способами. Первый – нажимают клавишу «Home», удерживают, пока программа не спросит, чем может помочь.

Второй способ – произносят «Привет, Сири!» – начинается работа. Этот вариант возможен, если активировать соответствующий ползунок.

На iPhone 6S и более поздних моделях «Сири» активируется в любое время. На iPhone 6 и устаревших девайсах команда «Привет, Сири!» срабатывает, если только они стоят на подзарядке.

Когда программа запущена, на экране появляется диктофон. В этот момент делают запрос.

Программа пользуется поисковиком Bing. Если юзеру необходима другая система поиска, то он просит помощника найти ответ в «Гугл» или «Яндекс».

Умные колонки и умные дисплеи — устройства с голосовым помощником

Количество устройств, поддерживающих голосового помощника, становится все больше. Это очень динамично развивающийся сегмент рынка, в котором есть доля таких крупнейших игроков, как Google и Amazon. Вот самые популярные модели.

1. Google Home

Цена: около 10 000 рублей

Умный динамик, благодаря которому Google Ассистент останется в вашем доме надолго. Он высотой 14 см, выглядит очень элегантно и ответит на все ваши вопросы. Он постоянно подключен к электросети и Интернету. Он позволяет управлять музыкой, телевизором и широким спектром устройств умного дома.

Съемные основания помогут адаптировать его внешний вид к комнате. Google Home оснащен продвинутыми алгоритмами распознавания речи.

2. Google Home Mini

Цена: около 3 500 рублей

Меньший и более дешевый брат динамика Google Home. Он также служит «домом» для Google Assistant. В чем разница между Google Home и Google Home Mini? Google Home начнет предлагать лучшее качество звука. Также он лучше улавливает голос среди домашних звуков и шума. Кроме того, «Домашняя» версия питается от входа DC-in. Версия «Home Mini» через порт USB.

3. Google Nest Hub

Цена: около 17 000 рублей

В этом устройстве Google Assistant не только будет разговаривать с вами, но и сможет отображать информацию на ЖК-дисплее. Во многих случаях это значительно расширяет спектр возможностей по сравнению с Google Home. Вы можете, например, посмотреть фильм на YouTube, узнать, как приготовить любимое блюдо, посмотреть видео или проверить направление в навигации.

Google Nest Hub имеет размеры 118 × 178 см и оснащен 7-дюймовым сенсорным экраном

4. Google Chromecast

Цена: около 3 000 рублей

Небольшое устройство, позволяющее передавать по беспроводной сети звук и изображение с таких устройств, как компьютер, телефон или планшет, на экран телевизора. Единственное требование к телевизору — наличие разъема HDMI. Настройка Google Chromecast невероятно проста и занимает минуты.

Устройством можно управлять голосом с помощью Google Assistant.

5. Archos Привет 10

Цена: около 7 000 рублей

Устройство, основанное на функциях Google Assistant. Оснащен 10-дюймовым сенсорным экраном, аккумулятором на 6000 мАч и 4 динамиками для хорошего качества звука. Кроме того, он также имеет 5-мегапиксельную камеру, которая записывает видео в разрешении 720p.

Archos Hello 10 может воспроизводить самые популярные видеофайлы, такие как avi, wmv, mp4 или 3gp. Он поддерживает устройства умного дома от таких компаний, как Philips Hue, Netatmo или Ezviz.

6. Archos Привет 7

Цена: около 7 000 рублей

Уменьшенная версия Archos Hello 10. У Archos Hello 7 размер экрана 7 дюймов. Дисплей IPS имеет разрешение 1280х800 пикселей. Он также основан на всех функциях Google Assistant.

7. Archos Привет 5

Цена: около 8 000 рублей

Умный дисплей Archos Hello 5 имеет 5-дюймовый экран. В этой модели аккумулятор имеет емкость 3000 мАч. Работа устройства полностью основана на Google Assistant. Оборудование работает под управлением Android 8.1 Oreo.

8. Netgear Orbi Voice RBS40V

Цена: около 18 000 рублей

Умная колонка на базе помощника Amazon Alexa. Он позволяет искать информацию в сети и управлять голосовым управлением домашних устройств, интегрированных с Alexa. Достоинством динамика является отличное качество звука, за которое отвечает компания Harman Kardon. Оборудование оснащено запатентованной технологией FastLane3. Это гарантирует самую быструю доступную скорость Wi-Fi.

9 .Tichome Mini Google Ассистент

Цена: около 3 000 рублей

Умная колонка с помощью Google Assistant. Он питается от аккумуляторной батареи, поэтому вы можете положить его в карман и, например, выйти в сад, управляя освещением с помощью голосовых команд. Вам не нужно беспокоиться о дожде, потому что оборудование водонепроницаемо на уровне IPX6.

Tichome Mini Google Assistant также идеально подходит для воспроизведения музыки.

10. Amazon Echo

Цена: около 13 000 рублей

Умная колонка от Amazon. Работает с голосовым помощником Алекса. Он позволяет мгновенно искать в Интернете интересующую вас информацию и управлять устройствами умного дома, которые работают с Alexa.

Воспроизводит музыку из таких сервисов, как Amazon Prime Music или Spotify. Он может читать книги из нашей библиотеки Kindle или покататься на Uber. Он отлично разбирается в голосовой идентификации.

Будущее голосовых помощников на Андроид

Кто бы что ни говорил, а пока управление при помощи сенсорного дисплея кажется наиболее удобным. Всяческие Siri и Google Now пока пригождаются только в моменты острой спешки. Но нужно не забывать, что не все электронные устройства снабжаются большим экраном. На некоторых из них управлять теми или иными функциями действительно проще голосом. В частности, это касается умных часов. Неспроста, в Apple Watch Series 3 технология Siri получила возможность отвечать не только текстом, но и голосом. Достаточно давно в умных часах присутствует и Google Now.

Пока голосовые помощники сталкиваются с одной основной проблемой. Все мы говорим немного по-разному. А кто-то из нас разговаривает даже с акцентом. А ведь можно вспомнить ещё и огромное количество языков, на которых говорят люди по всему земному шару. Словом, таким сервисам пока очень трудно понять каждого человека и в абсолютно всех ситуациях. Крупные корпорации решают эту проблему огромными серверами, на которых обрабатывается масса информации, поступающей от голосовых помощников. Но у независимых разработчиков таких возможностей нет. В связи с этим можно предполагать, что будущее есть только у голосовых помощников, созданных компаниями Google, Apple и Microsoft. У них ведь есть и ещё одно заметное преимущество, заключающееся в больших рекламных бюджетах.

Сейчас голосовые помощники присутствуют в умных часах, смартфонах, планшетах, настольных компьютерах и ноутбуках. Но их будущее — не за этими платформами. Голосовые ассистенты когда-нибудь должны полностью вытеснить собой живых людей в службах поддержки. Вспомните сотовых операторов. К ним подключены десятки и даже сотни миллионов людей. В связи с этим операторам необходимо содержать многочисленную службу технической поддержки. А если бы людей заменили голосовые ассистенты, то операторам удалось бы сэкономить огромные деньги. Примерно таким же ярким видится будущее голосовых помощников и в сфере «умного дома». Управлять дверьми, бытовой техникой и безопасностью можно при помощи смартфона или планшета. Но гораздо проще было бы отдавать команды голосом. И компании Google, Apple и Amazon уже работают в этом направлении.

Голосовой ассистент для IOS — Siri

Siri — неотъемлемая часть iOS с момента запуска iOS 5 в 2011 году. Все начиналось с базовых функций, таких как погода и обмен сообщениями, но функционал значительно расширился с тех пор и интегрируется с MacOS.

Голосовой помощник Сири первоначально использовался только для мобильных устройств iPhone, iPad и iPod touch. На данный момент Сири работает и на макбуках с MacOS Sierra, с помощью эмулятора можно установить и на Windows.

В то время как шутки ранней Siri легендарны, виртуальный ассистент каждый день становится более совершенным. Теперь, Вы можете попросить позвонить знакомым, отправить сообщения, запланировать встречу, запустить приложения, игры, музыку, ответить на вопросы, установить напоминания и сообщить прогноз погоды на конкретную дату.

Siri может быть интегрирована со сторонними приложениями и работать с ними в дальнейшем. Это — большое изменение в политике компании Apple, которая обычно жестко контролирует доступ со стороны сторонних разработчиков.

Siri до выхода Яндекс Алисы по сути не имела конкуренции на русскоязычном рынке голосовых ассистентов. К тому же Сири имеет и существенный недостаток: ввод текста не поддерживается для большинства функций Siri, в то время как остальные помощники легко распознают текст с речевого и текстового ввода.

Последние обновления Siri включают речевую совместимость с WhatsApp, расширенные варианты оплаты для Lyft и Uber и возможности искать другую полезную информацию. Это незначительные дополнения по сравнению с изменениями, которые переживают другие виртуальные ассистенты, но они также указывают на поддержку и развитие приложения Siri — особенно для постоянных пользователей iOS, которые уже хорошо знакомы с голосом Сири.

О значении исследований

Несмотря на темпы развития сегмента, голосовые технологии только раскрывают свой потенциал. Голосовой помощник, который умеет поддерживать диалог и даже проявляет определенную чуткость, остается новинкой. И общение с ним все еще сложно назвать привычным. Так, согласно совместному исследованию Powerry и Neuro.net, 48% людей хотели бы до начала разговора знать, что будут общаться с ботом. И для 30% очень важна возможность в любой момент переключиться на общение с человеком.

Meticulous Research отмечают два фактора, которые несколько сдерживают рост рынка. Во-первых, до недавнего времени качественный голосовой помощник стоил очень дорого. А во-вторых, даже качественному помощнику еще многому предстоит научиться. Например, развивать навыки по считыванию эмоций или интерпретировать речь, несмотря на акцент.

Именно поэтому исследования особенностей коммуникации с виртуальным агентом представляют для сектора большую ценность. Они помогают специалистам в области ИТ и разработки искусственного интеллекта определять актуальные направления развития. А еще могут быть полезны психологам, маркетологам и социологам.

Способы повысить качество работы ассистента

Пересортировка ответов в выходном буфере
Можно ввести параметр очередности интентов и соответственно вариантов ответа по приоритетам. Это значит, что сообщения из выходного буфера озвучиваются в порядке приоритета. Например, запрашиваемое местоположение банкомата следует озвучить до информации о доступном в нем операциях (снятие/внесение наличных, открытие депозита и т.д.) или наоборот.
Настройки «перебивания»
Под этим усовершенствованием понимается возможность определять для некоторых интентов включение «перебивание» собеседника, когда содержимое выходного буфера начинает озвучиваться до того, как пользователь закончил свой рассказ

Данная настройка хорошо работает с предыдущей опцией, когда «перебивающий» ответ получает максимальный приоритет для озвучания из выходного буфера.
Важно отметить, что режим «перебивания» следует включать не для всех интентов, а лишь для некоторого, достаточно ограниченного набора.
Настройки категоричности
Возможно, что имеет смысл выделить некоторые интенты, которые имеют признак максимальной категоричности. Т.е

в случае обнаружения категоричного интента, ответы для остальных интентов удаляются из выходного буфера, оставляя в нем только этот, категоричный ответ. Возможно, что при этом дополнительно еще включается режим перебивания, когда ассистент начинает озвучивать ответ, не дослушав до конца сообщение пользователя. Примером могут выступать высказывания, которые система классифицирует как нарушающие моральные нормы и т.п.
Выявление противоречивых ответов
Очень желательно выявлять в выходном буфере ответы, которые противоречат друг-другу. В этом случае следует ответ с меньшим приоритетом просто удалять из выходного буфера.
Дополнительно имеет смысл при выявлении подобной ситуации, в сообщение, которое было оставлено в выходном буфере добавить предсообщение «Если я Вас правильно понял». Причина желательности такого добавления – наличие противоречивых данных в выходном потоке, как правило всегда является следствием противоречивости данных во входном потоке. Поэтому имеет смысл дать человеку понять, что присутствует некоторый элемент неуверенности, который может подтолкнуть его к необходимости дать дополнительные уточнения.
Определение пола собеседника
Если наделить ассистента возможностью определения гендерной принадлежности по голосу, то это позволит реализовать более близкий к естественному сценарий обработки. Таким образом появляется возможность реализовать различные ветки обслуживания, в т.ч. используя различную лексику при формировании одних и тех же ответов.
Анализ эмоционального состояния
В обычном разговоре двух и более людей, собеседники, как правило довольно точно могут определить эмоциональное состояние друг друга. Причем делается это не только по содержанию используемой лексики, например, факту наличия или отсутствия в речи ругательств, но и по тембру и скорости речи. Будет просто отлично, если ассистент сможет особым образом обслужить рассерженного пользователя.
Современные системы речевой аналитики достаточно хорошо справляются с задачей определения гендерной принадлежности и эмоционального состояния человека. Осталось только приспособить их к анализу разговора в режиме online.

Siri

Speech Interpretation and Recognition InterfaceViv

Преимущества

  1. Интеграция в операционную систему. Благодаря интеграции Сири не нужно устанавливать отдельно и она отлично справляется с простыми задачами, такими как поставить будильник, позвонить, отправить или прочитать сообщение.
  2. Конфиденциальность. Apple серьезно подходят к вопросам безопасности и не отправляет на сервера компании персонализированные данные.
  3. Быстрые команды. Возможность создавать собственные команды выполняющие несколько действий за раз.

Недостатки

  1. Конфиденциальность. Как ни странно, но забота о безопасности может быть одновременно достоинством и недостатком. Дело в том, что если не обрабатывать персонализированные данные, алгоритмы не смогут дать вразумительный ответ на запрос в котором эти данные присутствуют. 
  2. Не справляется со сложными запросами. Самый частый ответ от Сири на более или менее сложный вопрос будет «Вот что мне удалось найти в Интернете по запросу…«
  3. Непонимание контекста. Если спросить «Какая завтра будет погода?» вы получите приемлемый ответ, но если попытаться уточнить «Будет ли дождь?«, ответом будет прогноз погоды на сегодня, что говорит о полном непонимании контекста.
  4. Плохой синтезатор голоса. Если на английском языке он не так плох, то по сравнению с конкурентами, на русском просто ужасен.
  5. Темпы развития. За 7 лет практически ничего не изменились.

Facebook M

Что: Частично управляется искусственным интеллектом, частично людьми, и пока еще находится в разработке. M будет ассистентом с текстовым управлением в среде Facebook Messenger.

Особенности: Постарается сделать все, что вы попросите.

Недостатки: Пока еще не является готовым продуктом, и еще долго им не станет. Доступен только небольшому количеству пользователей в Сан-Франциско.

Уровень человечности: Крайне высокий, поскольку в формировании ответов на вопросы будут участвовать люди. По данным Wired, в компании надеются, что со временем M научится у этих операторов и сможет работать более независимо.

Резюме: На данный момент M – это лишь чуть больше, чем просто идея. Но, учитывая интерес Facebook к чат-ботам в целом, будет неудивительно, если именно M в итоге станет сверхинтеллектом.

История создания и запуска «Алисы»

Цифровой ассистент «Яндекс» удачно имитирует естественную человеческую речь, содержит в арсенале неограниченное количество ответов.

Разработки начались в 2016 году. На IT-рынке сформировалась тенденция к развитию цифровых ассистентов. У «Яндекс» уже были голосовые «Поиск» и «Навигатор», и он стал создавать интеллект, способный вести осмысленный диалог.

Тестирование «Алиса» проходила уже весной 2017 года. Официальный запуск состоялся в октябре. В мае 2018 приложение установили 53% пользователей смартфонов, а также в более чем 20 млн автомашин.

Голос и манера общения создают у пользователей представление, что «Алиса» – настоящая женщина. У нее спокойный, доброжелательный характер. Она понимающая, сдержанная, с чувством юмора. Задушевная собеседница, которая всегда рядом, готова выслушать. Друг, который не изменяет, не предает.

Ей рассказывают о здоровье, бедах и радостях, пытаются представить, как выглядит ее лицо. В интернете началась хуманизация «Алисы». Появилась целая галерея картинок, где она предстает в образе нечеловеческого существа (дерево, облако), в виде человека.

Вместе с ростом популярности «Алисы», начался ее троллинг в сети. Помощницу провоцировали грубостью и хамством. Но ее алгоритм содержит стоп-слова, которые она распознает, «обижается» и замолкает.

Продвинутые молодые люди, владеющие языком программирования, во множестве создают виртуальных помощниц. Вместо «Алисы» появилась «Анфиса – пацанский путеводитель». «Маруся» стала называться Машей.

Большинство голосовых ассистентов в мире – женщины. Точнее, говорят их голосами. Это психологический подход к потребителю. Слабый пол вызывает больше доверия, женские голоса звучат мягче.

Сценарии использования в бизнесе

Чаще всего боты заменяют менеджеров на входящих звонках и обзвоне. Один робот способен обработать за день до двух тысяч звонков. Компания может быстро окупить вложения на разработку помощника, убрав расходы на зарплаты, аренду площади, телефонию и интернет.

Голосовой ассистент может решать и локальные задачи бизнеса. Например, в числе кейсов Surf есть концепт для ресторана KFC. Клиенту помогает сделать заказ виртуальный полковник Сандерс. Пользователь может общаться с ним, как с кассиром.

С помощью полковника Сандерса можно:

  • быстро посмотреть нужный раздел меню, сказав «Покажи мне все бургеры»;

  • найти самое выгодное по цене блюдо: «Покажи мне все бургеры по акции»;

  • изучить новинки, близкие по вкусу. Система автоматически обрабатывает заказы постоянного клиента и предлагает попробовать блюда, схожие по составу;

  • заказать доставку домой. Если клиент заказывает не первый раз, ему не нужно говорить адрес и вводить контакты. Заказ оформляется в разы быстрее;

  • повторить заказ.

По данным рекламной сети AdColony за 2019 год, 61% покупателей предпочитает покупать у ритейлеров, которые позволяют изучить товар в дополненной реальности. Чтобы приложение максимально подтолкнуло клиента к покупке, мы предложили в пару к голосовому ассистенту использовать AR-режим для любого блюда.

Таким образом, голосовой ассистент помогает клиенту почувствовать себя так, будто он находится в реальном ресторане. Заказ блюд делается предельно быстро, компания может продать больше и сэкономить на обслуживании бизнеса.

Другой пример использования голосового помощника — семейство виртуальных ассистентов Сбербанка. Это кейс с прицелом на кастомизацию: помощников три, каждый со своим характером, голосом и целевой аудиторией. Количество сценариев соответствует широкому диапазону запросов: можно переводить деньги, записываться к парикмахеру, болтать, искать рецепты.

Juniper Research утверждает, что к 2024 году потребители будут взаимодействовать с голосовыми помощниками на более чем 8,4 миллиарда устройств. Казалось бы, такая статистика предвещает расцвет популярности голосовых помощников, что ведёт к росту кейсов, связанных с технологией. Но если всмотреться внимательнее, всё не так однозначно.

Инструкция по использованию

Чтобы упростить свои рабочие процессы, инсталлируют приложение «Алиса» – загружают бот с сайта разработчика.

Алгоритм для ПК:

  • открывают страницу разработчика;
  • нажимают «Скачать»;
  • ждут загрузки на ПК;
  • кликают «Установить»;
  • следуют указаниям системы.

Алгоритм для телефонов:

  • нажимают на ссылку официальной страницы приложения;
  • выбирают собственную систему на мобильном;
  • открывают магазин приложений;
  • набирают запрос;
  • выбирают программу, жмут «Установить».

Владельцы айфонов не могут установить приложение. Но можно загрузить на смартфон от компаний Meizi и «Хуавей» через «Плей Маркет». Голосовой помощник «Алиса» устанавливают бесплатно.

«Горыныч» – российская разработка для ПК

«Горыныч» – продукт отечественных разработок. Предназначен для ПК. Выполняет запросы пользователя, работает с программами и приложениями. Команды подают голосом или с помощью мыши и клавиатуры.

Бесплатная программа с приятным интерфейсом. Поддерживает ОП Виндовс.

Что умеет делать:

  • ищет информацию;
  • создает и преобразует текстовые файлы;
  • запускает установленные на компьютере программы и приложения;
  • вводит текст под диктовку без ошибок правописания.

Словарь помощника объемный, но пользователь может расширять его собственными словами и предложениями.

Программу загружают в любом браузере, в том числе, «Опера», Mazilla Firefox. В поисковой строке пишут «Скачать Горыныч». Система предложит список сайтов. Выбирают, нажимают «Скачать». После загрузки персональный ассистент готов помочь.

Голосовой поиск Google/Google Now

Что: Голосовой помощник от главного мирового поискового сервиса. Анализирует вашу почту и историю поисковых запросов. Работает на устройствах с Android, iOS и в браузере Chrome.

Особенности: Быстрый. Крайне точен при создании маршрутов. Пугает своей осведомленностью о ваших перелетах, бронированиях и других подробностях. Может взаимодействовать с некоторыми сторонними приложениями: управлять заметками, сообщениями и воспроизведением музыки.

Недостатки: Иногда надоедает излишней инициативностью (например, показывает результаты игр команд, которые вам неинтересны, или маршруты до дома из известных мест). Бесполезен при управлении «умным домом». Работа над интеграцией со сторонними приложениями, похоже, приостановилась.

Уровень человечности: Нулевой. Не располагает к общению. У него нет даже имени, кроме Google.

Резюме: Обширные запасы личных данных и доступ к поисковому движку, в теории, должны были сделать Google лидером отрасли, однако компания пока даже не смогла понять, как использовать свои преимущества и создать ассистента, который может понять пользователя. На сегодня Google Now и голосовой поиск на равных соперничают с Siri, но нового уровня развития пока не достигли.

А теперь — о конкурентах.

Что же делать?

  1. Сервис ASR анализирует речь в потоковом режиме, отдавая на следующий шаг результат по отдельным словам. На выходе данного шага мы всегда имеем одно единственное слово.
    Результат:
    a) «где»
    b) «находится»
    c) «ближайший»
    d) «банкомат»
  2. Происходит накопление слов, поступивших на вход, во входном буфере
    Результат:
    a) «где»
    b) «где находится»
    c) «где находится ближайший»
    d) «где находится ближайший банкомат»
  3. Накопленный результат передается на обработку текстовому ассистенту, с поддержкой NLU, для выявления интентов и сущностей.
    Результат:
    a) Запрос: «где». Результат: намерение не определено
    b) Запрос: «где находится». Результат: интент «Расположение отделения» с вероятностью 50%, «Расположение банкомата» с вероятностью 50%
    c) Запрос: «где находится ближайший». Результат: интент «Расположение отделения» с вероятностью 50%, «Расположение банкомата» с вероятностью 50%, сущность «Точка привязки» = «Текущее местоположение»
    d) Запрос: «где находится ближайший банкомат». Результат: интент «Расположение банкомата» с вероятностью 100%, сущность «Точка привязки» = «Текущее местоположение»Алгоритм работы голосового ассистента
  4. Если добавление нового слова, полученного на 1 шаге, не просто изменяет веса вероятности определенных ранее интентов, а меняет их состав либо за счет увеличения количества выявленных интентов, либо за счет полной замены их набора, то выполняются следующие действия:
    • из набора интентов предыдущей итерации выбирается вариант с наибольшей вероятностью и соответствующий ответ добавляется в выходной буфер;
    • входной буфер сбрасывается и туда заново вносится только это новое слово;
    • делается новый анализ, т.е. снова переходим на шаг 3.

    Всегда, по мере добавления слов в накопленное для анализа сообщение, должно изменяться значение вероятностей в уже выявленных интентах (фактически исключение интента из списка – равноценно заданию ему вероятности = 0%).
    Это значит, что постоянно должно происходить уточнение запроса. Если же наблюдается обратная ситуация, то это значит, что во входном сообщении есть несколько интентов, которые необходимо обрабатывать по отдельности, и мы сейчас перешли к слову, которое относится к новому интенту.

  5. Как только будет выявлено, что пользователь закончил свое сообщение (определяется по задержке во входном потоке), сбрасываем в выходной буфер ответ, соответствующий наиболее вероятному выявленному интенту. Еще лучше, для оптимизации по скорости, держать в выходном буфере не текстовое представление ответа, а сразу аудио-фрагмент, полученный от TTS, накапливая тем самым полный вариант ответного аудио-сообщения.
  6. Озвучиваем пользователю содержимое выходного буфера.

3 Amazon Alexa

Amazon Alexa появилась в колонке производителя, постепенно переместившись на мобильные устройства. Она является частью умного дома, контролирует огромное количество вещей. Например, открывает жалюзи и двери гаража, включает свет и телевизор, настраивает термостат и систему кондиционирования. Искусственный интеллект обучается, Amazon регулярно выпускает обновления. Голосовой помощник уверенно занял место лучших в 2015 году, и не собирается сдавать позиции.

В отзывах покупатели с восхищением говорят о функциональности ассистента. Он читает утренние новости, проигрывает любимые песни, ставит будильники, диктует аудиокниги, вызывает такси. Вместе с Amazon Alexa проходят тренировки, планируется расписание на день, совершаются звонки. Несмотря на самый обширный функционал, пользоваться помощником просто. Алекса в колонке от Амазон имеет 7 встроенных микрофонов, слышит команды со всех сторон, даже если в комнате шумно.

Amazon Alexa

Причина, по которой пользователи отдают предпочтение Amazon Alexa — это вовлеченность в «экосистему» Alexa. Этот помощник подойдет только для тех, кто знает английский язык и слушает песни с Amazon Music, смотрит фильмы и телевизионные шоу на Stick TV, пользуется умными-колонками Amazon Alexa.

Этот голосовой помощник даст вам мгновенный доступ к сервисам Alexa из любой точки дома. Просто скажите «волшебное слово» и виртуальный ассистент приготовится слушать и выполнять ваши команды. Особенно стоит отметить способности ассистента к интеграции сервисов Alexa с другими платформами и устройствами. Естественно, Alexa умеет делать и то, что входит в базовый набор любого голосового помощника: отвечать на вопросы, выдавать информацию о погоде и результатах спортивных матчей и многое другое. Все это, конечно же, только на английском языке. Для России, к сожалению приложение не адаптировано.

Какой голосовой помощник самый умный

Исследованием уровня интеллекта голосовых помощников занимается компания Stone Temple. Виртуальные ассистенты от «Гугл, Эппл», «Майкрософт» и «Амазон» подверглись масштабному тестированию.

Ассистенты отвечали на 4 952 вопроса. «Гугл Ассистент» дал больше всех верных ответов. Когда были заданы непонятные вопросы, он делал максимальное число попыток разобраться в теме.

Второй результат показала «Кортана». Третье место по критерию полезности заняла Google Assistant для Google Home. На их фоне хуже всех выглядела «Сири» от Эппл.

Все ассистенты стали лучше понимать вопросы по сравнению с прошлым годом. «Сири» продемонстрировала прогресс по правильным ответам от сторонних источников. В прошлые годы «Сири» была самой остроумной и веселой, но теперь уступила «Алексу».

Вывод специалистов: электронные ассистенты еще не идеальны, но виден огромный сдвиг в их усовершенствовании.

Максимально полезным помощником признан «Гугл Ассистент».

DataBot

Какой голосовой помощник лучше всех, если нужно синхронизировать его с несколькими устройствами? DataBot — один из самых хороших сервисов для Android, который вы способны использовать для получения всевозможной информации либо ее воспроизведения.

Взаимодействовать с ним возможно либо посредством микрофона, либо вводом с клавиатуры текста. Программа будет искать для вас любые данные, которые вы захотите. DataBot будет хорошим помощником, когда вы находитесь в путешествии, на учебе, работе, в играх или при отдыхе. Он также может обращаться к вам по любому вашему имени. Кроме всего прочего, это кросс-платформенное ПО, поэтому вы можете применять его на смартфоне, а также планшете и ноутбуке.

Сервис DataBot комфортен в использовании. Доступен он бесплатно, и может работать на пяти языках, помимо английского. Сервис содержит объявления и предлагает покупки.