Почему умные голосовые помощники пока никому не помогают

Почему умные голосовые помощники пока никому не помогают

Сказка послезавтрашнего дня

Колонка HomePod — иллюстрация того, как сложно идет продвижения и процесс разработки голосовых ассистентов и ими оснащенных устройств. На HomePod установлена совсем не та Siri, к что все привыкли — сказать колонка до тех пор пока будет лишь по-английски.

У HomePod имеется ограничения, которые связаны с голосовым комплектом, работой с календарем, она не может общаться на неспециализированные темы и шутить. В общем, младшая сестра Siri не весьма умна, но особенных претензий по этому поводу к ней предъявлять не следует.

И сама Siri, и другие голосовые помощницы — Сortana (Микрософт), Alexa (Amazon), Bixby (Samsung), «Алиса» (Яндекс), и единственный представитель «мужского рода» Гугл Assistant — также не блещут интеллектом.

И это в полной мере объяснимо. «Умные» голосовые ассистенты базируются на архитектуре нейронных технологии и сетей машинного обучения. Наряду с этим нужно осознавать, что в мозгу человека около 86 млрд нейронов, а в современном ИИ их всего пара сот тысяч. В случае если посчитать количество нейронов в нервной совокупности разных животных, то выяснится, что, как отметил глава и основатель компании ABBYY Дэвид Ян, на данный момент ИИ глупее пчелы.

Отчего же голосовые ассистенты завлекают такие инвестиции и такое внимание? В этом случае все достаточно легко. Имидж компании, устремленной в будущее, выглядит привлекательно и в глазах акционеров, и в глазах инвесторов и в конечном итоге воздействует на капитализацию бренда.

Компании публично не выделяют работы над голосовыми помощниками из неспециализированного RD-бюджета. Но как мы знаем, что солидную часть цены разработки голосовых ассистентов составляют НИОКР по разработке ИИ, на базе которого они трудятся. Цифры эти достаточно занимательные — так, к примеру, китайский интернет-гигант Baidu израсходовал на подобные работы около $3 млрд за 2015-2016 годы и $412 млн за три последних месяца 2017.

Амбиции имеется, опыта не достаточно

Но, не обращая внимания на все усилия и впечатляющие инвестиции, до конца не решены кроме того такие базисные неприятности, как распознавание речи. Отличие в распознавании между британским и остальными языками до тех пор пока еще весьма громадна.

Новости smi2.ru

По-русски на данный момент знают и говорят лишь два умных голосовых ассистента — Siri и «Алиса».

«Для каждого языка требуется обучение программ распознавания, когнитивной обработки выявленного синтеза и текста речи по организованному тексту. И потому, что русский язык в мире пользуется спросом намного меньше, чем английский язык , не все компании готовы тратить средства и время на разработки в этом направлении. Не достаточно и технологической базы, к примеру, мелок корпус русского, необходимый для методов машинного обучения», — вычисляет аналитик агентства MForum Analytic Алексей Бойко.

Однако, не сильный мультиязыковая помощь — далеко не основная неприятность голосовых ассистентов. Самое ответственное на данный момент — сделать «умные» голосовые ассистенты «еще умнее».

До тех пор пока кроме того такие безобидные занятия, как голосовой поиск, прокладка маршрута либо диктовка текстового сообщения, приводят к стрессу.

Количество разных инцидентов и просто нелепых историй, происходящих из-за несовершенства голосовых ассистентов, достаточно громадно и, вероятнее, будет расти по мере их распространения.

Так, к примеру, в январе 2018 года, жительница Нэшвила Сесилия Муле решила «обсудить» со своим iPhone понравившегося ей парня. Siri достаточно необычно отреагировала на попытку поболтать на свободную тему и послала молодому человек от имени Cесилии сообщение: «Ты мне когда-нибудь напишешь?».

Женщина поделилась собственной историей в твиттере, подписав публикацию «мои похороны состоятся в 20:00 в четверг». Как выяснилось в будущем, парень не оценил для того чтобы прямолинейного подхода и заблокировал Сесилию в соцсетях.

I JUST ASKED SIRI IF A CERTAIN BOY WOULD EVER TEXT ME AND SHE SENT A TEXT SAYING WILL YOU EVER TEXT ME TO HIM. My funeral will be held at 8pm this Thursday.

— Ceci (@CeciMula) 17 января 2018 г.

В 2017 году исследователи Николас Карлини и Давид Вагнер из университета в Беркли применяли изюминке распознавания речи нейросетевыми ИИ для хакерской атаки. Ее суть в подмешивании в трансляции либо музыкальные треки звуковых последовательностей, каковые не выявит человек, но на каковые реагирует голосовой ассистент.

Им удалось передать на смартфон команду, заставляющую открыть определенный сайт. Такая уязвимость дает много возможностей для преступников.

Более комичная история случилась годом ранее в Сан-Диего. Телевизионный канал CW6 сделал передачу об уязвимости «умной» колонки Amazon Echo, трудящейся под управлением голосового ассистента Alexa. В передаче рассказывалось о проблеме Amazon Echo, которая не может различать голоса и направляться указаниям любого человека, среди них и мелких детей.

Иллюстрируя уязвимость, один из ведущих сообщил фразу «I love the little girl, saying ‘Alexa, ПК a dollhouse» (рус. Мне нравится та девочка, которая сообщила: «Алекса, приобрети мне кукольный домик»).

Колонки Amazon Echo, каковые трудились у пользователей наблюдающих данный канал, начали в массовом порядке брать на Amazon кукольные домики.

Еще один недочёт голосовых ассистентов — их юзабилити. Те голосовые интерфейсы каковые предлагают Гугл, Apple и Amazon, весьма далеки от понятия юзерфрендли. К примеру, если вы набираете текст на клавиатуре, то исправить неточность возможно за секунду.

В случае если же вы его надиктовываете, то исправление неточности посредством голосовой команды преобразовывается в фактически невыполнимую миссию. Разъясняется это достаточно легко — на данный момент ни у кого нет опыта создания эргономичных голосовых интерфейсов.

Все будет, но не сходу

Все вышесказанное не означает, что современные голосовые ассистенты на базе ИИ бесперспективны и ненужны. Уже на данный момент на базе ИИ возможно создавать более либо менее эргономичные сценарии работы голосовых ассистентов, совмещая их с визуальными. Как раз в данной логике были созданы представленные в январе 2018 года умные колонки, оснащенные дисплеем, — к примеру, вы запрашиваете у голосового ассистента рецепт блюда, а он выводит его на экран.

Таких сценариев уже на данный момент возможно придумать много, в особенности тех, каковые связаны с распознаванием образов — это как раз та у область, где ИИ достиг громаднейшего прогресса.

Иногда разные исследователи выполняют тесты ИИ, выясняя кто же из них умнее, но тут серьёзны кроме того не полные цифры, в противном случае что

IQ ИИ удваивается приблизительно каждые два года.

Такая прогрессия говорит о том, что непременно ИИ все же достигнет уровня человека — но до этого до тех пор пока на большом растоянии. Согласно точки зрения ведущего аналитика Mobile Research Group Эльдара Муртазина, голосовые ассистенты в ближайшие год-два будут отличительным показателем премиальной потребительской электроники, а после этого перейдут в среднеценовой и бюджетный сегмент.

«на данный момент данный рынок лишь зарождается и находится в стадии «early adopters», но совсем совершенно верно, что интеллектуальные голосовые интерфейсы и голосовые помощники — это перспективная разработка, которая со временем войдет в любой дом. Скорость ее проникновения на рынок будет зависеть от цен на новую полезности и технику тех сервисов, каковые поддерживают голосовые интерфейсы, но в ближайшие два года на массовое проникновение интеллектуальных голосовых ассистентов в потребительскую электронику рассчитывать не следует», — вычисляет Муртазин.

Алексей Бойко кроме этого считает, что массовое внедрение голосовых ассистентов в повседневную судьбу случится не в скором будущем: «У голосовых ассистентов, непременно, яркие возможности. Но речь заходит о будущем, о новом качественном уровне, недостижимом на сегодня.

Множество людей испытывает недостаток, к примеру, в персональном «социальном» роботе, которого они желали бы применять в качестве собеседника, компаньона, приятеля. В ситуации с нулевым физическим интерфейсом он бывает всего лишь «голосом из смартфона».

Но чтобы выступать собеседником и, тем более, компаньоном, нужен качественный скачок в развитии разработок, значительное улучшение когнитивной функции.

Голосовой ассистент, которого захотел бы иметь любой, должен быть неотличим по возможностям голосового сотрудничества с ассистентом-человеком. В то время, когда разработки достигнут этого уровня, спрос на таких ассистентов-компаньонов будет космическим»

Пока же полезность голосового ассистента определяется прежде всего не его интеллектом, а интегрированностью распознавания и качеством речи в разные информационные сети, интернет-сервисы, совокупности «умного» города и «умного» дома.

Почему умные голосовые помощники пока никому не помогают


Похожие статьи, подобранные для Вас:

Читайте также: