УДК 004

Тенденции и перспективы развития голосовых роботов

Чистова Евгения Альбертовна – студент Национального исследовательского университета "Высшая школа экономики"

Аннотация: Цель статьи заключается в рассмотрении перспектив развития голосовых роботов-помощников. Углубленное прочтение позволяет более полно ознакомиться с тенденциями развития голосовых помощников и узнать, какие ограничения существуют на этапе их развития.

Ключевые слова: голосовой помощник, робот, эмоции, перспективы, развитие.

Голосовые помощники в современном мире уже являются неотъемлемой части социальной жизни, однако их развитие и внедрение только набирает обороты, что дает больше возможностей для создания уникальных проектов. Сотни тысяч обзваниваемых контактов в день уже не является чем-то сложным, при том, что никогда прежде не хватало никаких человеческих ресурсов для звонков в таком большом количестве.

Крупные компании все реже задаются вопросами о внедрении голосовых помощников в сферу продаж, сервисные службы, маркетинговые кампании. Как показывает практика, это часто показывает успешные результаты.

Улучшение голосового робота с помощью поставленной речи, отработок возражений клиента помогает воссоздать практически реальный диалог человека с человеком.

Быстрое развитие синтеза речи в последние годы позволило компьютерам генерировать речь, которая очень похожа на человеческую речь, включая эмоциональный голос [1].

Однако указание параметров эмоций, то есть индивидуальное соответствие робота эмоциональному состоянию человека по-прежнему является сложным способом для разработки голосовых роботов, но в то же время, является отличной перспективой. [2]

В одном из зарубежных исследований в эксперименте был использован робот-женщина, которая проводила случайные диалоги с участниками исследования. [3] Разговоры между роботом и участниками записывались и анализировались. Исследователи сосредоточились на следующих фразах робота: «Правда?», «А, понятно» и «Я поняла». Так как было обнаружено, что данные фразы чаще всего фигурируют в реальных диалогах.  Оценка показала, что, когда роботы генерировали эмоции, имитирующие участников, они воспринимались как естественные и реальные по сравнению с теми роботами, у которых не было эмоций. Более того, также обнаружено, что даже когда фразы генерировались со случайными эмоциями, временами неподходящими по контексту, участники все же чувствовали обратную связь с роботом более естественно, чем без эмоций.

В настоящее время прилагаются значительные усилия для разработки функциональных и удобных в использовании вспомогательных роботов, поскольку они призваны решить серьезные текущие проблемы. Например, нехватка кадров и нехватка навыков в секторе здравоохранения, где люди со всеми видами нарушений могли бы извлечь выгоду из робота-помощника. [4]

Существуют также и некоторые ограничения во взаимодействии голосовых помощников и людей. Например, в американской системе здравоохранения пациенты взаимодействуют с различными людьми: терапевтами, страховщиками, аптеками и фармацевтическими компаниями, и это лишь некоторые из них. У каждого из них разные отношения и ситуации взаимодействия с пациентами, включая разные обязанности, границы и цели.

В реальной жизни пациенты без труда поймут, взаимодействуют ли они с терапевтом, страховой компанией или с работником аптеки. Однако в экосистеме голосовых домашних помощников пользователи беспрепятственно используют «ответы сотрудников», без четких указаний, когда они переключаются с одного игрока на другого. Эти плавные взаимодействия могут сбить с толку пользователей, которые могут иметь неясные или несогласованные ожидания.

Например, если пациент запрашивает у своего домашнего центра (голосового помощника) прогноз погоды и слышит прогноз вместе с предложением принять лекарство от аллергии в этот день, он может не понять, исходила ли эта рекомендация от врача, аптеки, метеотрекера или производитель лекарства.      

Решение проблем таких ограничений является еще одним направлением для развития и улучшения голосовых помощников.

Таким образом, сфера голосовых роботов находится только на начальном этапе развития, соответственно перспективы в этом направлении глобальные. Голосовые роботы могут особенно быть полезными в ситуации, когда сотрудники теряют мотивацию и эффективность. В таком случае, роботы могут заменить их в работе над рутинными процессами. Их можно будет внедрить практически в каждой сфере жизни, это и HR, продажи, колл-центр и даже психологическая поддержка, однако в последнем направлении есть некоторые этические аспекты, которые обязательно должны быть учтены.

Список литературы

  1. Younggun Lee, Azam Rabiee, and Soo-Young Lee. 2017. Emotional end-to-endneural speech synthesizer (2017).
  2. Zhen-Hua Ling, Shi-Yin Kang, Heiga Zen, Andrew Senior, Mike Schuster, Xiao-Jun Qian, Helen M Meng, and Li Deng. 2015. Deep learning for acoustic modelingin parametric speech generation: A systematic review of existing techniques andfuture trends. IEEE Signal Processing Magazine 32, 3 (2015), 35-
  3. Yuanchao Li, Carlos Toshinori Ishi, Koji Inoue, Shizuka Nakamura, and TatsuyaKawahara. 2019. Expressing reactive emotion based on multimodal emotionrecognition for natural conversation in human–robot interaction. AdvancedRobotics 33, 20 (2019), 1030-1041.
  4. Richert A., Shehadeh M., Müller S., Schröder S., Jeschke S. Robotic Workmates: Hybrid Human-Robot-Teams in the Industry 4.0. In Proceedings of the International Conference on E-Learning, Kuala Lumpur, Malaysia, 2-3 June 2016.

Интересная статья? Поделись ей с другими: