УДК 004
Тенденции и перспективы развития голосовых роботов
Чистова Евгения Альбертовна – студент Национального исследовательского университета "Высшая школа экономики"
Аннотация: Цель статьи заключается в рассмотрении перспектив развития голосовых роботов-помощников. Углубленное прочтение позволяет более полно ознакомиться с тенденциями развития голосовых помощников и узнать, какие ограничения существуют на этапе их развития.
Ключевые слова: голосовой помощник, робот, эмоции, перспективы, развитие.
Голосовые помощники в современном мире уже являются неотъемлемой части социальной жизни, однако их развитие и внедрение только набирает обороты, что дает больше возможностей для создания уникальных проектов. Сотни тысяч обзваниваемых контактов в день уже не является чем-то сложным, при том, что никогда прежде не хватало никаких человеческих ресурсов для звонков в таком большом количестве.
Крупные компании все реже задаются вопросами о внедрении голосовых помощников в сферу продаж, сервисные службы, маркетинговые кампании. Как показывает практика, это часто показывает успешные результаты.
Улучшение голосового робота с помощью поставленной речи, отработок возражений клиента помогает воссоздать практически реальный диалог человека с человеком.
Быстрое развитие синтеза речи в последние годы позволило компьютерам генерировать речь, которая очень похожа на человеческую речь, включая эмоциональный голос [1].
Однако указание параметров эмоций, то есть индивидуальное соответствие робота эмоциональному состоянию человека по-прежнему является сложным способом для разработки голосовых роботов, но в то же время, является отличной перспективой. [2]
В одном из зарубежных исследований в эксперименте был использован робот-женщина, которая проводила случайные диалоги с участниками исследования. [3] Разговоры между роботом и участниками записывались и анализировались. Исследователи сосредоточились на следующих фразах робота: «Правда?», «А, понятно» и «Я поняла». Так как было обнаружено, что данные фразы чаще всего фигурируют в реальных диалогах. Оценка показала, что, когда роботы генерировали эмоции, имитирующие участников, они воспринимались как естественные и реальные по сравнению с теми роботами, у которых не было эмоций. Более того, также обнаружено, что даже когда фразы генерировались со случайными эмоциями, временами неподходящими по контексту, участники все же чувствовали обратную связь с роботом более естественно, чем без эмоций.
В настоящее время прилагаются значительные усилия для разработки функциональных и удобных в использовании вспомогательных роботов, поскольку они призваны решить серьезные текущие проблемы. Например, нехватка кадров и нехватка навыков в секторе здравоохранения, где люди со всеми видами нарушений могли бы извлечь выгоду из робота-помощника. [4]
Существуют также и некоторые ограничения во взаимодействии голосовых помощников и людей. Например, в американской системе здравоохранения пациенты взаимодействуют с различными людьми: терапевтами, страховщиками, аптеками и фармацевтическими компаниями, и это лишь некоторые из них. У каждого из них разные отношения и ситуации взаимодействия с пациентами, включая разные обязанности, границы и цели.
В реальной жизни пациенты без труда поймут, взаимодействуют ли они с терапевтом, страховой компанией или с работником аптеки. Однако в экосистеме голосовых домашних помощников пользователи беспрепятственно используют «ответы сотрудников», без четких указаний, когда они переключаются с одного игрока на другого. Эти плавные взаимодействия могут сбить с толку пользователей, которые могут иметь неясные или несогласованные ожидания.
Например, если пациент запрашивает у своего домашнего центра (голосового помощника) прогноз погоды и слышит прогноз вместе с предложением принять лекарство от аллергии в этот день, он может не понять, исходила ли эта рекомендация от врача, аптеки, метеотрекера или производитель лекарства.
Решение проблем таких ограничений является еще одним направлением для развития и улучшения голосовых помощников.
Таким образом, сфера голосовых роботов находится только на начальном этапе развития, соответственно перспективы в этом направлении глобальные. Голосовые роботы могут особенно быть полезными в ситуации, когда сотрудники теряют мотивацию и эффективность. В таком случае, роботы могут заменить их в работе над рутинными процессами. Их можно будет внедрить практически в каждой сфере жизни, это и HR, продажи, колл-центр и даже психологическая поддержка, однако в последнем направлении есть некоторые этические аспекты, которые обязательно должны быть учтены.
Список литературы
- Younggun Lee, Azam Rabiee, and Soo-Young Lee. 2017. Emotional end-to-endneural speech synthesizer (2017).
- Zhen-Hua Ling, Shi-Yin Kang, Heiga Zen, Andrew Senior, Mike Schuster, Xiao-Jun Qian, Helen M Meng, and Li Deng. 2015. Deep learning for acoustic modelingin parametric speech generation: A systematic review of existing techniques andfuture trends. IEEE Signal Processing Magazine 32, 3 (2015), 35-
- Yuanchao Li, Carlos Toshinori Ishi, Koji Inoue, Shizuka Nakamura, and TatsuyaKawahara. 2019. Expressing reactive emotion based on multimodal emotionrecognition for natural conversation in human–robot interaction. AdvancedRobotics 33, 20 (2019), 1030-1041.
- Richert A., Shehadeh M., Müller S., Schröder S., Jeschke S. Robotic Workmates: Hybrid Human-Robot-Teams in the Industry 4.0. In Proceedings of the International Conference on E-Learning, Kuala Lumpur, Malaysia, 2-3 June 2016.