УДК 004.378.147

Улучшение производительности когнитивных ассистентов с помощью алгоритма «Изучение последовательности»

Николаев Никита Сергеевич – магистрант МИРЭА – Российского технологического университета

Лобанов Александр Анатольевич – кандидат технических наук, доцент МИРЭА – Российского технологического университета

Аннотация: Целью настоящей статьи является изучение и выявление возможностей для модификации и улучшения систем когнитивного ассистирования используя метод изучения шаблонных последовательностей. Исследование проводилось для выполнения задачи повышения эффективности и скорости работы приложений нейро-лингивистического программирования для помощи в различной деятельности, в т.ч. и в учебной. В результате был продемонстрирован способ улучшения производительности новым алгоритмом в сравнении с аналогичными когнитивными ассистентами. Был проведен анализ предметной области, изучен и выявлен новый алгоритм для улучшения производительности интеллектуальных ассистентов.

Ключевые слова: машинное обучение, когнитивные ассистенты, искусственные виртуальные ассистенты, искусственные виртуальные агенты, искусственный интеллект, обработка естественного языка, нейросеть.

В современном информационно развитом обществе использование технологий стало действительно повсеместным, развились очень сложные алгоритмы для работы программных комплексов, призванных помочь как в выполнении целей бизнес-корпораций, так и в помощи обычным людям в их ежедневных потребностях. Текущее развитие ИТ-сферы позволило создать из ПО полноценных помощников и подсказчиков людям.

Развитие когнитивных-ассистентов стало возможно за счет разработки продвинутых алгоритмов, а именно технологическое улучшение в сфере машинного обучения. Машинное обучения [1] позволило информационным системам по-настоящему учиться, развивая новые навыки и умения, в зависимости от того, какие условия и процессы были применены для обучения.

Именно изучение алгоритмов машинного обучения, в т.ч. и в частном случае их использования в когнитивных ассистентах, а также потенциальное улучшение позволит значительно улучшить как эффективность выполнения бизнес-задач, так и облегчить жизнь обычных людей.

Можно выделить следующие ключевые особенности систем ML, в т.ч. и рассматриваемых когнитивных ассистентов:

  • системы нацелены на выполнение творческих [2], логических и иных умственных задач и функций, но не обязаны имитировать человеческое поведение;
  • системы не являются жестко запрограммированными скриптами на выполнение заранее предопределенного набора функций, а способны обучаться и адаптироваться в зависимости условий и ограничения от создателя ПО;
  • системах необходимо использование хранилища данных, чтобы черпать информацию (она не должна быть жестко закодирована в самой системе), однако никакого ограничения на тип хранилища не предписано;
  • системы не обязаны имитировать повадки человека, а также имитировать личность, данные особенности могут быть реализованы, но данное условие обязательным не является.

Среди возможных алгоритмов обучения системы в рамках нейронных сетей [3] и machine learning особенно выделяется так называемое обучение без учителя.

Преимущество машинного обучения без учителя заключается в том, что оно позволяет работать с немаркированными данными. Это означает, что для того, чтобы сделать набор данных машиночитаемым, не требуется человеческого труда, что позволяет программе обрабатывать гораздо большие наборы данных.

При контролируемом обучении метки позволяют алгоритму находить точную природу взаимосвязи между любыми двумя точками данных. Однако неконтролируемое обучение не имеет ярлыков для отработки, что приводит к созданию скрытых структур. Взаимосвязи между точками данных воспринимаются алгоритмом абстрактно, без каких-либо входных данных, требуемых от людей.

Создание этих скрытых структур – это то, что делает неконтролируемые алгоритмы обучения универсальными [4]. Вместо определенной и заданной постановки задачи неконтролируемые алгоритмы обучения могут адаптироваться к данным путем динамического изменения скрытых структур. Это обеспечивает большую разработку после развертывания, чем алгоритмы контролируемого обучения.

Чтобы определить, в какие системы может быть возможным внедрения нового алгоритма были выбраны две наиболее распространенные группы систем совершенно разных, с разной направленностью.

Первым типов является ПО пользовательского сегмента, не направленное на решение сложных бизнес-задач, однако требуется, чтобы ИС была доступной и понятной совсем не специалистам в любых технических и математических сферах.

Вторым типом является исключительно корпоративный когнитивный ассистент, направленный на решение задач бизнес, как исключительно в ИТ-сфере, так и, например, банкинг-сегментах или же в решении сложнейших вычислительных задач на суперкомпьютерах.

Улучшение, модификация и применение новых алгоритмов к когнитивным ассистентов корпоративного сегмента, т.е. 2 типа, (которые зовутся виртуальными агентами) не является выполнимой задачей без доступа к суперкомпьютерам или же огромным базам данных, которые находятся в частном собственности, возможность получить который есть лишь у больших мега-корпораций и технологических гигантов, как IBM или иных компаний.

Создание модификации в пользовательских, клиентских голосовых ассистентах, а также определить возможные новые изменения в имеющихся алгоритмах является вполне реализуемой задачей, в том числе и внедрение предлагаемого ниже алгоритма.

Для улучшения алгоритмов виртуальных ассистентов, в целом, и их производительности, в частности, предлагается использовать [5].

Данной компаний было установлено, что типичный разговор между пользователем и помощником следует за последовательностью сообщений, специфичных для каждого домена.

Разговор может начинаться с приветствия или случайного сообщения (напр. «Привет, доброе утро!»), затем следует фактическая задача, которую необходимо выполнить, а затем происходит обмен следующей парой сообщений для получения всей необходимой информации (например: дата, время, пункт назначения, место доставки).

Наконец, необходимо отправить подтверждение после завершения задачи, за которым может последовать подтверждение или приветствие от пользователя. На основе исследований [6], был сделан вывод, что сообщения, которыми обмениваются для каждого домена, могут быть разделены на конечное число значимых кластеров, и каждый диалог может быть представлен последовательностью идентификаторов кластера.

С тысячами разговоров, происходящих ежедневно в рамках множества систем, в целом, а также в рамках свободных источников информации по всему интернету, были доступны для анализа миллионы последовательностей для изучения, и была создана точная модель для прогнозирования следующего кластера в текущей последовательности.

1

Рисунок 1. Обучение без учителя методом «изучения последовательности» с помощью шаблонов.

Данный способ позволит значительно улучшить производительность когнитивных ассистентов пользовательского сегмента, тем самым улучшив пользовательский опыт клиентов, прибыль компаний и откроет новые возможности для расширения функционала путем высвобождения ограниченных аппаратных мощностей клиентских устройств.

Список литературы

  1. Себастьян Рашка. Python и машинное обучение / Рашка Себастьян. – М.: ДМК Пресс, 2017. – 418 с.
  2. Е.Я. Режабек. Мифомышление. Когнитивный анализ / Режабек Е.Я. – М.: Ленанд, 2018. – 304 с.
  3. Саймон Хайкин. Нейронные сети: полный курс, 2-е издание / Хайкин Саймон. – М.: Вильямс, 2018. – 1103 с.
  4. Нишант Шакла. Машинное обучение и TensorFlow / Шакла Нишант. — СПб.: Питер, 2019. – 336 с.
  5. Haptic AI [Электронный ресурс]. – режима доступа URL: https://www.haptik.ai/ (дата обращения – 11.05.2022).
  6. Haptic Machine learning algorithm [Электронный ресурс]. – режима доступа URL: https://www.haptik.ai/tech/new-algorithm-for-a-personal-assistant-bot-2/ (дата обращения – 11.05.2022).

Интересная статья? Поделись ей с другими: