УДК 004.032.26

Cистема интеллектуальной групповой проверки знаний студентов в области информационной безопасности на базе ChatBot

Колосов Лев Сергеевич – бакалавр кафедры Защищенных систем связи Санкт-Петербургский государственный университет им. проф. М. А. Бонч-Бруевича

Аннотация: Данная работа посвящена вопросу о разработке системы интеллектуальной групповой проверки знаний студентов в области информационной безопасности на базе ChatBot. Это направление представляет собой слияние современных подходов к обучению и проверке знаний с применением искусственного интеллекта.

Ключевые слова: ChatBot, обучение, искусственный интеллект, проверка знаний.

Искусственный интеллект (ИИ) включает в себя множество моделей и методов, способных к обработке больших объемов данных, обучению на основе этих данных и принятию решений на основе обучения. Для целей интеллектуальной проверки знаний особенно актуальны методы, такие как искусственные нейронные сети (ИНС), кластеризация и классификация.

Искусственные нейронные сети (ИНС) – это вычислительные системы, вдохновленные биологическими нейронными сетями, которые составляют мозг. Они построены на основе простых элементов, называемых искусственными нейронами или узлами, которые могут имитировать поведение биологических нейронов [1].

ИНС особенно полезны в задачах, где требуется выявление сложных нелинейных взаимосвязей в данных. Это обусловлено их способностью аппроксимировать любую функцию, что делает их идеальным инструментом для обучения на сложных и разнообразных данных.

Системы проверки знаний могут значительно выиграть от использования ИНС, поскольку они могут обучаться и адаптироваться к сложным и неочевидным шаблонам в данных. Это позволяет им оценивать знания студентов на основе сложных критериев и метрик, которые могут быть трудно или невозможно определить вручную. Кроме того, ИНС могут быть обучены использовать обратную связь для улучшения своей производительности со временем, что делает их еще более полезными в контексте обучения и оценки.

Однако стоит отметить, что ИНС требуют значительного количества данных для эффективного обучения, и они могут быть сложными в интерпретации и отладке. Это обусловлено тем, что они работают, создавая сложные внутренние представления данных, которые может быть сложно понять без специализированных инструментов и методов [2].

Кластеризация – это метод машинного обучения без учителя, который группирует набор данных на основе их сходства. Применительно к системе проверки знаний, кластеризация может быть использована для группировки студентов по различным параметрам, таким как уровень знаний, способности и интересы. Это позволяет системе адаптироваться к индивидуальным потребностям каждого студента, предоставляя персонализированный путь обучения и оценку [3].

Процесс кластеризации включает в себя несколько шагов:

  • Определение расстояния или сходства: Первым шагом является определение меры сходства или расстояния между объектами данных. Это может быть евклидово расстояние, манхэттенское расстояние, косинусное сходство и др;
  • Выбор алгоритма кластеризации: Существует множество алгоритмов кластеризации, включая K-means, иерархическую кластеризацию, DBSCAN, и многие другие. Выбор конкретного алгоритма зависит от природы данных и требований к задаче;
  • Определение числа кластеров: В некоторых алгоритмах, таких как K-means, необходимо заранее определить количество кластеров. Это может быть сложно, особенно если данные не имеют явной структуры [4];
  • Запуск алгоритма кластеризации: Затем алгоритм кластеризации применяется к данным, группируя их на основе сходства;
  • Оценка результатов: После кластеризации результаты обычно оцениваются с использованием определенных метрик, таких как силуэтный коэффициент [5].

Классификация – это тип задачи машинного обучения, в которой целью является прогнозирование класса или категории новых данных на основе обучения на ранее классифицированных данных. Это форма обучения с учителем, что означает, что модель обучается на наборе данных, в котором уже известны правильные ответы, или "метки". Модель затем используется для прогнозирования меток для новых данных, основываясь на том, что она научилась из обучающих данных [6].

Процесс классификации включает в себя несколько ключевых этапов:

  • Обучение: На этом этапе модель обучается на обучающих данных. В процессе обучения модель адаптирует свои веса и смещения, чтобы минимизировать ошибки между прогнозируемыми и реальными метками;
  • Активация: Здесь используется функция активации, которая преобразует выход предыдущего слоя в форму, которая решает, должен ли быть активирован нейрон или нет. Функция активации также добавляет нелинейность в модель, что полезно для обучения сложной функции;
  • Прогнозирование: После обучения модель может использоваться для прогнозирования меток для новых данных. Выходной слой модели обычно состоит из нейронов, количество которых соответствует количеству классов в задаче. Каждый нейрон в выходном слое представляет собой прогноз вероятности того, что новые данные принадлежат конкретному классу [7].

В контексте системы проверки знаний, классификация может быть использована для определения уровня знаний студента по определенной теме или для оценки ответов на вопросы. Например, вопросы могут быть классифицированы по темам, и ответы студентов на эти вопросы могут быть использованы для обучения модели, которая затем может предсказать, как студент ответит на новые вопросы по теме [8].

Transformer – это тип модели глубокого обучения, который был предложен в статье "Attention is All You Need" Vaswani и соавторами в 2017 году. Это модель использует механизмы внимания для эффективной обработки последовательностей данных, как это обычно требуется в задачах обработки естественного языка [9].

Один из наиболее известных примеров применения Transformer – это GPT-3 (Generative Pretraining Transformer 3), разработанный OpenAI. GPT-3 – это генеративная модель языка, которая может генерировать письменный текст, который едва отличим от текста, написанного человеком.

GPT-3 использует архитектуру Transformer и обучается на большом объеме текстовых данных. Обучение происходит в два этапа: предварительное обучение, во время которого модель обучается на больших объемах текста, и тонкая настройка, во время которой модель дополнительно обучается на специфических для задачи данных.

GPT-3 считается одной из самых мощных моделей языка на текущий момент благодаря своей способности понимать контекст, генерировать связный текст и адаптироваться к новым задачам с минимальной дополнительной настройкой. Это делает GPT-3 особенно подходящим для быстрой проверки знаний студентов [10].

1

Рисунок 1. Упрощённая структурная схема метода интеллектуальной проверки.

Таким образом, GPT-3 обладает высокой гибкостью и способностью генерировать тексты. Она может выполнять разнообразные языковые задачи без необходимости специфической настройки, что обуславливает её пригодность для использования в обучении.

Список литературы

  1. Omarov B. Development of chatbot-Psychologist: Dataset, architecture, design and chatbot in use / B. Omarov, S. Narynov, Zh. Zhumanov // Вестник Казахской академии транспорта и коммуникаций им. М. Тынышпаева. – 2022. – №. 4 (123). – P. 463-471. – DOI 10.52167/1609-1817-2022-123-4-463-471. – EDN MQXAHT.
  2. Шовин В. А. Программа СhatBot —- чат-бот или виртуальный собеседник / В. А. Шовин // Математические структуры и моделирование. – 2016. – № 4 (40). – С. 96-101. – EDN XBSJRL.
  3. Шовин В. А. Эвристическая сеть для программы ChatBot / В. А. Шовин // Математические структуры и моделирование. – 2017. – № 4 (44). – С. 131-135. – EDN ZWAXYZ.
  4. Лизунков Р. В. Как платформа виртуальных собеседников enterprise chatbot, основанная на искусственном интеллекте, трансформирует будущее / Р. В. Лизунков, А. И. Токарев // Информационные системы и технологии в моделировании и управлении : Сборник материалов III Всероссийской научно-практической конференции с международным участием, посвященной 100-летию Крымского федерального университета имени В.И. Вернадского, Ялта, 21–23 мая 2018 года / Ответственный редактор К.А. Маковейчук. – Ялта: Общество с ограниченной ответственностью «Издательство Типография «Ариал», 2018. – С. 369-372. – EDN XVDMJF.
  5. Тронин В. Г. Принцип работы chatbot (виртуального собеседника) на базе рекуррентной нейронной сети и его применение / В. Г. Тронин, А. В. Черноморченко, А. А. Жарков // Информатика, моделирование, автоматизация проектирования: Сборник научных трудов X Всероссийской школы-семинара аспирантов, студентов и молодых ученых, Ульяновск, 27-28 ноября 2018 года / Под редакцией А.Н. Афанасьева. – Ульяновск: Ульяновский государственный технический университет, 2018. – С. 190-197. – EDN LVRDVY.
  6. Kozlova S. D. Chatbot implementation in the process of teaching and training staff / S. D. Kozlova, A. B. Zhernakov // Актуальные теоретические и прикладные вопросы управления социально-экономическими системами: Материалы Международной научно-практической конференции, Москва, 20 декабря 2019 года. Vol. 4. – Москва: Федеральное государственное бюджетное образовательное учреждение дополнительного профессионального образования «Институт развития дополнительного профессионального образования», 2019. – P. 268-270. – EDN ZCXZLH.
  7. Vázquez-Cano E. Chatbot to improve learning punctuation in Spanish and to enhance open and flexible learning environments / E. Vázquez-Cano, S. Mengual-Andrés, E. López-Meneses // International Journal of Educational Technology in Higher Education. – 2021. – Vol. 18, No. 1. – P. 1-20. – DOI 10.1186/s41239-021-00269-8. – EDN DBMWGD.
  8. Moskvina A. B. Chatbot technology in language education / A. B. Moskvina // Языки и литература в поликультурном пространстве. – 2023. – № 9. – P. 92-95. – EDN GVUDJV.
  9. Fung Y. C. A Chatbot for Promoting Cybersecurity Awareness / Y. C. Fung, L. K. Lee // Lecture Notes in Networks and Systems. – 2022. – Vol. 370. – P. 379-387. – DOI 10.1007/978-981-16-8664-1_33. – EDN EBCFXY.
  10. Chatbot in industry 4.0: An approach for training new employees / M. Casillo, F. Colace, M. Lombardi [et al.] // Proceedings of 2020 IEEE International Conference on Teaching, Assessment, and Learning for Engineering, TALE 2020 : Embarking On a New Era of Learning With Transformative Technologies, Virtual, Takamatsu, 08-11 декабря 2020 года. – Virtual, Takamatsu, 2020. – P. 371-376. – DOI 10.1109/TALE48869.2020.9368339. – EDN ZXDYPL.

Интересная статья? Поделись ей с другими: