"Научный аспект №2-2019" - Технические науки

Построение признакового пространства для биометрической идентификации по почерку

Анисимов Андрей Александрович – студент аспирантуры Ульяновского государственного университета.

Аннотация: Для работы моделей машинного обучения необходимо построить признаковое пространство и выделить наиболее значимые параметры. В статье рассмотрены подходы построения такого пространства и выделены наиболее значимые признаки для идентификации пользователей по почерку на сенсорном экране.

Ключевые слова: Сенсорный экран, мобильное устройство, машинное обучение, признаковое пространство, искусственные нейронные сети.

Введение

Использование биометрических технологий идентификации становится повсеместным: практически в каждом новом мобильном устройстве (телефоне, планшете и др.) производителем устанавливаются системы распознавания для его разблокировки. Исследования группы Biometrics Research Group [1] показывают, что в 2018 году объем сегмента рынка мобильной биометрии оценивается в 10 млрд долларов США по всему миру, а к 2020 году достигнет 45 млрд.

Основным преимуществом биометрии перед традиционными средствами типа паролей является то, что биометрические параметры неотделимы от человека (их невозможно потерять или забыть), а подделка ключа существенно затруднена.

Существующие системы динамической биометрической идентификации в мобильных устройствах используют голос человека, а также статические образы типа отпечатка пальца и фотографии лица, что может быть похищено в отличие от подсознательных движений руки человека.

Признаковое пространство для биометрической идентификации по почерку

В ходе исследования разработан сервис сбора данных с экрана мобильного устройства как страница в сети Интернет с выполнением следующих требо-ваний:

  1. веб-сервер, поддерживающий язык программирования PHP,
  2. html-страница с возможностью рисовать подпись на экране на языке программирования JavaScript с поддержкой библиотеки jQuery,
  3. сервер, поддерживающий язык программирования Python с под-держкой библиотек pandas, scikit-learn, shap и keras для обработки и анализа данных.

Для построения признакового пространства использовалось два подхода:

  1. сбор данных о местоположении с использованием встроенной в JavaScript функции OnTouchMove (частота сохранения данных около 20 мс),
  2. сохранение рисунка пользователя с использованием встроенных в JavaScript функций MoveTo и LineTo.

На основании полученных данных построено признаковое пространство, состоящее из параметрических значений, а также бинарной последовательности из рисунка.

Построение признакового пространства осуществлялось с использованием библиотеки pandas языка программирования Python, выделение информативных признаков – при помощи библиотеки scikit-learn. Для отбора признаков использовались методы фильтрации Хи-квадрат (chi2), рекурсивного удаления признаков на основе подпространств (recursive feature elimination), а также методы визуализации результатов модели с использованием библиотеки shap. Выделены следующие значимые параметрические параметры: координата X, координата Y, угол к оси X, угол к оси Y, скорость в направлении X, скорость в направлении Y, ускорение в направлении X, ускорение в направлении Y, время, дифференциал времени, угол азимута, среднее квадратичное отклонение траектории от кратчайшего пути следования. Полученные результаты коррелируются с ГОСТ Р ИСО/МЭК 19794-7-2009 «Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Часть 7. Данные динамики подписи».

Кроме того, для пользователей создавались информационные дескрипторы искусственных нейронных сетей рисунка пользователя с использованием библиотеки keras языка программирования Python. Модель сверточной нейронной сети распознает графические ключи пользователей, учитывая погрешности и шумы: масштабируемость отдельных частей «ключевого» изображения, смещения, повороты, смена ракурса ввода и прочее. Дальнейшие исследования показали, что для повышения эффективности биометрической идентификации необходимо использовать блендинг результатов моделей для обоих подходов.

Заключение

Полученные результаты при построении признакового пространства для биометрической идентификации по почерку позволяют продолжить исследования для выработки оптимальной модели идентификации пользователя по его сенсорному почерку.

Список литературы

  1. Отчёт компании Biometrics Research Group Inc., сайт, 2019. URL: https://www.biometricupdate.com/biometric-news/biometric-research.
  2. ГОСТ Р ИСО/МЭК 19794-7-2009 «Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Часть 7. Данные динамики подписи».