УДК 004

Сравнительный анализ математических методов распознавания образов

Мурсалиев Марат Халилович – аспирант Дагестанского государственного технического университета.

Аннотация: Тема статьи посвящена актуальной теме исследования, поскольку сравнительный анализ различных математических методов распознавания образов позволяет выявить их преимущества и недостатки, что может быть полезно при выборе наилучшего подхода для конкретной задачи. В статье дана подробная характеристика математическим методам распознавания образов таким как: метод ближайшего соседа, метод наименьших квадратов, метод нейронных сетей, Байесовская теория решений. Автор раскрывает преимущества и недостатки данных математических методов распознавания образов. В статье сделан вывод о том, что выбор оптимального метода зависит от конкретной задачи и требований к качеству и скорости распознавания.

Ключевые слова: математический метод, распознавание, образ, метод ближайшего соседа, метод наименьших квадратов, метод нейронных сетей, Байесовская теория решений.

Тема статьи является актуальной и имеет большое значение в современном мире, где автоматическое распознавание образов является важной задачей во многих областях, таких как компьютерное зрение, обработка изображений, робототехника, биометрия и другие.

Одной из основных задач в области распознавания образов является определение того, какой из методов является наиболее эффективным для конкретного набора данных. Сравнительный анализ различных математических методов распознавания образов позволяет выявить их преимущества и недостатки, что может быть полезно при выборе наилучшего подхода для конкретной задачи.

Более того, в связи с быстро развивающимися технологиями и появлением новых методов, сравнительный анализ является важным инструментом для оценки новых методов распознавания образов и сравнения их с существующими.

Цель статьи – провести сравнительный анализ математических методов распознавания образов.

Образ – группировка в одной из систем классификаций, объединяющая конкретную группу объектов по общим признака [3, c.88].

Распознавание образов – это процесс автоматического определения, что представляет собой изображение или другой тип данных. Эта задача может быть решена различными математическими методами [5, c.355].

Существует множество математических методов распознавания образов. Рассмотрим некоторые из них:

1.Метод ближайшего соседа

Метод k-ближайших соседей (k-NN) является одним из простых и эффективных методов классификации образов. Этот метод основан на близости между объектами в пространстве признаков. Пространство признаков – это многомерное пространство, в котором каждый объект представлен в виде набора признаков (характеристик). Каждый признак может иметь свое значение (например, цвет, форма, размер и т.д.).

Идея метода k-NN заключается в том, что если два объекта близки в пространстве признаков, то они, скорее всего, принадлежат к одному классу. При классификации нового объекта метод k-NN находит k ближайших соседей этого объекта и относит его к классу, который является наиболее распространенным среди этих соседей [1, c.81].

Количество соседей k выбирается заранее и может быть любым целым числом. Если k=1, то метод называется методом одного ближайшего соседа (1-NN). Если k больше единицы, то выбор класса происходит путем голосования среди k ближайших соседей.

Для измерения расстояния между объектами в пространстве признаков часто используют евклидово расстояние, которое определяется как корень из суммы квадратов разностей между соответствующими признаками объектов. Однако для разных задач могут быть применены и другие метрики расстояния, например, манхэттенское расстояние или косинусное расстояние.

2.Метод наименьших квадратов

Метод наименьших квадратов (МНК) – это математический метод, используемый для аппроксимации функций и решения систем уравнений. В контексте распознавания образов, МНК может быть использован для поиска оптимального набора весов, связывающих признаки образов с их классами.

Для использования МНК в распознавании образов, сначала необходимо определить функциональную зависимость между признаками образов и их классами. Затем, используя данные обучающей выборки, можно построить матрицу, связывающую признаки образов с их классами, и решить эту матрицу, чтобы получить оптимальный набор весов [4].

Когда появляется новый образ, его признаки используются для вычисления взвешенной суммы, используя оптимальный набор весов, чтобы определить его класс.

3.Метод нейронных сетей

Метод нейронных сетей – это один из наиболее распространенных методов машинного обучения, который используется для распознавания образов и решения различных задач классификации и прогнозирования. Нейронные сети являются моделями, построенными на основе искусственных нейронов, которые имитируют работу биологических нейронов в мозге человека.

Нейронная сеть состоит из слоев нейронов, каждый из которых имеет свой вес и функцию активации. Входной слой принимает данные, а выходной слой выдает результаты классификации или прогнозирования. Между входным и выходным слоями могут быть несколько скрытых слоев, которые позволяют нейронной сети извлекать более высокоуровневые признаки из входных данных [2, c.163].

Обучение нейронной сети происходит с помощью алгоритмов обратного распространения ошибки, который заключается в том, что сеть обучается на множестве примеров данных, где для каждого примера известен правильный ответ. Сначала входные данные передаются через сеть, и выходной результат сравнивается с правильным ответом. Затем веса нейронов в сети корректируются таким образом, чтобы уменьшить разницу между выходным результатом и правильным ответом. Этот процесс повторяется многократно, пока ошибка на обучающих данных не станет достаточно мала.

4. Байесовская теория решений

Байесовская теория решений – это метод, используемый для классификации и распознавания образов на основе вероятностных моделей. Он основан на теореме Байеса, которая позволяет вычислить вероятность того, что объект принадлежит к определенному классу, основываясь на известных признаках.

В контексте распознавания образов, Байесовская теория решений может быть использована для определения, какой класс наиболее вероятен для заданного образа. Для этого модель должна быть обучена на множестве примеров данных, где каждый пример относится к определенному классу. Затем, используя эту модель, можно классифицировать новые образы, основываясь на известных признаках.

Для реализации Байесовской теории решений в распознавании образов, каждый класс моделируется с помощью вероятностного распределения, которое описывает, как часто каждый признак появляется в объектах этого класса. Когда появляется новый образ, его признаки используются для вычисления вероятности того, что этот образ принадлежит каждому из возможных классов [4].

Это только некоторые из методов, используемых для распознавания образов. Каждый из этих имеет как преимущества, так и недостатки. Проведем преимущества и недостатки математических методов распознавания образов (Таблица 1)

Таблица 1. Преимущества и недостатки математических методов распознавания образов.

Название метода

Преимущества

Недостатки

Метод ближайшего соседа

- Простота реализации и понимания

- Малое количество параметров, которые необходимо настроить

- Хорошая производительность при работе с небольшими выборками

- Может быть использован для классификации в многомерном пространстве признаков

- Может быть адаптирован для работы с различными метриками расстояния

- Не требует обучения и сохранения модели, что делает его быстрым и легким в использовании

- Может быть использован для решения задач регрессии и классификации

- Чувствительность к выбросам и шуму

- Требование большого объема памяти для хранения данных в случае больших выборок.

- Он не всегда обладает наилучшей производительностью по сравнению с другими методами распознавания образов.

Метод наименьших квадратов

- Простота и эффективность в использовании

- Универсальность при работе с различными типами данных, включая числовые и категориальные

- Возможность работы с большим объемом данных

- Низкая чувствительность к шуму и выбросам в данных

- Возможность работы с нелинейными моделями

- Возможная неустойчивость при работе с высокой размерностью данных и сложными моделями.

- Для получения оптимальных результатов может потребоваться большое количество данных для обучения.

Метод нейронных сетей

- Способность обучаться на большом количестве данных и извлекать сложные закономерности из них

- Гибкость и универсальность в использовании

- Способность обрабатывать данные с высокой размерностью и сложными зависимостями между признаками

- Может работать в режиме онлайн

- Может быть использован для распознавания образов в различных форматах, включая изображения, звуковые сигналы и текст

- Может быть адаптирован и настроен для работы с различными задачами и типами данных

- Необходимость большого количества данных для обучения и настройки гиперпараметров модели.

- Требуется достаточно мощное аппаратное обеспечение для обучения и использования моделей нейронных сетей.

Байесовская теория решений

- Способность учитывать априорную информацию и уменьшать неопределенность в решениях

- Гибкость и универсальность в использовании

- Возможность обрабатывать данные с высокой размерностью и сложными зависимостями

- Способность работать с неполными и неравномерными данными

- Может быть использован для построения вероятностных моделей и оценки неопределенности в решениях

- Способность обновлять модели на основе новых данных и уточненных априорных знаний

- Может быть использован в комбинации с другими методами машинного обучения

- Необходимость знания априорных вероятностей и недостаточную гибкость в работе с нелинейными зависимостями между признаками.

- Требуется дополнительная настройка модели для учета новых данных и изменения априорных знаний.

Выбор оптимального метода зависит от конкретной задачи, доступных данных, а также от требуемой точности и скорости распознавания.

Например, метод ближайшего соседа может быть хорошим выбором, если небольшой набор данных и точность не является критически важной, а высокая скорость распознавания - приоритет. С другой стороны, если есть большой объем данных и требуется высокая точность распознавания, то более сложные методы, такие как нейронные сети или байесовские сети, могут быть более подходящими.

Кроме того, возможно использование комбинации нескольких методов, что может улучшить качество распознавания и устойчивость к шуму. Например, метод ближайшего соседа может быть использован в качестве базового метода, а затем результаты можно уточнить с помощью нейронных сетей или байесовских сетей.

Таким образом, выбор оптимального метода зависит от конкретной задачи и требований к качеству и скорости распознавания.

Список литературы

  1. Данилина Е. Ю. Метод k-ближайших соседей в задаче распознавания / Е. Ю. Данилина // Математическое и информационное моделирование: сборник научных трудов, электронный ресурс, Тюмень, 18 апреля 2019 года / Министерство науки и высшего образования Российской Федерации; Тюменский государственный университет, Институт математики и компьютерных наук. Том Выпуск 17. – Тюмень: Тюменский государственный университет, 2019. – С. 80-84
  2. Криушин Е. А. Особенности распознавания образов / Е. А. Криушин // Исторические, философские, методологические проблемы современной науки: сборник статей 3-й Международной научной конференции молодых ученых, Курск, 20 мая 2020 года / Юго-Западный государственный университет. – Курск: Закрытое акционерное общество "Университетская книга", 2020. – С. 162-166
  3. Махлушев Д. А. Развитие систем распознавания образов и их прикладное применение / Д. А. Махлушев, А. А. Ахлестова, И. И. Василенко // Современное профессиональное образование: опыт, проблемы, перспективы: Материалы VIII Международной научно-практической конференции. В 2-х частях, Ростов-на-Дону, 22 марта 2021 года. Том Часть 1. – Ростов-на-Дону: Южный университет (ИУБиП), "Издательство ВВМ", 2021. – С. 88-92
  4. Пролубников А.В. Математические методы распознавания образов [Электронный источник]//Режим доступа: http://pozi.omsu.ru/docs/docs/mmro.pdf (Дата обращения: 01.05.2023)
  5. Тормозов В. С. Анализ методов распознавания образов и машинного обучения для распознавания визуальных образов / В. С. Тормозов // Информационные технологии XXI века: Сборник научных трудов / Ответственный редактор В. В. Воронин. – Хабаровск: Тихоокеанский государственный университет, 2019. – С. 354-359.

Интересная статья? Поделись ей с другими: