gototopgototop

УДК 004

Понятие образа в распознавании образов. Статистическое распознавание образов

Волохин Денис Васильевич – аспирант Института комплексной безопасности и специального приборостроения МИРЭА – Российского технологического университета.

Аннотация: В данной статье проблема распознавания образов кратко охарактеризована как процесс машинного обучения. Определено понятие «образ» в сфере распознавания. Описано введение в два основных подхода к распознаванию образов: синтаксический (или структурный) и по большей части геометрический (или статистический).

Ключевые слова: Набор признаков, распознавание образов, статистический подход, синтаксический подход, пространство признаков.

  1. Процесс распознавания образов

Развитие методов распознавания образов наряду с растущей доступностью компьютеров привело к расширению применения распознавания образов в новых областях. Упомянем только некоторые из них: промышленный контроль, обработка документов, идентификация личности, статистический анализ данных, анализ изображений, поиск информации, сжатие данных и машинное обучение.

Прежде всего необходимо определить понятие образа. В самом широком смысле образ – это средство, с помощью которого мы интерпретируем мир. В нашем детстве мы научились различать визуальные образы людей и вещей, слуховые паттерны речи и музыки, тактильные паттерны холода и тепла и т. д. Для электронно-вычислительных машин выделить образ означает автоматически распознать закономерность в данных.

Разъяснив, как следует понимать слово «образ», мы можем обсудить вопрос: что такое процесс распознавания образов? Когда человек бросает взгляд на печатную страницу и распознает символ за символом, он пользуется своим прошлым накопленным опытом, который каким-то образом превратился в фиксированные правила принятия решений. Он вообще не может объяснить эти правила, однако, их существование не подлежит сомнению. Механизм следования этим правилам вполне очевиден. Сначала эти правила закладывают в «фазе обучения» на примере соответствующих образов, сказав человеку что есть что. Другими словами, чтобы предоставить ему так называемые маркированные образцы, из которых он разработал бы правила принятия решения. Мы можем видеть, что есть два аспекта распознавание образов ­ –разработка правила принятия решений и его использование. Фактическое распознавание происходит на этапе использования правила. Дело в том, что проблема распознавания образов может быть определена только в том случае, если мы четко сформулируем, что мы хотим распознать, определив образы класса.

Проблема распознавания образов начинается с определений классов, которым необходимо уделить пристальное внимание, так как в определенных ситуациях определение класса может сильно влиять на общую производительность системы распознавания. С распространением компьютеров, область распознавания образов перестала быть процессом, относящимся исключительно к человеческому мозгу. Однако, есть существенная разница между распознаванием человеческим и «математическим» (статистическим) распознаванием образов с помощью компьютеров. Методы, используемые в математическом распознавании, основаны на относительно простых понятиях. В отличие от человеческого распознавания, их успех не зависит от человеческих особенностей, но зависит от способности компьютера хранить и обрабатывать большое количество данных с точнейшими вычислениями и прежде всего от способности компьютера работать с большими объёмами данных. Это важнейшее преимущество над способностями человека, так как люди могут делать очень сложные вещи в трех измерениях или меньше, но начинают колебаться, когда имеют дело с большим количеством измерений.

В математическом или компьютерном распознавании мы можем говорить о методах распознавания образов. Они присваивают физический объект или событие одному из несколько заранее определенных категорий. Таким образом, система распознавания образов может быть представлена как набор правил автоматического принятия решений, который преобразует измерения в назначения классов. Сами закономерности, распознаваемые этими методами, могут быть различные, от геологических участков или сельскохозяйственных полей с принимаемых изображений со спутников до речевого сигнала, связанные с этим проблемы распознавания или классификации заключаются в том, чтобы обозначить сельскохозяйственное поле как с пшеницей или без неё, или геологический участок как содержащий или не содержащий определенные месторождения руды, и идентифицировать произнесенное слово, соответственно.

Образы описываются на основе измерений, взятых с какого-либо примера или признаками, полученными из этих измерений. Физическая интерпретация признаков зависит от сферы приложения. В то время как при распознавании речи в качестве признаков используются так называемые коэффициенты линейного предсказания, вычисленные по форме голосовой волны, в медицинской диагностике мы часто используем непосредственно набор данных о пациенте в качестве признаков без каких-либо предварительных вычислений или преобразований.

  1. Два основных подхода к распознаванию образов

Существуют два основных подхода к распознаванию образов. В геометрическом или статистическом подходе образ представлен в виде N признаков или свойств и рассматривается как точка в N-мерном пространстве. Одна из задач состоит в том, как выбрать такие признаки, чтобы векторы образов разных категорий не перекрывались в пространстве признаков (этот идеал обычно не может быть достигнут, поэтому необходимо искать наиболее оптимальное решение). Учитывая определенные наборы образов из каждого класса (в обучающей выборке), цель установить границы решений в пространстве признаков, которые бы максимально разделяли образы, принадлежащие разным классам.

Также прямой статистический подход может быть принят, когда границы решения определяются статистическим распределением моделей (известных или предполагаемых), либо используется «нестатистический» подход. В последнем случае сначала указывается функциональная форма границы решения (линейная, кусочно-линейная, квадратичная, полиномиальная и т. д.), а затем определяется граница наилучшего решения указанной функциональной формы. Выбор признаков имеет решающее значение для качества распознавания образов. Участие эксперта из соответствующей прикладной области в разработке первичного набора признаков абсолютно необходимо, поскольку от этого будет зависеть правильность работы всей системы распознавания. Математическая обработка может помочь удалить избыточную информацию, но сама по себе она, очевидно, не может вывести какую-либо полностью новую информацию, не предоставленную экспертом, проектирующим оригинальный набор признаков.

Помимо статистического подхода к распознаванию образов существует другой подход – синтаксическое (или структурное) распознавание образов. Чтобы сделать аналогию более ясной, мы можем утверждать, что образы рассматриваются как предложения языка, признаки – как алфавит языка, а генерация предложений регулируется грамматикой. Основное преимущество синтаксического или структурного подхода состоит в том, что, помимо классификации, он также предоставляет описание того, как данный образ построен из признаков. Однако реализация синтаксического подхода также не лишена трудностей. Хотя практически все из статистических подходов не просты, они лучше поняты и основаны на хорошо установленных элементах теории статистических решений. Это, возможно, причина того, почему большинство коммерческих систем распознавания образов используют теоретико-решающие подходы. Статистическое распознавание образов в основном связано с проблемой автоматической классификации элементов, принадлежащих одному из m возможных классов , где i = 1, 2,…,m. Решение относительно принадлежности элемента классу принимается на основе набора N измерений, взятых для элемента, составляющего образ, который, предположительно, содержит достаточно информации, чтобы выделяться среди прочих классов. Таким образом, чем больше N, тем статистическая изменчивость (которая не связана со случайным шумом) между образами из разных классов выше, и обеспечивает более удовлетворительные показатели в достоверности классификации.

Резюме

Распознавание образов является важной дисциплиной, относящейся к области искусственного интеллекта. В данной статье кратко описан статистический подход, который, безусловно, может быть применен в различных областях. Определено понятие «образ» в сфере распознавания.

Список литературы

  1. Лепский А.Е., Бронцевич А.Г. Математические методы распознавания образов: Курс лекций. – Таганрог: Изд-во ТТИ ЮФУ, 2009. – 155 с. ISBN 978-5-8327-0306-0.
  2. Сфойер В.А., Гашников Н.И., Ильясова Н.Ю. и др. Методы компьютерной обработки изображений. — М.: ФИЗМАЛИТ, 2003. — 784 с. ISBN 5‑9221‑0270-2.
  3. Потапов А.А., Гуляев Ю.В., Никитов С.А., Пахомов А.А., Герман В.А. Новейшие методы обработки изображений. — М.: ФИЗМАЛИТ, 2008. — 496 с. ISBN 978-5-9221-0841-6.

Интересная статья? Поделись ей с другими:

Внимание, откроется в новом окне. PDFПечатьE-mail