УДК 004:33

Онтология, как инструмент для разработки семантического процесса представления знаний

Лосев Валерий Сергеевич – доктор экономических наук, заведующий кафедрой Экономической кибернетики Тихоокеанского государственного университета.

Гончарук Николай Владимирович – магистрант Тихоокеанского государственного университета.

Аннотация: В данной статье рассмотрена онтологическая модель представления знаний и её значение, технологические возможности и перспективы использования онтологии в качестве основного процесса разработки действенного механизма запроса в семантических процессах предметной области.

Ключевые слова: онтология, предметная область, семантика, семантические сети, семантическое моделирование, модель представления знаний, языки представления знаний, концептуальная модель, методы анализа.

Принято считать, что онтологии являются одним из основных инструментов, используемых для разработки семантического процесса. Данная схема является полезным методом для улучшения информационных значений процесса моделей и их анализа с помощью концептуализации. Концептуальная же система анализа позволяет повысить значение элементов процесса за счет использования свойств и классификации проявления объектов, чтобы генерировать знания вывода, которые могут быть использованы для определения полезных моделей, а также для прогнозирования будущих результатов.

Действительно, способность извлекать полезные или ценностные знания из добытых данных в существующих информационных системах является проблемой из-за экспоненциального увеличения объема данных, которые непрерывно генерируются. Более того, многие из таких систем сбора данных и процедуры для анализа процесса оказываются все более сложными. В связи с этим возникла необходимость в более богатом или расширенном описании процессов в реальном времени, что позволяет гибко исследовать большие объемы данных, нацеленных на улучшение производительности систем и, конечно же, основных бизнес-операций. Такой анализ, связанный с процессом, означает, что также необходимы методы, которые способны извлекать ценную информацию из журналов событий и результирующих моделей о рассматриваемых процессах реального времени.

Более-менее, большинство организаций инвестировали в проекты для моделирования различных операционных процессов. Тем не менее, большинство моделей производных процессов часто являются непригодными, нетрудоспособными или представляют собой ту форму реальности, которая направлена на понимание, а не на всю сложность бизнес-процессов.

Возможно, согласно работам, точное изучение или анализ вытянутого журнала событий способны оказывать жизненно важную и ценную информацию относительно качества поддержки, предложенной для так называемых организаций и информационной базы знаний или системы в целом. Например, выявление базовых отношений, какие элементы процесса или ресурсы делят между собой в информационной базе знаний.

В последнее время понятие Process Mining или же Process Querying [2] стало важной технологией, которая используется для выявления такого рода значимой информации из данных журналов событий и моделей производных процессов. Однако в различных исследованиях отмечается, что совместное использование большинства существующих методов разработки процессов заключается в том, что они зависят от тегов / меток в журналах событий о процессах, которые они представляют, и, следовательно, в определенной степени ограничены, потому что им не хватает уровня абстракции, необходимого с реальных точек зрения. Это означает, что методы технически не извлекают из реального знания (семантики), которые описывают теги или метки в журнале событий доменных процессов [4]. Практически большинство методов анализа процессов в литературе носит чисто синтаксический характер, и по этой причине они несколько неточны при рассмотрении вопроса с неструктурированными данными.

По этой причине в данной статье речь идет о технологических возможностях и перспективах использования онтологии в качестве основного процесса разработки действенного механизма запроса, что позволит решать задачи, вызванные отсутствием семантической информации, путем предоставления формального метода структурирования легкодоступных наборов данных.

Стоит отметить, что концептуальный метод анализа обеспечивает простой способ анализа наборов данных (то есть журналов событий и моделей) и позволяет повысить значение элементов процесса за счет использования языков описания свойств или синтаксиса - например, Ontology Web Rule Language (OWL) [4], Semantic Web Rule Language (SWRL) [4], Description Logic (DL) запросы [4] и классификация обнаруженных объектов или таксономия [4], чтобы сделать доступным знание вывода которые могут быть использованы для определения полезных шаблонов с помощью семантических соображений. С другой стороны, семантическое моделирование (ontological representations) и методы анализа дают возможность разрабатывать интеллектуальные алгоритмы и инструменты, способные улучшить полученные модели процессов с помощью явной спецификации понятий (часто называемой conceptualisation), чтобы идентифицировать соответствующую семантику и отношения между элементами процесса.

Начальным этапом семантического моделирования является построение концептуальной модели ПрО. То есть нужно определиться как будут представляться в онтологических моделях сущности создаваемой аналитической системы: объекты, классы основные концепты, определения и значения свойств, аксиомы.

Формально концептуальную модель онтологии предметной области – можно представить в виде математического выражения [3]:

(1)

где – подмножество классов (<Classes>) основных концептов – понятий предметной области (E<Entities>), которые составляют их отличительную черту; – множественное число экземпляров (<Instances>) классов, используемое для наполнения базы знаний отдельными экземплярами (экземплярами); – подмножество отношений (<Object properties>) между классами и свойствами, которые задаются предикатами – глаголами, через которые описываются отношения (типы связей) в определенной ПрО; – подмножество атрибутов (<Data properties>), описывающее свойства классов (их типы данных, области значений); – подмножество аксиомы (<Ахіомѕ>), которые определяют основные понятия ПрО, которые всегда для ней истинны. Аксиомы записываются предикатами первого порядка и задают правила вывода для решения функциональных задач; – подмножество правил логического вывода для получения новых знаний.

Модель онтология вместе с множеством индивидуальных экземпляров классов – , которые определяют индивидуальные свойства – и отношения между ними составляет базу знаний предметной области.

Согласно основным правилам языка OWL класс описывается триплетом, который называется RDF-графом. В этом графе вершинами являются субъекты и объекты, а в качестве дуг – предикаты. С математической точки зрения триплет является экземпляром элемента некоторого бинарного отношения. Выражение триплета утверждает то, что определенное отношение, указанное предикатом, связывает предметы, обозначенные как субъект и объект в конкретном в триплете [3].

Одним из инструментальных средств семантического моделирования является известный редактор онтологий Protégé 5. – разработан Стэнфордским университетом, который относится к визуальным редакторам. Визуальные методы проектирования онтологий способствуют более быстрому и полному пониманию структуры знаний предметной области, что особенно ценно для исследователей, работающих в новой предметной области [1]. Protégé 5. позволяет поддержать все фазы жизненного цикла онтологии в соответствии с требованиями ІЅО/IEC 15288:2002 [3] – от разработки семантической сети и создание базы знаний на ее основе, к формированию запросов пользователей к этим базам с целью получения знаний.

Редактор онтологий Protégé 5 реализует модель представления знаний OKBC (Open Knowledge Base Connectivity), и отображает данные в виде фреймов, но кроме фреймов редактор поддерживает наиболее распространенные языки представления знаний (SHOE, XOL, DAML + OIL, RDF / RDFS, OWL) [3].

Основное окно редактора Protégé 5. состоит из закладок (tabs), которые отражают различные аспекты создаваемой модели знаний: <Active Ontology>, <Entities>, <Classes>, <Data properties>, <Object properties>, <Individuals by class>, <DL Query>, <SPARDL Query> и другие.

Каждая модель онтологии создается с использованием уникального имени – идентификатора ресурса (URI). Безусловно, в процессе проектирования онтология может быть изменена, могут быть добавлены и отредактированы имена классов, аннотации, а также другие компоненты модели. Основная разработка программного продукта делилась на две части: создание онтологии для вредоносных объектов и формирования запросов для идентификации объектов.

Концептуальный метод анализа обеспечивает простой способ анализа наборов данных (то есть Журналов событий и моделей), а еще больше позволяет повысить значение элементов процесса за счет использования языков описания свойств или синтаксиса – например, Ontology Web Rule Language (OWL) Semantic Web Rule Language (SWRL), Description Logic (DL) запросы и классификация обнаруженных объектов или таксономия, чтобы сделать доступными знания вывода которые могут быть использованы для определения полезных шаблонов с помощью семантических соображений. С другой стороны, семантическое моделирование (ontological representations) и методы анализа дают возможность разрабатывать интеллектуальные алгоритмы и инструменты, способные улучшить полученные модели процессов с помощью явной спецификации понятий (часто называемой conceptualisation), чтобы идентифицировать соответствующую семантику и отношения между элементами процесса.

Список литературы

Кузнецова Н. А., Виттиха В. А. «Проблемы управления и моделирования в сложных системах: Труды VI Международной конференции» / Под ред.: акад. Е. А. Федосова, акад. - Самара: Самарский научный центр РАН, 2004. – 480 с.
Ларман К. «Применение UML 2.0 и шаблонов проектирования.» – М.; СПб.; К.: ИД «Вильямс», 2007. – 728 с.
Додонов В. Г. «Компьютерное моделирование процессов организационного управления», ISSN 1027-3239. Висн. НАН Украины, 2016, № 1. – С. 69 – 77.
Коваль А. В., Бойко Ю. Д., Зайцева Е. А. «Модель сценарно-целевого подхода при построении информационно-аналитической системы» // Сборник тезисов 16-ой международной научно-технической конференции «Системный анализ и информационные технологи» SAIT 2014, Київ, 26–30 мая 2014 р. / ННК “IПСА” НТУУ “КПI”. – К.: ННК “IПСА” НТУУ “КПI”, 2014. – C. 105-106.

Интересная статья? Поделись ей с другими: