"Научный аспект №2-2019" - Технические науки

Информационно-аналитическая система поиска нормативного обеспечения социальной поддержки населения РФ с контролем динамики изменения законодательных актов

Казаринова Наталья Леонидовна – доктор экономических наук, профессор Пермского государственного гуманитарно-педагогического университета.

Боярко Сергей Александрович – студент факультета Информатики и экономики Пермского государственного гуманитарно-педагогического университета.

Поздеев Кирилл Павлович – студент факультета Информатики и экономики Пермского государственного гуманитарно-педагогического университета.

Аннотация: В работе рассмотрены теоретические исследования и практическая реализация разработки информационно-поисковой системы (ИПС) по заданным парламентам. Специализация ИПС обеспечена матрицей настройки. Результаты специализированного поиска формируют базу данных поисковых результатах и служат входной информацией для использования в прикладном программном обеспечении.

Ключевые слова: Информационно-поисковая система, логико-семантический аппарат, нормативное обеспечение социальной поддержки, теория множеств, фреймворк, алгоритм сравнения.

В условиях решения цифровизации управленческих задач на всех уровнях государственной системы, производства, поддержки населения, регулирования инфраструктуры актуальной задачей является оперативное определение изменений действующих нормативов, регламентов, прочих федеральных и региональных актов, влияющих на решение алгоритмов специализированных информационных систем (ИС). Данный проект ставит перед собой амбициозную задачу разработки настраиваемой системы под различные критерии поиска, источники поиска с формированием БД динамических изменений позиций модификации.

Теоретические основы информационного поиска (частный случай документальный информационный поиск) рассматривают характеристики логико-семантического аппарата, систему индексирования, критерии смыслового соответствия. Организация настройки матрицы поиска требует определить систему признаков компонентов поиска, хранения и обработки. К нормативной информации относится вся правовая система свода законов и подзаконных актов, а также мониторинг проектной законодательной деятельности по заданному в настройках системы, направлению. Классификация найденной информации имеет иерархическую структуру как в массиве действующих нормативов, так и в массив проектов законодательных актов. Таким образом очевидна необходимость анализа и систематизации нормативной документации по видам.

Одним из важных вопросов в данной работе является выбор подхода к измерению и оценке ценности информации. В данном направлении необходимо рассмотреть работы Г.Нейквиста о зависимости скорости передачи сигнала и числа кодовых сигналов; Р.Хартли оценке информации сообщения; К.Шеннона о связи понятия информации с понятием энтропия; алгоритмический подход «полезности информации» М.М. Бонгарда[2, 45с].

Реализация информационного поиска выполняется как некоторая последовательность операций, выполняемая с целью отыскания документов, статей, приказов, содержащих определенную информацию с последующим анализом по отклонениям/изменениям/дополнениям. Элементы информации информационного поиска являются информационными массивами.

Для реализации оценки качества поиска вводят специальные критерии – релевантность и пертинентность. Предполагается использовать различные критерии количественной оценки релевантности и пертинентности. Структура ИПС, состав логико-семантического аппарата ИПС отражены в работах Ю.Ф. Тельнова, Ю.И. Шемакина [3,4]. Походы по разработке диалоговых процедур анализа, информационно-поисковых систем, организации информационного поиска в сети Интернет рассмотрены в работах В.Н. Волковой, Е.А. Карташева, [5,6]

На рынке существует ряд информационных систем, осуществляющих поиск данных, но информация об их структуре и применяемых методах обработки данных не раскрывается. Пользователю до сих пор не доступен инструмент, предоставляющий ему актуальную социально-значимую информацию, активно отслеживающий обновления и доносящий до пользователя изменения.

В данной работе рассматриваются нормативные правовые акты федерального и регионального уровня и относящиеся к системе социальной поддержки РФ.

Общие принципы построения и функционирования Информационно-аналитической системы поиска нормативного обеспечения социальной поддержки населения РФ с контролем динамики изменения законодательных актов (ИПС НОСП, IPS NOSP).

IPS NOSP представлена в виде совокупности четырех основных компонентов:

IPSdef ≡ <LS,D,TS,N>,

где LS – логико-семантический аппарат (включающий информационно-поисковые языки – один или более, правила индексирования и критерии выдачи); D – поисковый массив (т.е. определенное множество снабженных поисковыми образами документов, в котором отыскиваются необходимые); TS – технические средства (т.е. какие-то приспособления или устройства, которые необходимы для записи и хранения поисковых образов, для хранения документов и осуществления процесса сопоставления поисковых образов документов с поисковым предписанием или поисковым образом запроса); N – потребители информации, взаимодействующие с системой (т.е. те, кто пользуется данной ИПС и обслуживает ее, в том числе осуществляют индексирование документов и информационных запросов, выбирают стратегию поиска, а также выполняют другие интеллектуальные операции, без которых невозможен информационный поиск).

Для обеспечения возможности автоматизации процедуры информационного поиска в ИПС выделяют два уровня рассмотрения – абстрактный и конкретный.

Абстрактная ИПС:

IPSdef ≡ <RL,ND,KSS>,

где RL – информационно-поисковой язык, IND - правила индексирования, KSS – критерий выдачи или критерия смыслового соответствия.

Конкретной ИПС является практически реализованная система, включающая массив документов D, в котором производится информационный поиск, технические средства TS реализации ИПС, а также взаимодействующих с ней людей N.

IPSdef ≡ <D,TS,N>.

Процедура информационного поиска документальной информации разделяется на два контура: семантическое осмысление запроса и выдача кодов, соответствующих запросу документов (рис. 1), сплошные линии; отыскание самих документов, штриховые линии.

Рисунок 1. Структура функционирования ИПС.

Второй контур связан с разработкой специализированных технических средств хранения больших массивов документов и работой по переоборудованию хранилищ, а собственно проблемы информационного поиска решаются в первом контуре.

Первый контур ИПС представляет собой ее логико-семантический аппарат и состоит из трех основных блоков: информационно-поискового языка (RL); системы перевода (индексирования) на этот язык (IND); логики, обеспечивающей поиск, которые, в свою очередь, могут быть детализированы и реализованы разными способами (LOG).

В терминах теории множества обозначается как

IPSdef ≡ <RL,IND,LOG>.

В системе pravo.gov.ru в массиве данных хранится вся нормативно-правовая база РФ (в том числе нормативные акты социальной системы во всех редакциях).

В система sozd.duma.gov.ru в массиве данных хранится информация о законопроектах на стадии формирования (неструктурированные данные, такие как тип стадии рассмотрения, тексты законопроектов, сопроводительные письма, иные пакеты документов).

Для реализации IPS NOSP использована модульная архитектура системы. IPS NOSP учитывает следующие требования: возможность модификации и усовершенствования системы, а не эксплуатация одной и той же версии системы при изменении требований и не замена одной системы совершенно другой; обеспечение расширяемости системы, т.е. возможность добавления новых компонентов в уже существующую ИС; Понятность и простота интерфейса; опора при разработке АИС на международные и промышленные стандарты.

Взаимодействие с сайтами pravo.gov.ru и duma.gov.ru направлено на сбор с них исходной информации, предусматривает работу в режиме запрос – ответ по следующим направлениям: поиск требуемой информации; загрузка найденной информации в АИС; актуализация информации, хранящейся в АИС (выполняется через определенный интервал времени, определяемый с учетом обновления информации).

Хранение собранной информации предусматривает для каждого модуля возможность собирать и обрабатывать данные по своим уникальным правилам.

Рисунок 2. Структура АИС.

Структура АИС (рис. 2) состоит из следующих модулей: База данных (совокупность средств для обеспечения хранения и доступа к найденным данным); Интерфейс пользователя (предоставляет инструменты пользователю для просмотра имеющихся данных и результатов их обработки, а также по управлению работой каждого из модулей); Модуль взаимодействия (обеспечивает получение данных с определенного информационного ресурса в соответствии с установленными параметрами, заносит данные в базу, отправляет данные другим модулям); Подсистема деления (обеспечивает деление документов на статьи); Подсистема сравнения (обеспечивает сравнение разных редакций).

В ходе исследования была разработана полуавтономная динамически изменяющаяся АИС, соответствующая всем требованиям, обозначенным ранее. АИС является web-api приложением, получающем информацию с двух ресурсов pravo.gov.ru и duma.gov.ru, что позволяет ему предъявлять требования к системе пользователя только в наличии браузера и доступа к интернету для обновления базы.

Использованное ПО: Модуль базы данных использует СУБД MONGODB с объемом данных по умолчанию 250 Гб; Модуль интерфейс пользователя реализован с помощью фреймворка angular 7 на языке JavaScript; Модуль взаимодействия реализован с помощью платформы разработки веб-приложений ASP.NET Core 2.2; Подсистемы деления и сравнения реализованы на языке C# также с помощью платформы разработки веб-приложений ASP.NET Core 2.2.

Данная АИС обладает полным объемом функций, описанных в модели.

Модуль интерфейса делает запрос к ресурсам по номеру документа в их базе. По этому номеру можно получить всю необходимую информацию – текст документа, список его редакций и их текст. Тексты получаются в формате RTF. Обмен данными внутри АИС происходит через стандарт обмена данными JSON.

Деление текста на составные части производится с целью получения от алгоритма сравнения лучших результатов. Алгоритм сравнения эффективнее работает с малыми объемами текста.

В данной БД содержится информационный массив, состоящий из: Информации, получаемой с ресурсов (ссылка на документ, текст документа, количество редакций, тексты редакций, степень готовности новых редакций); Информации, получаемой из документа (название документа, дата редакции, ссылки на другие документы).

При передаче текстов документа алгоритмам, документ преобразуется в строковый формат, деление производится по статьям и иным пунктам. Алгоритму сравнения передаются парные составные части соответствующих редакций – предыдущей и текущей. Алгоритм сравнения возвращает текст, разделенный на три части: неизменная часть, удаленная часть из предыдущей редакции, добавленная информация в текущей редакции. После этого интерфейс отображает пользователю изменения, если они имеются. Если удаленная или добавленная часть слишком мала (например, изменение отступов, пробелов, переносов, запятых и т.д.), в ней отсутствует изменение самого текста документа – алгоритм может считать такие изменения несущественными и не отображать их для пользователя.

Результаты разработки IPS NOSP протестированы на информационных массивах законодательных актов РФ и регионального законотворчества с формированием цепочек изменений (исправлений, дополнений, удалений). Полученные данные позволили обеспечить контроль выполненных расчетов социальной защиты населения на примере Пермского края как в прямом, так и в обратном порядке.

Заключение

Разработанная система IPS NOSP решает проблемы, возникающие при обращении к специализированной ИС социальных услуг, выраженной в отставании внесения нормативных изменений в действующую БД. Использование данного подхода к поиску заданной информации, позволяет исключить причину возникновения такой проблемы. Данная система IPS NOSP может быть внедрена для использования по любым направлениям целенаправленного поиска информации с поддержкой отслеживания параметров меняющихся характеристик (нормативы, регламенты, диагностика, система безопасности и т.д.).

Модульной реализация структуры позволит достраивать ИС путем добавления модулей анализа полноты, объема, взаимосвязей информации, настройки мониторинга и реализации автоматизированной системы ведения корректуры дочерних систем.

Список литературы

  1. Atkin R. H. Combinatorial Connectivies in Social Systems. An Application of Simplicial Complex Structures to the Study of Large Organisations, Interdisciplinary Systems Research. 1997;
  2. Моделирование систем и процессов : учебник для академического бакалавриата / В. Н. Волкова, Г. В. Горелова, В. Н. Козлов, Ю. И. Лыпарь, Н. Б. Паклин, А. Н. Фирсов, Л. В. Черненькая ; под общ. ред. В. Н. Волковой и В. Н. Козлова. — М. : Издательство Юрайт, 2014. — 588 с. — Серия : Бакалавр. Академический курс.
  3. Тельнов Ю.Ф. «Информационные системы и технологии», М.: Юнити - Дана, 2012г. - 303с
  4. Шемакин Ю.И. Системантика: Монография. – М.: Изд-во РАГС, 2006. – 266 с.
  5. Автоматизированные диалоговые процедуры анализа целей и функций систем управления : учеб. пособие / под ред. В. Н. Волковой. СПб. : Изд-во Политехнического университета, 2010.
  6. Карташев Е.А. Царегородцев А.Л. Автоматизированная информационная система поиска и анализа информации в сети интернет // Журнал Фундаментальные исследования. – 2016. – № 10 (часть 2) – С. 296-300.
Интересная статья? Поделись ей с другими: