УДК  004

Разработка программного обеспечения автоматизированной обработки результата СИ

Кондрашов Герман Романович – магистрант Московского института электронной техники

Аннотация: В современном мире информация обладает высокой значимостью, вместе с ней важна соответственно и защита информации. В свою очередь важной составляющей технической защиты информации являются специальные исследования технических средств. Специальные исследования должным образом документируются на бумаге для разработки дальнейших систем защиты выделенных помещений, в которых будут располагаться данные средства. Сам процесс документации является достаточно долгим и трудозатратным. В статье автор рассмотрел возможность автоматизации документопроизводства при проведении специальных исследований технических систем и средств.

Ключевые слова: специальные исследования, документопроизводство, автоматизация, защиты информации.

При документировании результатов проведённых специальных исследований, нужно вносить результаты, полученные во время измерений в специальные расчётные программы, которые на выходе дадут ряд важных характеристик того или иного технического средства, необходимых для технической защиты информации. Дальше полученные результаты расчётных программ необходимо внести в документацию по техническим средствам.

Зачем автоматизировать процесс документопроизводства при проведении специальных исследований? Для автоматизации есть несколько причин. Во-первых, автоматизация сильно ускорит процесс заполнения документов. Во-вторых, автоматизация позволит исключить фактор ошибки человека, ведь даже при простом переносе результатов расчётов в документ, человек может допустить ошибку, присудить значения расчётов не тому техническому средству или перенести их не полностью, что приведёт к их искажению. В-третьих, во время автоматическое заполнение документов освобождает специалисту руки для другой работы, которую можно делать параллельно.

Документ – это "письменная форма, передающая информацию", которая имеет содержание, структуру и презентационные характеристики. Можно выделить спектр типов документов, в котором на одном конце находятся документы с ярко выраженным повествовательным стилем (например, романы), на другом - документы с ярко выраженным транзакционным стилем (например, товарные чеки), а между ними – множество гибридных документов, включая полуповествовательные и полутранзакционные документы, такие как юридические документы и технические/научные отчеты.

Специалисты по разработке документов определяют документ как объединение двух компонентов: содержания и представления. Содержание документа включает в себя шаблон, определяющий логическую структуру документа, а также компоненты, инстанцирующие этот шаблон. Презентация документа включает в себя макет, который определяет, где именно должен быть размещен каждый фрагмент контента, а также как он будет выглядеть в документе.

Автоматизация – это "автоматически управляемая работа аппарата, процесса или системы с помощью механических или электронных устройств, которые заменяют человеческий труд".

Автоматизация документопроизводства не является хорошо понятным и четко определенным термином. Автоматизация документопроизводства (АД) – это термин, используемый многими коммерческими инструментами, направленными на автоматизацию работы с юридическими документами.

Автоматизация документопроизводства – это автоматизация сложных процессов и документопроизводства, включая разработку шаблонов и сборку документов, как правило, с использованием передовых технологий.

Цифровые документы могут быть представлены, храниться и обмениваться в различных форматах, определенных организациями по стандартизации, такими как W3C2 и OASIS3 (Hackos 2016). Системы АД обычно поддерживают такие стандартные форматы, как PDF, TeX (Latex), DOCX, HTML и IPYNB, при преобразовании документов из одного формата в другой и создании конечных документов. Системы АД также могут использовать стандартные форматы обмена данными, такие как XML (Extensible Markup Language) и JSON (JavaScript Object Notation), для представления документов в более удобном для машинного чтения и автоматизированных процессов виде.

XML - это стандарт для определения языков разметки с набором начальных и конечных "тегов", которые могут быть использованы для добавления дополнительной информации об основном текстовом содержании, например, о способе представления или семантической информации.

Структура и допустимые элементы XML-документа могут быть определены в файле XML DTD4. Структуры XML могут быть преобразованы в HTML, обычный текст или другие структуры XML с помощью расширяемой трансформации таблиц стилей (XSLT), которая может использоваться для рекурсивного преобразования XML-документа в другие форматы.

В рассмотренных исследованиях также использовались стандарты Семантического веба на основе

XML (Hitzler 2021), включая следующие стандарты W3C:

  • RDF (Resource Description Framework) – это простая модель данных на основе тройки (тройка субъект, предикат, объект). RDF предоставляет формализм на основе графов для представления метаданных.
  • Язык OWL (Web Ontology Language) – это стандарт де-факто для разработки онтологий. Он предоставляет богатый словарный запас для добавления семантики и контекста, а также для рассуждений и выводов.
  • SPARQL – это язык запросов к RDF, позволяющий получать данные, хранящиеся в RDF, и манипулировать ими.

Представим эталонную архитектуру, чтобы дать общий словарь для компонентов АД и их взаимосвязей. Используя этот общий словарь, будет легче определить и обсудить, какие компоненты и аспекты поддерживаются или исключаются в конкретной архитектуре АД, рассмотренной в данном обзоре.

Дизайн документа: Фундаментальной характеристикой архитектур АД является схема автоматизируемого документа и связанная с ним онтология (если таковая имеется). Схема определяет, какой должна быть структура документа и какие "теги" он может содержать. Онтология придает тегам смысл и определяет отношения между ними. Оба эти компонента составляют то, что на диаграмме обозначено как "дизайн документа".

Шаблон: Шаблоны, используемые для автоматизации документопроизводства, строятся поверх схемы документа. Шаблоны содержат любую статическую информацию, которая будет добавлена во все документы, а также заполняют поля для переменного содержимого, которое может быть заполнено пользователями или из внешних хранилищ данных. Шаблоны не являются исчерпывающими в определении содержимого документа по умолчанию, так как это часто делается частью архитектуры "преобразования документов".

Под внешними источниками данных понимается любой источник данных, например, база данных, набор правил или семантические данные, такие как RDF-триплеты, которые используются как часть рабочего процесса автоматизации документов.

Обработка содержимого определяет слой или обертку над этими данными для их обработки, либо для включения в конвейер, либо для создания выводов. Большинство архитектур заполняют шаблон данными, полученными из.

Перед тем, как представить проект документа пользователю, он может воспользоваться внешними источниками, хотя есть и такие, которые предоставляют пользователю форму, основанную на шаблоне и внешних данных, чтобы изменить конечный документ определенным образом.

Сборка документов: наконец, когда пользователь(и) предоставляет данные, происходит "сборка документа", где различные фрагменты документов собираются на основе заданной конфигурации. В сборку также могут быть включены данные непосредственно из внешних источников данных.

Обработка документа: после этапа "Сборка документа" документ обрабатывается на этапе "Обработка документа", где можно обрабатывать цитаты, ссылки, генерировать выходные коды. Наконец, документ отправляется на этап "преобразования документа", где проект преобразуется в нужный формат.

Анализ документов: В настройках "анализа документов" "парсер документов" использует определенную онтологию документов для разбора входного документа на RDF-триплеты или другой удобный формат. Эти триплеты могут быть обработаны для хранения в хранилище или выполнения действий с данными.

Контроль хранения/версии и аутентификация могут быть реализованы по желанию.

Человеческий вклад на этапе анализа может осуществляться либо непосредственно на входном документе (если он редактируемый), либо на информации, извлеченной после разбора документа.

Рассматривая историю развития легальной АД, Лауритсен (Lauritsen, 2012) выделяет три основные ветви легальной АД:

Создание документов: Технологии, помогающие создавать документы. Существуют две основные области, представляющие интерес для создания документов: (a) создание документов (Power drafting), включающее инструменты для обработки текстов и множество других видов инструментов, которые люди могут использовать для создания документов. (b) Сборка документов (автосборка), включая полуавтономные средства создания документов, например HotDocs.

Анализ документов: Технологии, помогающие анализировать существующие документы различными способами. Существует три основные области, представляющие интерес для анализа документов: (a) Разборка, которая включает в себя взятие документа или целого хранилища документов и его декомпозицию на составные части для анализа и, следовательно, для руководства при создании будущих документов. (b) Валидация, которая включает в себя форму анализа, при которой существующий документ проверяется на соответствие какому-либо стандарту или другому документу. (c) Извлечение смысла, которое выходит за рамки простого структурного разбора или деконструкции документа, а берет существующий документ и разбирает его, чтобы извлечь из него смысл и сделать выводы для следующих целей: каково пропозициональное содержание документа? Какие права и обязанности выражены словами? О чем договариваются стороны? Какое нормативное содержание содержится в документе?

Управление документами: это управление документами после того, как они уже существуют: (a) хранение и поиск контента, что включает в себя управление самим контентом, его хранение, поиск и предоставление людям возможности поиска. (b) Права и обязанности, что связано с управлением правами и обязанностями, которые содержатся в юридических документах (также называется программным обеспечением для управления договорами). Как мы работаем с ними?

Как их отслеживать и находить? Хенли (Henley, 2020) описывает 16 критериев при оценке юридических платформ АД.

В общем и целом, для автоматизации производства документов данные для которых бурется из других документов Word или из документов Microsoft Excel, сгодится написание скрипта в самом Excel.

А сама автоматизация является отличным преимуществом перед ручным заполнением документов, которые позволяет выполнять параллельную работу, ускоряет процесс и исключает вероятность человеческой ошибки.

Список литературы

  1. Автоматизация документооборота на предприятии // [Электронный ресурс]: https://www.cleverence.ru/articles/bukhgalteriya/avtomatizatsiya-dokumentooborota-na-predpriyatii-avtomatizirovannye-sistemy-upravleniya-dokumentami-/.
  2. Виды систем делопроизводства // [Электронный ресурс]: https://wiseadvice-it.ru/o-kompanii/blog/articles/vidy-sistem-deloproizvodstva/.
  3. Автоматизация электронного документооборота // [Электронный ресурс]: https://astral.ru/info/elektronnyy-dokumentooborot/avtomatizatsiya-deloproizvodstva-i-dokumentooborota/.
  4. Автоматизация делопроизводства и документооборота на предприятии // [Электронный ресурс]: https://www.directum.ru/blog-post/avtomatizacija_deloproizvodstva_i_dokumentooborota_na_predprijatii_osobennosti_nacionalnogo_deloproizvodstva.

Интересная статья? Поделись ей с другими: