УДК 681.518.5

Обзор программного обеспечения и систем предиктивного анализа

Абрамов Даниил Юрьевич – магистрант Уфимского государственного нефтяного технического университета

Щербинин Сергей Валерьевич – кандидат технических наук, доцент Уфимского государственного нефтяного технического университета

Аннотация: В статье проведён обзор зарубежных систем предиктивного анализа и сравнительный анализ двух наиболее актуальных продуктов программного обеспечения российского производства. Сравнительный анализ произведён для систем, главной задачей которых является интеллектуальный анализ статистических данных и их последующая визуализация.

Ключевые слова: предиктивная аналитика, анализ данных, модель оборудования, системы визуализации данных, машинное обучение, автоматизированные системы управления, программное обеспечение.

В современном мире базы данных всех крупных компаний переполнены информацией различного рода. Более того, они растут в геометрической прогрессии, подпитываясь растущим набором источников, включая ERP-системы, MES-системы, машинное оборудование, а также увеличивающееся количество мультимедийных и других неструктурированных данных. Тем не менее, анализ больших наборов технологических или бизнес-показателей всегда был проблемой из-за огромного объема данных и, как следствие, проблем так называемого информационного шума. В целях облегчения структурирования огромных массивов информации была предложена инициатива «прогностической аналитики». Аналитика, которая направлена на исследование методов распознавания образов, находящих корреляции и взаимосвязи в неструктурированных последовательностях. Эта форма анализа не являлась новой, но пилотные проекты предыдущих лет не привели к существенному успеху. И теперь, когда развитие вычислительной техники и сферы математического моделирования достигли наивысшей точки прогресса, к реализации данной инициативы приложили руку огромное количество компаний всех отраслей современной экономики. Результатом их плодотворной работы стали программные продукты, обеспечивающие существенное повышение эффективности анализа и прогнозирования всех процессов, происходящих в компании.

Инструменты прогнозной аналитики сочетают в себе искусственный интеллект и бизнес-отчетность. Эти инструменты объединяют в себя процессы, направленные на сбор данных со всего предприятия, добавляют уровни статистического анализа и машинного обучения для прогнозирования будущего, а также превращают эти метаданные в полезные сводки, чтобы бизнес-пользователи могли на их основе корректировать деятельность предприятия. Качество прогнозов зависит в первую очередь от данных, которые поступают в систему [3, с. 122]. Но есть и более глубокие проблемы, поскольку программное обеспечение для прогнозной аналитики не может предвидеть проблемы, с которыми человеку ещё не приходилось сталкиваться и даже их предпосылки неизвестны. Тем не менее, системы, которые в основном работают путем выявления закономерностей, становятся все более изощренными. Большинство инструментов предлагают интерфейсы визуального программирования, которые позволяют пользователям перетаскивать различные значки, оптимизированные для анализа данных. Это помогает понимать программирование и думать, как программист, но эти инструменты позволяют генерировать сложные прогнозы всего несколькими щелчками мыши. Если вам нужно больше, добавление небольшого количества пользовательского кода обычно может решить многие распространенные проблемы. Ниже приведены современные программные продукты и их особенности:

Alteryx

Цель платформы Alteryx Analytic Process Automation (APA) – помочь вам построить такую структуру предоставления информации, которая очищает данные путем корреляции и компрессии повторяющихся значений перед применением алгоритмов обработки данных и машинного обучения. Высокий уровень автоматизации способствует внедрению этих моделей в производство для генерации постоянного потока прогнозов. Интегрированная среда разработки (IDE) предлагает более 300 опций, которые можно объединить в сложный пользовательский интерфейс. Одной из сильных сторон APA является глубокая интеграция с другими источниками данных, такими как геоданные или демографические данные, для повышения качества последующего анализ [2].

Отличительные особенности:

  • Система отлично подходит для аналитиков, которым необходимо автоматизировать сложный сбор источников данных для получения нескольких прогнозов.
  • Существуют варианты развёртывания системы как локально, так и в облаке Alteryx.
  • Включает множество инструментов роботизированной автоматизации процессов (RPA) для выполнения таких задач, как распознавание текста или обработка изображений.
  • Разработан для предоставления информации множеству клиентов, которым могут потребоваться данные, представленные в виде информационных панелей, электронных таблиц или каком-либо другом способе визуализации.

RapidMiner

Инструменты RapidMiner всегда предлагались в первую очередь специалистам по обработке данных. Основное предложение – это полноценная визуальная интегрированная среда разработки для экспериментов с различными потоками данных. Линейка продуктов теперь включает в себя больше автоматизированных решений, которые могут открыть этот процесс для большего числа сотрудников предприятия благодаря более простому интерфейсу и серии управляемых инструментов для очистки данных и поиска лучшего решения для моделирования. Затем их можно будет внедрить на производственные линии. Компания также расширяет свои облачные предложения с помощью AI Hub, призванного упростить внедрение.

Отличительные особенности:

  • Отлично подходит для специалистов по аналитике, которые работают непосредственно с данными и проводят исследования.
  • Обеспечивает прозрачность для пользователей, которым необходимо понять обоснование прогнозов.
  • Сотрудничество между разработчиков и пользователями искусственного интеллекта поощряется с помощью AI Hub на базе ноутбука Jupyter.
  • Надежная поддержка инструментов с открытым исходным кодом на основе Python.
  • Высокий уровень бесплатного пользования предоставляет RapidMiner Studio.

SAP

Этот инструмент в значительной степени основан на бизнес-аналитике и отчетности, рассматривая прогнозы внутри общей производственной цепочки. Информация из прошлого влияет на решения о будущем, полагаясь на набор высокоавтоматизированных процедур машинного обучения. Особенностью системы является её относительная простота в эксплуатации, так как результаты анализа представляются в виде «разговорной аналитики», которая предоставляет информацию в упрощенном виде, понятном не только техническому персоналу.

Отличительные особенности:

  • Идеально подходит для стеков, которые уже полагаются на глубокую интеграцию с программным обеспечением SAP для управления складами и цепочками поставок.
  • Разработан с использованием стратегии low-code и no-code, позволяющей сделать аналитику доступной для всех.
  • Интегрирован в базовый процесс бизнес-аналитики, обеспечивающая последовательность и простоту.
  • Пользователи могут подробнее изучить последовательность анализа, запросив контекст прогнозов.

Google Cloud BigQuery

Лучше всего подходит для выполнения интенсивных интерактивных специальных запросов к огромным наборам данных. Его бессерверная архитектура обеспечивает быстрый анализ без создания специальной инфраструктуры вокруг программного продукта.

 Отличительные особенности:

  • Масштабируется до наборов данных размером в петабайты с минимальной задержкой.
  • Тесно интегрируется с другими сервисами GCP, такими как BigQuery ML, для построения моделей.
  • Поддерживает запросы SQL, JavaScript, Python.
  • Бессерверная система, отсутствует необходимость в создании инфраструктуры.

Несмотря на многообразие решений, разработанных зарубежными компаниями в наше время, всё большую популярность, набирают российские аналоги программного обеспечения. Так, например, системы Форсайт и Loginom ориентируются на анализ не только бизнес-показателей, но и внедряют свои системы в технологический сектор, в целях создания отчетности и моделей предиктивной аналитики (таблица 1).

Таблица 1. Сравнительный анализ систем предиктивной аналитики.

Программное обеспечение

     Loginom

Форсайт.

Аналитическая

платформа

Краткое описание

Loginom – это аналитическая low-code платформа, обеспечивающая интеграцию, очистку и анализ данных для принятия более эффективных управленческих решений.

Форсайт. Аналитическая платформа – это программный комплекс для интеллектуального анализа данных, позволяющий эффективно визуализировать информацию для обеспечения принятия бизнес-решений на основе надёжных данных.

Назначение, основная категория

Системы анализа данных (САД)

Системы бизнес-аналитики (BI)

Дополнительные категории

Системы визуализации данных, Системы поддержки принятия решений управления(СППР), Системы построения аналитической отчётности (СПАО), Системы предсказательной аналитики, Системы анализа деятельности организации (OA), Системы анализа эффективности

предприятия

Системы визуализации данных, Системы поддержки принятия решений управления(СППР), Системы построения аналитической отчётности (СПАО), Системы предсказательной аналитики, Системы анализа деятельности организации (OA), Системы анализа эффективности

предприятия

Развёртывание

Персональный компьютер, Сервер предприятия, Облако (SaaS)

Мобильное устройство, Персональный компьютер, Сервер предприятия

Интерфейс

Веб-браузер, Windows

Веб-браузер, iOS, Windows, Android

Реестр российского ПО

https://reestr.digital.gov.ru/ reestr/305944/ [1]

https://reestr.digital.gov.ru/ reestr/306657/ [1]

Прогнозирование и предсказательная аналитика

+

+

Импорт/экспорт данных

Индикация трендов и проблем

+

+

Интеллектуальный анализ данных (ИАД)

+

-

Визуализация данных

+

-

Многопользовательский доступ

+

+

Интерактивная аналитическая обработка (OLAP)

+

-

Коннекторы для источников данных

+

-

Подводя итоги, можно заметить, что обе платформы представляют широкий спектр услуг, начиная от анализа эффективности деятельности предприятия и заканчивая прогнозной аналитикой. Несмотря на это, программный продукт Loginom имеет больше преимуществ и является самодостаточной системой, которая не требует установок дополнительных надстроек при внедрении.

Список литературы

  1. Официальный сайт реестра российского ПО [Электронный ресурс]. – Режим доступа – https://reestr.digital.gov.ru.
  2. Open source predictive analytics tools [Электронный ресурс]. – Режим доступа – https://osssoftware.org/blog/open-source-predictive-analytics-tools/.
  3. Некрасов В.А.: Совершенствование метода контроля технического состояния магистральных насосных агрегатов по параметрам вибрации. Уфа, 2006 – 223 страниц.
  4. Mehdi Mohhamadpoor, Farshid Torabi: Big Data analytics in oil and gas industry: An emerging trend [Электронный ресурс]. – Режим доступа –https://www.sciencedirect.com/science/article/pii/S2405656118301421
  5. Machado Roberty, Elias A.: Predictive Analytics Applications for Oil and Gas Processing Facilities [Электронный ресурс]. – Режим доступа – https://dspace.mit.edu/handle/1721.1/140083.

Интересная статья? Поделись ей с другими: