УДК 378

Интеллектуальный анализ дорожно-транспортных происшествий и тяжести последствий на  территории Удмуртской Республики

Зарипова Елизавета Петровна – студентка Нижнекамского химико-технологического института

Аннотация: В статье приведен интеллекутальный анализ дорожно-транспортных происшествий для выявления динамики показателей аварийности. Выполнена кластеризация территорий региона, в ходе которого было выделено три группы регионов с различной степенью аварийности. Выполнено прогнозирвоание развития дорожно-транспортной обстановки в регионе на следующий год.

Ключевые слова: интеллектуальный анализ дорожно-транспортных происшествий, показатели аварийности, датасет для машинного обучения, нейронная сеть LSTM.

В работе приведен интеллекутальный анализ дорожно-транспортных происшествий для выявления динамики показателей аварийности. Выполнена кластеризация территорий региона, в ходе которого было выделено три группы регионов с различной степенью аварийности. Выполнено прогнозирвоание развития дорожно-транспортной обстановки в регионе на следующий год.

В Удмуртской Республике наблюдается стремительный рост количества предприятий и, соответственно, транспортных средств и потоков, как в городской, так и в сельской местности. Все это приводит к увеличению негативных последствий транспортной деятельности, наиболее значимыми из которых являются дорожно-транспортные происшествия и связанные с ними материальные и человеческие потери. В настоящее время на территории Уд-муртской Республики зарегистрировано около 600.000 средств наземного транспорта. Кроме того, ежедневно по дорогам республики двигаются сотни транспортных средств из других регионов России. В этой связи анализ данных и прогнозирование динамики и структуры ДТП имеют исключительно важное значение, как для повышения эффективности и безопас-ности дорожного движения, так и для разработки комплекса мер по снижению числа ДТП и тяжести их последствий.

Было проведено сравнение данных методов прогнозирования с помощью показателя RMSE.  Значения показателя RMSE у модели ARIMA оказался больше, чем у модели LSTM, поэтому выбор модели для прогнозирования дорожно-транспортных происшествий пал на модель глубокого обучения LSTM. В настоящее время для анализа больших данных набирают популярность алгоритмы на основе глубокого обучения, потому что их показатель сред-неквадратичной ошибки меньше в сравнение с другими методами для прогнозирования. Но остается вопрос являются ли новые прогрессирующие методы прогнозирования более точными по сравнению с традиционными методами прогнозирования [1-2].

Для решения поставленных задач нужно разработать различные алгоритмы для работы с датасетом дорожно-транспортных происшествий, такие как алгоритм загрузки и пре-добработки данных, алгоритм кластеризации и алгоритм прогнозирования, а также произвести импорт данных в систему и их экспорт из системы в Yandex DataLens (сервис по визуа-лизации данных). Датасет для машинного обучения – это обработанная и структурированная информация в табличном виде. Строки такой таблицы называются объектами, а столбцы – признаками. Нужно реализовать алгоритмы загрузки и предобработки данных.

После проведения исследований, были выделены следующие элементы системы:

  • подсистема предобработки и загрузки. Подсистема загрузки и предобработки будет выполнять функции формирования данных;
  • подсистема кластеризации. Подсистема кластеризации будет разбивать данные на группы (кластеры), чтобы в дальнейшем можно было отобразить места концентрации ДТП в Удмуртской Республике;
  • подсистема прогнозирования. Подсистема прогнозирования предназначена для прогноза количества ДТП в Удмуртской Республике на следующий год.
  • подсистема визуализации. Подсистема визуализации будет отвечать за отображение участков ДТП на тепловой карте, графиков, диаграмм и гистограмм с помощью сервиса DataLens.

При выборе языка программирования для интеллектуального анализа ДТП, я остановился на выборе языка программирования Python.

Python считается мощным высокоуровневым языком программирования, получившим огромную популярность среди разработчиков благодаря своей универсальности.

Целью выполняемой работы является интеллектуальный анализ ДТП для предсказания возникновения ДТП во избежание смертей на дороге. Python идеально подходит для работы с интеллектуальным анализом, а методы кластеризации и прогнозирования, которые также можно реализовывать на этом языке позволяет проанализировать полученные данные.

Важным фактором при выборе языка разработки стало наличие обширного набора инструментов и библиотек для решения задач. К ним можно отнести pandas, matplotlib, numpy, scikit-learn и другие.

Для работы с Python использовалась интегрированная среда разработки Anaconda 3 с встроенным редактором кода Jyputer Notebook.

Результаты интеллектуального анализа дорожно-транспортных происше-ствий и тяжести последствий по Удмуртской Республике.

Для выявления сезонности было произведено разложение временного ряда. Разложение временного ряда состоит из трех систематических компонентов: тренд, сезонность и шум. Анализ данных выявил годовую сезонность количества произошедших дорожно-транспортных происшествий в городе Ижевске.

image001

Рисунок 1. Разложение на тренд, сезонность и шум для города Ижевска.

Также было произведено разложение временного ряда на компоненты для показателей остальной части Удмуртской Республики.

image002

Рисунок 2. Разложение на тренд, сезонность и шум для районов Удмуртской Республики.

Как видно на рисунках 1 и 2 обе части выборки имеют годовую сезонность и тенденцию к снижению общего количества дорожно-транспортных происшествий в регионе.

image003

Рисунок 3. Прогноз количества дорожно-транспортных происшествий в городе Ижевске на 2022 год.

Прогнозирование количества дорожно-транспортных происшествий в Удмуртской Республике производилось при помощи нейронной сети LSTM (Long short-term memory – долгая краткосрочная память). LSTM – это особая разновидность архитектуры рекуррентных нейронных сетей, способная к обучению долговременным зависимостям. Они прекрасно решают целый ряд разнообразных задач и в настоящее время широко используются. Прогнозы, построенные LSTM сетью представлены на рисунках 3-5.

image004 

Рисунок 4. Прогноз количества дорожно-транспортных происшествий в районах Удмуртской Республики на 2022 год.

image005

Рисунок 5. Прогноз количества дорожно-транспортных происшествий в Удмуртской Республике на 2022 год.

На основе полученного прогноза и данных, полученных из открытых источников, было вычислено общее количество дорожно-транспортных происшествий в Удмуртской Республике на 1000 человек в год. Данные расчета представлены в таблице 1.

Таблица 1. Расчетные данные.

Год

Количество ДТП

Численность населения, чел

Количество ДТП на 1000 человек

2017

1823

1 516 826

1,202

2018

2003

1 513 044

1,324

2019

2095

1 507 390

1,390

2020

1913

1 500 955

1,275

2021

1178

1 493 356

0,789

2022

1341

1 491 825

0,899

Как видно из таблицы 2 общее количество дорожно-транспортных происшествий и численность в регионе падает, но и количество дорожно-транспортных происшествий в год на 1000 человек также снижается.

Список литературы

  1. Орехов П.В. Оценка аварийности участков дорожной сети методом Саати // Пожарная безопасность: проблемы и перспективы. 2015. №1 (6). С.388-392.
  2. Девятов В.М. Обоснование мероприятий по снижению аварийности дорожного движения на участках концентрации ДТП // Вестник Волггасу. Сер.: Стр-во и архит., 2009. Вып. 13 (32).

Интересная статья? Поделись ей с другими: