УДК 004

Алгоритмы машинного обучения на основе сбора данных для безопасности передвижения транспортного средства

Долгушин Кирилл Игоревич – бакалавр Национального исследовательского университета «Московский институт электронной техники»

Аннотация: Целью исследования алгоритмов машинного обучения, является отсутствие конкретного алгоритма для обработки данных опасного вождения. В качестве метода исследования были применены различные методы сбора информации и ее обработки. Результатом исследования будет гибридный алгоритм машинного обучения на основе сбора данных для безопасности передвижения транспортного средства.

Ключевые слова: анализ, транспортное средство, машинное обучение.

В ходе разработки программно-аппаратного комплекса необходимо было разработать алгоритм машинного обучения с учетом специфичных потребностей разрабатываемого решения, а именно:

  • выявление опасного вождения;
  • ведение статистики;
  • обработка случайных непреднамеренных действий;
  • повышение безопасности на дороге.

Рассмотрим наиболее популярные алгоритмы машинного обучения на данный момент.

Система рекомендаций – алгоритм, основанный на обработке данных на основе выбора пользователя, базируется на схожести элементов. Данный алгоритм имеет два типа:

  • основанный на контенте (Content-based);
  • коллаборативная фильтрация (Collaborative filtering).

Система, основанная на информации, предлагает рекомендации, которые основаны на схожести элементов, уже использованных пользователем. Такие системы ведут себя точно так, как ожидает пользователь.

Коллаборативная фильтрация использует информацию о взаимодействии пользователя с различными элементами.

Коллаборативная фильтрация также обладает уникальной особенностью, которая отсутствует в системе, основанной на данных. Эта особенность заключается в том, что система на основе данного алгоритма может самостоятельно обучаться.

На данный момент выделяют 2 подкатегории коллаборативной фильтрации:

  • основанную на модели;
  • основанную на соседстве.

Логистическая регрессия отлично подходит для решения задач бинарной классификации, где мы просто присваиваем значения 0 и 1 разным категориям соответственно.

Алгоритм k-ближайших соседей представляет собой простой метод обучения с учителем, который может использоваться как для классификации, так и для регрессии. Он легко реализуется и понимается, однако у него есть существенный недостаток: с ростом объема данных он значительно замедляет работу.

Дерево решений является логическим алгоритмом классификации, который применяется для решения задач как классификации, так и регрессии. Оно представляет собой структуру дерева, объединяющую логические условия. Дерево решений – логический алгоритм классификации, решающий задачи классификации и регрессии. Представляет собой объединение логических условий в структуру дерева.

Рассмотренные алгоритмы применимы в основном для решения, какого то либо конкретного набора задач, в случае разработки решения по повышению и контролю качества вождения применить конкретный алгоритм невозможно, поэтому было решено создать собственный алгоритм, который сочетал бы в себе ряд преимуществ от каждого алгоритма.

Для первого приближения возможных ситуаций на дороге было решено использовать для фильтрации данных алгоритм системы рекомендаций с принципом коллаборативной фильтрации, так как он поможет усреднить входящие данные по каждому типу и стилю вождения пользователя.

На основе данных после первого приближения было решено строить дерево решений, так как каждые пользователи были изначально отфильтрованы по группам и выбор возможных событий становится ограниченным.

В случае, когда нет четкого решения с помощью алгоритма дерева решений, применяется алгоритм k-ближайших соседей.

Алгоритм логистической регрессии было решено применять для обработки данных вида как нарушения связанные с возможностью бинарного выбора (пример: проезд на мерцающий светофор, нарушение скоростного режима)

Таким образом, в ходе разработки был получен гибридный алгоритм машинного обучения, который полностью удовлетворяет поставленным задачам.

Для реализации алгоритмов небезопасного вождения необходимо их описать сначала. Принцип реализации алгоритмов выявления небезопасного вождения может быть описан следующим образом:

Сбор данных

Для того чтобы определить небезопасное вождение, необходимо собирать данные о поведении водителей на дороге. Эти данные могут включать в себя информацию о скорости движения, расстоянии между машинами, показаниях датчиков, таких как гироскопы, акселерометры, датчики GPS и другие.

Анализ данных

Собранные данные обрабатываются с использованием методов машинного обучения и статистического анализа для определения паттернов небезопасного вождения, таких как слишком высокая скорость, резкое торможение или ускорение, частые перестроения, проезд на красный свет и другие.

Разработка моделей

На основе анализа данных создаются модели, которые могут предсказывать, насколько небезопасно поведение водителя в текущий момент времени. Эти модели могут быть интегрированы в системы управления транспортными средствами, такие как автомобили, грузовики и автобусы.

Внедрение систем

Системы для выявления небезопасного вождения могут быть встроены в автомобили и другие транспортные средства, а также использоваться в качестве отдельных устройств для мониторинга и анализа поведения водителей. Эти системы могут предупреждать водителя о небезопасном поведении или отправлять уведомления владельцам транспортных средств о возможных нарушениях безопасности.

Обновление и совершенствование

Алгоритмы и модели, используемые для выявления небезопасного вождения, должны постоянно совершенствоваться и обновляться на основе новых данных и технологий. Это может включать в себя дополнительную обработку данных, улучшение алгоритмов обучения или добавление новых функций для повышения эффективности и точности выявления небезопасного вождения.

Так как разрабатываемый программно-аппаратный комплекс предполагает все вышеперечисленные методы, то рассмотрим каждый из этапов на примере нашего комплекса.

Для сбора данных на микроконтроллере об опасном вождении можно использовать различные датчики, такие как гироскопы, акселерометры, датчики GPS, камеры и другие. Эти датчики могут измерять такие параметры, как скорость, ускорение, повороты, расстояние до других машин и другие факторы, которые могут указывать на небезопасное вождение. Собранные данные могут быть обработаны на микроконтроллере, используя алгоритмы машинного обучения или статистический анализ, чтобы определить, является ли поведение водителя небезопасным.

В разрабатываемом программно-аппаратном комплексе используются акселерометр и GPS для сбора данных об опасном вождении. Устройство должно быть установлено на автомобиль и записывать данные в режиме реального времени. Когда автомобиль движется, акселерометр будет измерять ускорение, а GPS – определять его координаты и скорость.

Изначально в систему заложены пороговые значения для ускорения и скорости, которые считаются опасными. Если эти значения превышаются, то данные записываются в лог-файл, и, при условии, что устройства имеют связь с сервером, если водитель резко тормозит или ускоряется, а также двигается со скоростью, которая превышает установленный порог, то данные будут записаны в лог-файл и отправлены для дальнейшей обработки на сервер. Пороговыми значениями скорости являются скоростные ограничения на трассе, а ускорение определяется многими факторами в зависимости от того, какой тип дороги, условия погоды, скорость движения и другие. Обычно пороговое значение для опасного ускорения устанавливается в диапазоне от 5 до 8 м/с².

Далее, полученные данные могут быть использованы для анализа и определения того, является ли поведение водителя небезопасным. Можно использовать алгоритмы машинного обучения, чтобы автоматически определять, является ли поведение водителя опасным, или же проанализировать данные вручную. Если поведение водителя оценивается как небезопасное, то можно принять соответствующие меры, такие как отправка уведомлений или предупреждений водителю.

  • Сбор данных: собрать данные об опасном вождении, используя различные датчики, такие как акселерометр, гироскоп, GPS, камеры и т.д.
  • Подготовка данных: очистить и предобработать данные, удалив выбросы, пропущенные значения и т.д. Привести данные к единому формату и масштабу.
  • Выбор модели: выбрать модель машинного обучения, которая лучше всего подходит для данной задачи. Например, можно использовать классификаторы, регрессоры или нейронные сети.
  • Обучение модели: обучить модель на подготовленных данных, используя алгоритмы машинного обучения. Разбить данные на обучающую и тестовую выборки, чтобы избежать переобучения.
  • Оценка модели: оценить производительность модели на тестовой выборке, используя различные метрики, такие как точность, полноту, F1-меру и т.д.
  • Подгонка гиперпараметров: оптимизировать гиперпараметры модели для повышения ее производительности.
  • Использование модели: использовать обученную модель для определения опасного вождения в режиме реального времени, применяя ее к данным, полученным с датчиков в автомобиле.

На основе полученных данных мы получаем пример модели опасного вождения, которая может выглядеть следующим образом:

  • Сбор данных: собираются данные об ускорении и скорости автомобиля, полученные с помощью акселерометра и GPS-датчика.
  • Подготовка данных: данные очищаются от выбросов, пропусков и масштабируются.
  • Выбор модели: выбирается модель регрессии, которая может прогнозировать опасное вождение на основе данных об ускорении и скорости.
  • Обучение модели: модель обучается на данных, используя алгоритм линейной регрессии.
  • Оценка модели: модель оценивается на тестовых данных, используя метрику среднеквадратичной ошибки.
  • Подгонка гиперпараметров: гиперпараметры модели оптимизируются для повышения ее производительности.
  • Использование модели: модель используется для определения опасного вождения в режиме реального времени, применяя ее к данным, полученным с датчиков в автомобиле.

Список литературы

  1. ТЕХЭКСПЕРТ: [сайт]. URL: https://docs.cntd.ru/document/1200095098 (дата обращения: 13.05.20223).
  2. ИТМО: [сайт]. URL: https://neerc.ifmo.ru/wiki/index.php?title= Дерево_решений_и_случайный_лес (дата обращения: 13.05.2023).

Интересная статья? Поделись ей с другими: