Влияние аугментации трехмерных данных на обучение графовых сверточных нейронных сетей

"Научный аспект №6-2024" - Информ. технологии

УДК 004.8

Вохминцев Александр Владиславович – доктор технических наук, профессор кафедры Информационных технологий и экономической информатики Челябинского государственного университета

Шамгунов Артур Эдуардович – магистрант кафедры Информационных технологий и экономической информатики Челябинского государственного университета

Аннотация: В данной статье исследуются области применения аугментации трехмерных данных, а также анализируются преимущества и вызовы, связанные с их использованием. Для анализа влияния аугментации на обучение нейронных сетей был использован датасет ModelNet. В эксперименте применялись нейронные сети RGCNN и DGCNN, архитектуры которых подробно рассмотрены. Проанализированы результаты оценки точности при классификации данных.

Ключевые слова: аугментация данных, глубокое обучение,  графовые сверточные нейронные сети , GCNN, графы, облака точек

Введение

Аугментация данных, давно используется в обработке изображений и звуков. Однако с развитием технологий и увеличением объема трехмерных данных (3D данных), таких как данные, полученные с помощью LiDAR, 3D-сканеров и других источников, возникла необходимость в разработке методов аугментации специально для этих данных.

В данной статье рассматривается применение аугментаций в различных областях и преимущества, которые они предоставляют и влияние простейших аугментаций на результаты обучения нейронных сетей.

Применение трехмерных данных

Трехмерные данные достаточно сложно получать, поэтому аугментация находит применение во многих областях, так как она способна увеличить количество данных. К областям применения трехмерных данных можно отнести медицину, геологию, автоматизированное проектирование и даже
сферу развлечений.

К преимуществам аугментации трехмерных данных можно отнести: улучшение качества моделей, снижение затрат, как говорилось ранее, а также повышение устойчивости моделей. Но кроме возникающих преимуществ аугментаций, можно выделить и возникающие сложности при их применении. Ими являются: cложность реализации -разработка и настройка алгоритмов аугментации требует значительных усилий и экспертизы, а также сохранение реалистичности - необходимо гарантировать, что созданные данные сохраняют реалистичность и релевантность для поставленных задач.

Простейшие методы аугментации включают применение случайных трансформаций к исходным данным, такие как: повороты, масштабирование, отражение, сдвиг, а также добавление шума и искажения (гауссов шум, искажение поверхности).

Эталонный набор данных

Для исследования влияния аугментации трехмерных данных на результаты обучения графовых сверточных нейронных сетей был взят один из стандартных датасетов ModelNet. ModelNet, это набор данных, который был создан для содействия исследованию и разработке методов машинного обучения и компьютерного зрения, которые работают с трехмерными формами. ModelNet включает тысячи трехмерных моделей, представляющих различные категории объектов, такие как: мебель, транспортные средства, бытовые приборы и электроника. Это позволяет разрабатывать методы, способные работать с широким спектром объектов. Для наглядности, выведем одну из моделей, представленную в виде облака точек (рисунок 1).

image001

Рисунок 1. Одна из трехмерных моделей набора данных ModelNet.

В процессе выполнения исследования было выдвинуто предположение, что при добавлении случайного поворота по 3 осям и добавлении шума, результаты при обучении нейронных сетей, такие как точность будут улучшаться и соответственно увеличится объем данных. Визуализированные аугментации представлены на рисунке 2.

image002

Рисунок 2. Аугментированная трехмерная модель набора данных ModelNet.

Используемые нейронные сети

В качестве нейронных сетей были взяты RGCNN и DGCNN. DGCNN — это архитектура (рисунок 3), предназначенная для обработки графов,
представляющих структуры, где узлы и ребра могут динамически
изменяться. DGCNN использует операции на основе косинусного расстояния
и методы выравнивания для учета неизменяемости узлов в графе, что
обеспечивает высокую точность, как при сегментации данных, так и при классификации с динамической топологией.

image003

Рисунок 3. Архитектура сети DGCNN.

Архитектура RGCNN

Основная операция в RGCNN – графовая свертка, выполняемая в спектральной области с использованием аппроксимации многочленов Чебышева. Это позволяет снизить вычислительную сложность и улучшить локализацию признаков. Следующей особенностью RGCNN является введение регуляризации в виде гладкости графового сигнала в функцию потерь. Это позволяет улучшить показатели сегментации и классификации, заставляя признаки соседних вершин быть более похожими друг на друга, что облегчает задачу.

 

image004Рисунок 4. Архитектура сети RGCNN.

Результаты и обсуждения

В результате обучения были получены следующие результаты:

image005

Рисунок 5. Классификация DGCNN

 image006              

Рисунок 6. Классификация RGCNN.

  image007

Рисунок 7.

image008

Рисунок 8.

Добавив на график результаты обучения без аугментаций обеих сетей можно увидеть разницу в точности классификаций.

 image009

Рисунок 9.

image010

Рисунок 10.

Выводы

  1. Аугментация трехмерных данных имеет широкий спектр применения, от автономных транспортных средств до медицинской визуализации и разработки игр. Несмотря на некоторые вызовы, такие как сложность реализации и необходимость сохранения реалистичности данных, преимущества, включая улучшение качества моделей и снижение затрат, делают аугментацию трехмерных данных важным и перспективным направлением в современных технологиях обработки данных.
  2. Проанализировав графики, полученные при обучении моделей, мы можем увидеть, что аугментация несущественно влияет на точность получаемых результатов, но способна увеличить количество данных.
  3. Точность сети RGCNN больше по сравнению с DGCNN.

Список литературы

  1. Yue Wang, Yongbin Sun, Ziwei Liu, Sanjay E. Sarma, Michael M. Bronstein, and Justin M. Solomon. 2019. Dynamic Graph CNN for Learning on Point Clouds. ACM Trans. 1, 1, Article 1 (January 2019), 13 pages. https: //doi.org/10.1145/3326362.
  2. Gusi Te, Wei Hu, Zongming Guo, Amin Zheng:
    RGCNN: Regularized Graph CNN for Point Cloud Segmentation. CoRR abs/1806.02952 (2018).

Интересная статья? Поделись ей с другими:

Автор: Вохминцев Александр Владиславович