УДК 004

Алгоритмическое и программное прогнозирование конечных свойств композиционных материалов

Фомина Анна Александровна – выпускница кафедры «Институт управления персоналом, социальных и бизнес-коммуникаций» Государственного университета управления

Аннотация: В данной работе представлены разработанные модели, которые предсказывают конечные свойства композитных материалов, а именно: "Соотношение матрицанаполнитель", "Модуль упругости при растяжении, Гпа" и "Прочность при растяжении, Мпа" на основе их состава и производственных параметров. Созданные прогнозные модели помогут сократить количество проводимых испытаний, оптимизации производства и минимизации затрат. Разработаны нейронные сети и модель градиентного бустинга CatBoost, которые предсказывают 3 параметра композитных материалов с точностью около 80%, а некоторые даже около 100%, а также разработано приложение с графическим интерфейсом для лучшей наглядности результатов. Использовались три различные метрики: MAE, MSE, MAPE, которые доказали высокую точность и качество моделей.

Ключевые слова: композиционные материалы, машинное обучение, нейронные сети, CatBoost, метрики.

Введение

Композиционный материал – многокомпонентный материал, изготовленный из двух или более компонентов с существенно различными физическими и/или химическими свойствами, которые, в сочетании, приводят к появлению нового материала с характеристиками, отличными от характеристик отдельных компонентов. Композиты обладают теми свойствами, которые не наблюдаются у компонентов по отдельности. При этом композиты являются монолитным материалом, т. е. компоненты материала неотделимы друг от друга без разрушения конструкции в целом. Яркий пример композита железобетон. Бетон прекрасно сопротивляется сжатию, но плохо растяжению. Стальная арматура внутри бетона компенсирует его неспособность сопротивляться растяжению, формируя тем самым новые, уникальные свойства. Для прогнозирования конечных свойств композиционных материалов есть два пути: физические испытания образцов материалов или прогнозирование характеристик путем использования моделей машинного обучения.

Актуальность и цель работы

Цель работы заключается в создании таких моделей, которые помогут предсказывать конечные свойства композитных материалов ("Соотношение матрица-наполнитель", "Модуль упругости при растяжении, Гпа" и "Прочность при растяжении, Мпа") на основе их состава и процесса производства.

В настоящее время, композитные материалы получили широкое применение в различных областях промышленности, таких как авиационная, автомобильная, судостроительная, строительная и многих других.

В данной работе представлены разработанные модели, которые предсказывают конечные свойства композитных материалов, а именно: "Соотношение матрица-наполнитель", "Модуль упругости при растяжении, Гпа" и "Прочность при растяжении, Мпа" на основе их состава и производственных параметров. Созданные прогнозные модели помогут сократить количество проводимых испытаний, так как процесс производства композитов может быть очень сложным, поскольку конечные свойства материала зависят от многих факторов, таких как температура, состав материала и многие другие. Также при прогнозировании характеристик исключается человеческий фактор, которого нельзя исключить при физических испытаниях. Таким образом, предсказание свойств композитных материалов могут помочь в разработке новых материалов с улучшенными свойствами, оптимизации производства и минимизации затрат.

Глава 1. Разведочный анализ данных

Описание и анализ исходных данных

Предоставленные файлы с данными основаны на реальных производственных задачах Центра НТИ «Цифровое материаловедение: новые материалы и вещества» (структурное подразделение МГТУ им. Н.Э. Баумана).

Исходные данные состоят из 2 excel файлов, которые позже для работы были объединены в один единый файл. Файлы расположены по ссылке:

https://disk.yandex.ru/d/eJ0lDxe2wEsHNA.

Для лучшей наглядности название параметров (столбцов) переведены в аббревиатуры.

Таблица 1. Аббревиатуры параметров.

Наименование параметра

Сокращенное наименование параметра

Угол нашивки, град

УГ

Шаг нашивки

ШН

Плотность нашивки

ПН

Соотношение матрица-наполнитель

СМН

Плотность, кг/м3

П

Модуль упругости, Гпа

МУ

Количество отвердителя, м.%

КО

Содержание эпоксидных групп,%_2

СЭГ

Температура вспышки, С_2

ТВ

Поверхностная плотность, г/м2

ПП

Модуль упругости при растяжении, Гпа

МУР

Прочность при растяжении, Мпа

ПР

Потребление смолы, г/м2

ПС

Пропусков и дубликатов в датасете выявлено не было. Все параметры, за исключением угла нашивки, имеют тип – число с плавающей точкой. Тип параметра «Угол нашивки, град» является целым числом.

Всего выбросов в данных по всем параметрам было найдено 93, использовалась диаграмма "Ящик с усами".

Для выявления параметров в большей степени влияющих на изменения значения прогнозируемых параметров датасета была посчитана корреляция между параметрами, визуализирована матрица рассеяния и тепловая карта. Матрица рассеяния переменных представлена на рисунке 1.

image001

Рисунок 1. Матрица рассеяния параметров.

Тепловая карта представлена на рисунке 2.

image002

Рисунок 2. Тепловая карта.

Матрица рассеивания параметров, а также тепловая карта подтвердила, что линейных зависимостей у переменных нет.

Благодаря разведочному анализу было выявлено отсутствие пропусков и дубликатов, отсутствие линейной зависимости переменных, а также наличие выбросов, которые будут удалены, чтобы не создавать неточности в дальнейшем прогнозировании.

Предобработка данных

Предварительная обработка данных является важным шагом в процессе интеллектуального анализа данных. Выбросы, отсутствие нормализации данных играют ключевую роль в прогнозировании финального результата желаемой задачи.

Всего было обнаружено 93 выброса, которые были удалены, так как их, по сравнению с общим количеством данных, немного и это не отразится негативно на данных. Далее была проведена нормализация данных, так как будучи разными по физическому смыслу, данные сильно различаются между собой по абсолютной величине.

Глава 2. Прогнозирование конечных свойств материалов

Руководствуясь результатами разведочного анализа и предобработкой данных, было принято решение воспользоваться следующими нейронными сетями и градиентным бустингом – CatBoost.

Для лучшей интерпретируемости результатов для каждой модели реализовано три метрики: Средняя абсолютная ошибка (MAE), Среднеквадратичная ошибка в процентах (MAPE) и Среднеквадратическая ошибка (MSE).

Для каждого из трех параметров была реализована своя нейронная сеть. Все три нейронные сети имеют одинаковые параметры, за исключением выходного значения, которое модель предсказывает и количества эпох. Нейронные сети реализованы в библиотеке Keras с использованием метода Sequential. Реализованные модели состоят из 3 слоев: два слоя Dense с 64 нейронами и функцией активации tanh (гиперболический тангенс) и один выходной слой Dense с одним нейроном. Также используется алгоритм оптимизации rmsprop, функцией потерь mse (среднеквадратическая ошибка) и метрикой mae (средняя абсолютная ошибка). При построение нейронных сетей было принято решение использовать кросс-валидацию для улучшения результатов исследования.

Прогнозирование параметра «Модуль упругости при растяжении, Гпа» и «Прочность при растяжении, Мпа»

Для понимания необходимого количества эпох у моделей были построены сглаженные графики зависимости МАЕ. Для модели, предсказывающей параметр «Модуль упругости при растяжении, Гпа» 27 эпох являются оптимальными, так как дальше происходит ухудшение метрики, а для модели, предсказывающей параметр «Прочность при растяжении, Мпа» – 28 эпох.

Результаты метрик построенной модели, предсказывающей параметр «Модуль упругости при растяжении, Гпа» указаны в таблице 2.

Таблица 2. Модуль упругости при растяжении, Гпа.

Название метрики

Результат метрики

MAE

2.465538420000221

MAPE

0.03330826757172251

MSE

9.170545943147479

MAPE для параметра «Прочность при растяжении, Мпа» равен 0.03330826757172251, то есть модель предсказывает почти со 100% точностью.

Таблица 3. Результаты метрик при прогнозировании параметра «Прочность при растяжении, Мпа».

Название метрики

Результат метрики

MAE

373.2589767362285

MAPE

0.15533584569227357

MSE

223974.21033661283

В данной модели MAPE равен 0.15533584569227357, то есть модель предсказывает с 85% точностью, что тоже является очень хорошим результатом.

Прогнозирование параметра «Соотношение матрица-наполнитель»

Для прогнозирования данного параметра было реализовано две модели: нейронная сеть с параметрами, описанными выше, а также CatBoost модель, которая будет использована в приложении.

В нейронной сети оптимальным являются 30 эпох.

Результаты метрик построенной модели указаны в таблице 4.

Таблица 4. Результаты метрик при прогнозировании параметра «Соотношение матрица-наполнитель» нейронной сетью.

Название метрики

Результат метрики

MAE

0.7758003824912014

MAPE

0.23843307097339517

MSE

0.9017931073739356

В данной модели MAPE равен 0.23843307097339517, то есть модель предсказывает приблизительно с 76% точностью.

Кроме того, была реализована CatBoost модель. Наблюдая за зависимостью МАЕ от кол-ва эпох модели, было решено добавить параметр ранней остановки обучения модели. В данном случае, если в течение 100 раундов (эпох) на валидационной выборке не наблюдалось улучшение метрики MAE, то обучение было остановлено и лучшая модель, которая была достигнута на предыдущих эпохах, будет сохранена. Это позволяло избежать переобучения модели и улучшить ее обобщающую способность. Результаты метрик построенной модели указаны в таблице 5.

Таблица 5. Результаты метрик при прогнозировании параметра «Соотношение матрица-наполнитель», с помощью CatBoost.

Название метрики

Результат метрики

MAE

0.687069452584295

MAPE

0.23603797886093886

MSE

0.7596425451438612

В данной модели MAPE равен 0.23603797886093886, то есть модель предсказывает почти с 80% точностью (77%), что тоже является хорошим результатом.

Приложение с графическим интерфейсом

Приложение с графическим интерфейсом было создано для большей наглядности полученных результатов. Приложение реализовано на фреймворке Streamlit. Приложение находится по ссылке: https://annafomina1997-project-web-app-v-01-zhv1fw.streamlit.app/.

В функционал приложения входит визуализация прогнозирования параметра «соотношение матрица-наполнитель».

Приложение создано на основе созданной модели CatBoost. Рисунок 3 иллюстрирует интерфейс приложения.

image003

image004

Рисунок 3. Интерфейс приложения.

Инструкцию использования приложения. Производить действия, описанные в инструкции следует по порядку. Для получения прогноза параметра «соотношение матрица-наполнитель» необходимо:

  1. В случае появления изображения, указанного на рисунке 17, нажать на кнопку: «Yes, get this app back up!». После нажатия на кнопку приложение начтет запуск и будет отображено: «App is booting», далее откроется само приложение и будет необходимо следовать дальнейшим пунктам. Если подобное изображение не появляется, игнорировать пункт 1.

image005

Рисунок 4. Спящее приложение

  1. Заполнить все ячейки приложения
  2. При вводе использовать только числа. Разделителем считается точка.
  3. Для расчета параметра нажать на кнопку «Predict». Расчётный показатель будет выведен внизу приложения с надписью: «Соотношение матрица-наполнитель = (наше предсказание)», например, «Соотношение матрица-наполнитель = 2.9192059284828895».

Заключение

В результате проделанной работы были разработаны нейронные сети и модель градиентного бустинга CatBoost, позволяющие предсказывать три ключевых параметра композитных материалов с высокой точностью, а именно "Соотношение матрица-наполнитель", "Модуль упругости при растяжении, Гпа" и "Прочность при растяжении, Мпа". Модели прошли тестирование на реальных данных, показав точность прогноза около 80%, а некоторые даже около 100%. Использовались несколько различных метрик, таких как MAE, MSE, MAPE, что позволило убедиться в высоком качестве моделей.

Для лучшей наглядности результатов было разработано приложение с графическим интерфейсом, которое облегчает визуализацию результатов и упрощает использование моделей.

Для дальнейшего развития работы можно расширить базу данных, чтобы улучшить производительность моделей.

В заключение, наша работа показывает, что модели машинного обучения могут использоваться для предсказания конечных свойств композитных материалов и успешно это делают, что открывает новые возможности для улучшения производства и создания новых и более эффективных материалов для различных сфер жизни. Модели могут быть использованы в промышленности для оптимизации производства композитных материалов, что приведет к экономическим и экологическим выгодам.

Список литературы

  1. Репозиторий с кодом предобработки данных, разработки моделей прогноза и с кодом разработки приложение: https://github.com/AnnaFomina1997/Project.
  2. Ссылка на приложение: https://annafomina1997-project-web-app-v-01-zhv1fw.streamlit.app/.
  3. Исходные файлы: https://disk.yandex.ru/d/eJ0lDxe2wEsHNA
  4. Библиотека Numpy: – Режим доступа: https://numpy.org/ (дата обращения 25.04.2023).
  5. Библиотека Pandas: – Режим доступа: https://pandas.pydata.org/ (дата обращения 25.04.2023).
  6. Библиотека Sklearn: – Режим доступа: https://scikit-learn.org/stable/ (дата обращения 25.04.2023).
  7. Библиотека Seaborn: – Режим доступа: https://seaborn.pydata.org/ (дата обращения 25.04.2023).
  8. Веб-фреймворк: – Режим доступа: https://streamlit.io/ (дата обращения 26.04.2023).

Интересная статья? Поделись ей с другими: