УДК 004

Data science и machine learning в промышленности

Кадыр Нурбек Болатулы – студент Евразийского национального университета, Республика Казахстан, г. Астана

Аннотация: В статье рассматриваются вопросы применения в промышленности получившего широкое распространение в последнее время феномена больших данных. Акцентируется внимание на data science, являющейся результатом геометрического роста информации сегодня, а также технологий ее обработки. Кроме того, выделены перспективы применения в современной промышленности machine learning.

Ключевые слова: анализ данных, технологии, промышленность, искусственный интеллект, системы.

Успех проектов data science и machine learning в промышленности определяется множеством факторов, учет которых позволит оптимизировать распределение ресурсов и на ранних этапах исключить проекты, не приносящие экономической выгоды.

Data science сегодня доминирует в большинстве отраслей, поскольку большинство из них работают на основе данных. Это произвело революцию в восприятии данных различными отраслями промышленности. Учитывая обширную область data science и ее разнообразные приложения, очевидно, что она находит сегодня свое применение и в производстве [1, с. 14].

Обрабатывающая промышленность переживает масштабные преобразования, поддерживаемые сегодняшней цифровой эпохой, которая требует большей гибкости от клиентов, деловых партнеров и поставщиков. Растущий масштаб и скорость могут стать проблемой для производителей, и именно здесь на помощь приходит data science.

Аналитика больших данных способствует развитию интеллектуального производства. Согласно прогнозу IDC, к 2025 году по меньшей мере четверть крупнейших производителей будет полагаться на встроенный интеллект, основанный на приложениях для обработки когнитивных данных (таких, как machine learning и искусственный интеллект) и Интернете вещей, или IoT, поэтому существует необходимость в изучении искусственного интеллекта и machine learning. Это приведет к автоматизации крупномасштабных процессов и ускорит время выполнения почти на 25%.

Поскольку большие данные прокладывают путь производителям по всему миру, специалистов по обработке данных вполне уместно рассматривать как новых работников в промышленности.

Ведущие компании, к примеру, такие как GM и Ford, интегрируют данные в огромных объемах как из внешних, так и из внутренних источников, от процессоров и датчиков, чтобы улучшить свое производство, снизить энергозатраты и увеличить объем производства. Даже небольшие предприятия осознали преимущества, связанные с использованием больших данных.

Большие данные не только дешевле в использовании, но и дешевле в хранении. Растущая сложность аналитического программного обеспечения сделала его широко распространенным. Станки для параллельной обработки становятся легко доступными для производителей [2, с. 205].

Большинство отраслей промышленности основаны на обрабатывающей промышленности. Производители используют тяжелую технику, оборудование и другие предметы для создания своих товаров. Но одного производства товаров будет недостаточно, чтобы конкурировать на рынке. Они должны оценивать производительность, сокращать количество производственных ошибок, приспосабливаться к меняющимся предпочтениям потребителей и модернизировать процесс анализа производственных данных с использованием передовых технологий.

Приложения для обработки данных в настоящее время оказывают сильное влияние на способность промышленного сектора увеличивать доходы и производственную систему. После пандемии COVID-19 в 2020 году большинство обрабатывающих отраслей, таких как пищевая промышленность или индустрия моды, приступили к анализу производственных данных для массового производства.

Данные производственного процесса собираются для расчета производительности. Затем компании оценивают количество товаров, производимых каждый день, используя подходы, основанные на данных, такие как визуализация. Они также отслеживают количество поврежденных товаров, а также их причины. Они могут прогнозировать доход на год, основываясь на состоянии существующих производственных систем, с помощью собранных ими данных [3, с. 11].

После этого предприятия постоянно совершенствуют свои методы производства, чтобы повысить производительность и доход.

Кроме того, они должны оценить равновесие между спросом и предложением на рынке продукта, прежде чем производить его. Методы анализа данных могут использоваться предприятиями для мониторинга своего расширения. Таким образом, приложения в области data science в производственном секторе способствуют их расширению.

То, как data science применяется на производстве, в определенном смысле уникально, учитывая специфические требования отрасли. В первую очередь он используется для предоставления производителям ценной информации, направленной на максимизацию прибыли, минимизацию рисков и оценку производительности. Одной из основных областей применения data science и machine learning в производстве служит прогнозная аналитика или данные о производительности и качестве в режиме реального времени. Сбор данных от операторов и машин используется для создания набора ключевых показателей эффективности, таких как общая эффективность оборудования. Это позволяет анализировать первопричины брака и простоев на основе данных. Таким образом, data science и machine learning используются для обеспечения упреждающего и гибкого подхода к техническому обслуживанию и оптимизации оборудования.

Способность оперативно реагировать на неполадки напрямую влияет на производительность и сокращает время простоя. К примеру, в автомобильной промышленности создание прогнозирующей модели, которая отслеживает производительность станка и время простоя, затем может быть использовано для прогнозирования характера увеличения производительности, влияния любых внешних изменений, сокращения брака и качества. Это, в свою очередь, поможет производителям найти новые методы и способы подхода к повышению качества и управлению затратами.

Производство в современной промышленности имеет очень мало критически важных элементов или машин, от которых можно зависеть. Данные, используемые для мониторинга в режиме реального времени, могут быть дополнительно проанализированы для предотвращения сбоев оборудования и улучшения управления активами. Специалисты по обработке данных используют знания машины и принимают к сведению причины, по которым она может выйти из строя, чтобы делать эти прогнозы.

Технологические данные, указывающие на изменение вибрации и температуры, используются в производстве больших данных для заблаговременного прогнозирования выхода оборудования из строя. Отслеживая отклонения от настроек для обеспечения оптимальной производительности оборудования, инженеры могут получить сигнал о принятии превентивных мер, когда это необходимо, что дает производителям возможность избежать критических отказов.

При определении стоимости продукта необходимо учитывать многочисленные критерии и факторы. Важен каждый этап, связанный с процессом производства и продажи товара. Окончательная цена продукта является конечным результатом учета стоимости каждого элемента, начиная с сырья и заканчивая расходами на дистрибуцию. Современные решения по оптимизации цен основаны на максимизации прибыли и эффективности продукта.

Data science использует инструменты для агрегирования и анализа данных, включая как ценообразование, так и затраты из внутренних источников и конкурентов на рынке, для извлечения оптимальных ценовых вариантов. Рыночная конкуренция в сочетании с изменениями и флуктуациями потребностей и предпочтений потребителей по всему миру делает data science ценным инструментом в производстве [4].

Таким образом, на успех проектов data science и machine learning в промышленности влияют слаженность персонала, понимание данных и технологических процессов и пр.

Последовательное следование бизнес-целям проекта data science и machine learning позволяет исследовать данные, строить гипотезы и выполнять их проверку путем выбора оптимальных прототипов моделей. Подобный подход дает возможность сэкономить ресурсы и на ранних этапах исключить не приносящие экономической выгоды проекты.

Список литературы

  1. Позднякова А.О. Big Data, Data Science и Machine Learning, как новейшие тренды современности / А.О. Позднякова // Аллея науки. – 2022. – Т. 1, № 5(68). – С. 10-16. – EDN AWCBAC.
  2. Lee R. Big Data, Cloud Computing, and Data Science Engineering. – Cham: Springer. – 2020. – 214 p.
  3. Веретенников А.В.Big Data: анализ больших данных сегодня. – 2017. – № 32 (166). – С. 9-12.
  4. Машинное обучение. [Электронный ресурс]. URL: https://blog.skillfactory.ru/glossary/mashinnoe-obuchenie/(дата обращения: 30.03.2023).

Интересная статья? Поделись ей с другими: