УДК 004

Особенности прогнозирования стоимости товаров Веблена с помощью машинного обучения

Галимьянов Артём Фларидович – студент кафедры Прикладной информатики Московского политехнического университета.

Аннотация: В данной научной статье рассматриваются особенности прогнозирования стоимости товаров Веблена с помощью машинного обучения. Товары Веблена представляют собой уникальную категорию товаров, спрос на которые увеличивается с ростом их цены. Исследование фокусируется на применении методов машинного обучения для предсказания цен на такие товары. В частности, обсуждаются различные модели машинного обучения, включая линейную регрессию, случайный лес, XGBoost, а также модели временных рядов, такие как ARIMA и LSTM. Также рассматриваются вопросы каннибализации среди товаров и прогнозирования спроса на новые товары. Результаты исследования показывают, что применение методов машинного обучения позволяет достичь высокой точности в прогнозировании цен на товары Веблена.

Ключевые слова: товары Веблена, машинное обучение, прогнозирование цен.

Товары Веблена представляют собой уникальную категорию товаров, спрос на которые увеличивается с ростом их цены. Это явление, известное как "эффект Веблена", наблюдается в отношении ряда товаров, «включая некоторые бренды, которые используются больше, как символ статуса, чем для удовлетворения основных потребностей» [1, с. 14]. «Потребители роскоши используют цену как сигнал для пяти основных мотивов покупки, а именно: перфекционизма в качестве, гедонизма, демонстрации статуса, снобизма на фоне уникальности и эффекта присоединения к большинству» [1, с. 6]. В связи с этим прогнозирование цен на такие товары представляет собой сложную задачу, которую можно решить с помощью методов машинного обучения.

Одним из подходов к прогнозированию цен на товары Веблена является использование модели предсказания цен, которая обучается на основе таких «параметров продукта, как рейтинг товара, ранг, описание товара, категория, бренд и т.д.» [3, с. 661]. Важными метриками качества в данном случае являются смещение и дисперсия, а также среднеквадратическая ошибка (RMSE) и средняя квадратическая ошибка (MSE).

Важным этапом в процессе прогнозирования цен является обработка данных. В рамках этого этапа проводится инженерия признаков, включающая в себя создание наблюдаемых и созданных признаков. «Наблюдаемые признаки включают в себя бренд, название, описание, ранг, категорию и т.д. Созданные признаки формируются на основе обработки соответствующих столбцов исходного набора данных» [3, с. 662].

В результате применения методов машинного обучения для прогнозирования цен на товары Веблена было установлено, что наиболее эффективно себя проявляют модель, обученная на основе «нескольких моделей, включая линейную регрессию, случайный лес, XGBoost, а также модели временных рядов, такие как ARIMA и LSTM» [1, с. 1]. Модели обучаются на основе исторических данных, таких как данные о продажах и посещении страниц товаров на маркетплейсах, а также информации о ранжировании поиска и векторных представлениях товаров. Векторные представления, или эмбеддинги, основываются на неявных взаимодействиях пользователя с товаром. «Для выявления скрытых атрибутов товаров применяется модель на основе скип-грамм, которая обрабатывает матрицу взаимодействия и переводит ее в скрытое пространство модели Word2Vec». [1, с. 3]. Следует отметить целесообразность использования такого пакета как Orbit, который использует «байесовские модели экспоненциального сглаживания для прогнозирования временных рядов» [4, с. 1]. Он достаточно новый и демонстрирует прекрасные результаты в сравнении с упомянутой ARIMA, но исходя из новизны данных о применении ещё не так много.

Важным аспектом прогнозирования является учет каннибализации среди товаров. Если снизить скидку на один товар, это может привести к увеличению продаж других товаров, конкурирующих с ним. Эту проблему преодолевают, запуская модель «на уровне категории и создавая признаки на уровне бренда, что позволяет учесть каннибализацию» [1, с. 1].

Одним из ключевых вызовов в прогнозировании цен на товары Веблена является прогнозирование спроса на новые товары или на уникальные товары, для которых нет исторических данных. Для решения этой проблемы используют «модели глубокого обучения для изучения векторных представлений товаров. Эти векторные представления используют в качестве признаков в модели прогнозирования спроса» [1, с. 1].

Список литературы

  1. Dahm J.-M. The Veblen effect revisted: dis. PhD. polit. - Dusseldorf, 2018. - P. 6-14.
  2. Kedia, S., S. Jain and A. Sharma, 2020. Price Optimization in Fashion E-commerce. AI4FashionSC KDD, Virtual Event, CA, USA (дата обращения: 24.05.2023) URL: arxiv.org/pdf/2007.05216.pdf.
  3. Kenny J., Mandal S., Mehta R., Malpekar H. Price Prediction using Machine Learning Methods // International Journal for Research in Applied Science and Engineering Technology (IJRASET). - 2021. – Vol. 6. № 5. - P. 661-668.
  4. Ng, E., Z. Wang, H. Chen, S. Yang and S. Smyl, 2021. Orbit: Probabilistic Forecast with Exponential Smoothing. arXiv preprint, arXiv:2004.08492(1-3). (дата обращения: 24.05.2023) URL: org/pdf/2004.08492.pdf.

Интересная статья? Поделись ей с другими: