УДК 519.6

Применение кусочно-линейно модели регрессионного анализа для оценки стоимости недвижимости

Буланов Алексей Валерьевич – магистрант Пензенского государственного университета

Аннотация: В данной статье рассматривается применение кусочно-линейной модели регрессионного анализа в контексте оценки стоимости недвижимости. Предлагается использовать данные о рынке недвижимости, такие как расположение, размер, возраст и другие характеристики объектов недвижимости, а также данные о продажах и аренде недвижимости, для построения модели, которая предсказывает стоимость недвижимости на основе этих характеристик. Ключевыми особенностями кусочно-линейной модели регрессии являются возможность учета нелинейных зависимостей между переменными и способность адаптироваться к различным сегментам рынка недвижимости. Путем разбиения данных на сегменты и построения линейной регрессионной модели для каждого сегмента можно получить более точные оценки стоимости недвижимости. В результате исследования предполагается, что кусочно-линейная модель регрессионного анализа позволит улучшить точность оценки стоимости недвижимости и повысить надежность предсказаний на рынке недвижимости.

Ключевые слова: кусочно-линейная регрессия, рынок недвижимости, анализ данных, формирование стоимости.

Введение

В настоящее время рынок недвижимости является одним из наиболее динамичных и значимых секторов экономики. Для успешного функционирования на этом рынке необходимо иметь точные и надежные оценки стоимости недвижимости.

Оценка стоимости недвижимости является сложным и многогранным процессом, требующим учета множества факторов. Однако с ростом доступности данных и развитием статистических методов, регрессионный анализ стал важным инструментом для анализа и прогнозирования стоимости недвижимости. Регрессионный анализ позволяет исследовать связь между зависимой переменной, такой как цена недвижимости, и набором независимых переменных, которые влияют на эту цену.

Кусочно-линейная модель регрессионного анализа представляет собой инновационный метод, который может быть использован для оценки стоимости недвижимости.

Рассмотрим применение кусочно-линейной модели регрессионного анализа для оценки факторов, влияющих на конечную стоимость недвижимости. Конечная стоимость недвижимости зависит от множества переменных, таких как географическое расположение, размер объекта, близость к инфраструктуре, характеристики самого объекта и многих других факторов. Понимание влияния этих факторов на стоимость недвижимости является ключевым для агентов недвижимости, инвесторов и потенциальных покупателей.

Регрессионный анализ позволяет исследовать не только наличие связи между переменными, но и оценивать силу и направление этой связи. Он позволяет выявить наиболее значимые факторы, которые оказывают влияние на стоимость недвижимости, и использовать их в качестве основы для прогнозирования будущих цен или принятия решений в сфере недвижимости.

Последовательно исследуем основные шаги регрессионного анализа, выбор модели, подготовку данных, оценку результатов и интерпретацию коэффициентов.

Основные задачи

В нашем случае рассматриваем временной ряд со значениями количества комнат в частных домах и их медианной стоимостью в тысячах долларах. Необходимо:

  1. Построить регрессионную кусочно-линейную модель, для описания исследуемого временного ряда.
  2. Оценить точность построенных моделей для тестовой и целевой выборки.
  3. Описать полученные результаты.

Применяемая методология

Для проведения линейного регрессионного анализа на каждом участке используется формула

image001                                                            (1)

где (1) уравнение регрессии для получения зависимой переменной путем подстановки независимой переменной; Y-значения зависимой переменной, являющейся результатом вычислений, описывающая предсказывающий процесс или измерение; X-зависимая переменная, описывающая фактор влияющий на зависимую; image002-коэффициент регрессии вычисляемый для каждой пары X и Y, и описывает их отношение; image003- случайная величина ошибки прогнозирования.

Для общей формы кусочно-линейной функции используется система линейных уравнений (2), где k-общее количество участков, с-точки разделения между участками.

image004                              (2)

 

Проведем анализ и построение кусочно-линейной модели для оценки влияния на конечную стоимость недвижимости.

Оценка стоимости недвижимости является важной задачей, которая требует учета множества факторов, влияющих на ее цену. Традиционные линейные модели регрессионного анализа могут быть ограничены в учете нелинейных взаимосвязей между факторами и стоимостью недвижимости. В таких случаях, кусочно-линейная модель регрессионного анализа может представлять собой эффективный инструмент для оценки стоимости недвижимости. Для моделирования кусочно-линейной модели был использован набор данных по ценам на жилье в Бостоне, содержащий 503 записи по районам в пригороде Бостона. В качестве зависимой переменной была выбрана медианная стоимость частных домов в тысячах долларов, в качестве независимой было выбрано среднее количество комнат в жилом помещении на 1 район. Для оценки параметров регрессии был использован метод наименьших квадратов. Метод наименьших квадратов (МНК) используется для оценки параметров регрессий, линейных по параметрам. Он позволяет получить оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака Y от теоретических минимальна. Формула расчета коэффициентов при использовании МНК:

image005                                                                   (3)

Для расчета корреляции между данными используем формулу Пирсона (4), где r- коэффициент корреляции Пирсона.

image006(4)

Коэффициент корреляции между значения X и Y составляет около 0.7, что между значениями существует зависимость и возможно построить регрессионную модель. Для оценки качества модели разделим данные на тестовую и целевую выборку, объем тестовой выборки составит 20%.

 image007

Рисунок 1. Исходные данные разделенные на тестовую и целевую выборку.

Для проведения кусочно-линейного регрессионного анализа необходимо определить оптимальное число кусочно-линейных функций, при котором модель выдаст наиболее точный результат. Для этого был использован метод кросс-валидации, он представляет разделение данные на n равных частей, обучение модели на каждом отрезке и оценке ее на оставшихся отрезках. Это повторяется n раз для каждого отрезка, чтобы каждый отрезок был использован в качестве тестового набора данных. В конце каждой итерации рассчитывается оценка выбранной метрики. В качестве метрики было использовано значение среднеквадратичной ошибки (5), где MSE среднеквадратичная ошибка, n  количество наблюдений, image008фактическое значение зависимой переменной для i-го наблюдения, image009 прогнозируемое значение зависимой переменной для i-го наблюдения.

 image010                                           (5)

В результате вычислений минимальное значение равное 21.92 было получено при использовании 4 кусочно-линейных функций.

Создадим модель регрессии с использованием сплайнов для одного признака.

Для реализации кусочно-линейной регрессии выборки были разделены на 4 кусочно-линейных функции к каждой из которой был применен метод наименьших квадратов. Разделение производилось на равные отрезки. Для объединения кусочно-линейных функций произведено вычисление разности между выбранной функцией и узловой точкой. Если разность меньше нуля, она заменяется нулем. Это обеспечивает, что значения сплайнов будут равны нулю до узловой точки и положительными после нее.

В результате расчетов значения среднеквадратичной ошибки составили 35.9 для целевой выборки и 67.3 для тестовой выборки. Что говорит о удовлетворительной точности полученной модели, но все еще недостаточной для ее использования (рисунок 2).

image011

Рисунок 2. График аппроксимации кусочно-линейной функцией.

Заключение

Применение кусочно-линейной модели регрессионного анализа представляет собой эффективный подход к оценке стоимости недвижимости. Эта модель позволяет учесть нелинейные связи между факторами и стоимостью недвижимости, что может привести к более точным результатам и более глубокому пониманию влияния различных факторов на стоимость. Практический пример, рассмотренный в статье, показывает преимущества и потенциал кусочно-линейной модели в сравнении с традиционными линейными моделями.

Список литературы

  1. Дрейпер Н.С. Прикладной регрессионный анализ / Н.С. Дрейпер. – Москва: Офсет, 2017. – 912 с.
  2. Мефтахетдинова, Д.Р. Анализ дерева решений и логистический регрессионный анализ как аналитические методы системы поддержки принятия решений / Д.Р. Мефтахетдинова, З.Т. Магеррамов // Sciences of Europe. – 2023. – № 112. – С. 69-72.
  3. Нигей Н.В. Корреляционный и регрессионный анализ: методическое пособие/ Н.В. Нигей. – Благовещенск: АГМА, 2012. – 11 с.
  4. Прокофьев К.Ю. Рынок недвижимости: понятие, анализ. / К. Ю. Прокофьев // Экономический анализ: теория и практика. – Псков, 2014. – С. 43-55.
  5. Коростелкина И.А. Рынок недвижимости в период пандемии: современные тренды и прогнозы / И.А. Коростелкина, Н.В. Воронкова // Тренды и управление. – Орлов: Орловский государственный университет имени И.С. Тургенева, 2021. – С. 51-62.
  6. The Boston House Prices – Advanced dataset –https://www.kaggle.com/datasets/fedesoriano/the-boston-houseprice-data.

Интересная статья? Поделись ей с другими: