УДК 681.3
Прогнозирование в MS Excel на основе разных математических моделей
Антипова Татьяна Николаевна – доцент кафедры Высшей математики МИРЭА – Российского технологического университета.
Аннотация: Рассматриваются вопросы статистического прогнозирования исследуемого показателя, на основе разных математических моделей, в табличном процессоре Excel. Для оценки основной компоненты используются линейная и адаптивная модели. В MS Excel для каждой модели проектируются электронные таблицы, которые используются для расчета параметров модели, анализа ее качества и нахождения точечных и интервальных оценок прогнозируемого показателя. На основании информации, полученной для каждой из математических моделей, строятся сводные таблицы, c помощью которых выбирается наиболее подходящая в данных условиях модель. Изложенный материал поясняется на конкретном примере. Предложенная работа позволяет студентам лучше освоить практическое применение методов математической статистики и математического моделирования, а также способствует успешному освоению табличного процессора MS Excel, который широко используется современными аналитиками.
Ключевые слова: статистическое прогнозирование, линейная и адаптивная модели, электронные таблицы в Excel, точечные и интервальные оценки показателя.
Введение
В современном обществе большое внимание уделяется задачам прогнозирования. Решение таких задач можно выполнять методами статистического прогнозирования [1-5]. Процесс прогнозирования, опирающийся на такие методы, распадается на два основных этапа. Это обобщение данных, наблюдаемых за достаточно продолжительный период, и представление статистических закономерностей в виде модели, которая, как правило, выражается аналитической функцией. На практическую значимость и точность статистического прогноза сильно влияет выбор модели, используемой для оценки основной компоненты уровня. Нужная модель выбирается после оценки ее качества с статистической точки зрения, т.е. после исследования модели на адекватность и точность.
В статистическом прогнозировании информация о динамике показателей задается временными рядами (ВР) наблюдений, состоящими из N уровней Yф(t), t = 1,…,N. Формально задача прогнозирования сводится к получению оценок Yр(t) уровней ВР на некотором будущем временном интервале, т.е. в моменты времени t = N+1,…,N+k. Такой процесс связан с многочисленными расчетами и пересчетами, которые можно реализовать с помощью пакета MatLab, а также специальных статистических пакетов, таких как Statistica, Statgraphics и других [6]. Однако это можно сделать без финансовых и временных затрат на приобретение и освоение специального программного обеспечения с помощью программы MS Excel (ТП Excel), которая широко используется для работы с электронными таблицами.
В данной работе рассматривается статистическое прогнозирование исследуемого показателя в MS Excel, с использованием, при необходимости, автоматизации расчетов и текстовых выводов. Для прогнозирования используются линейная и адаптивная модели. После нахождения уравнения модели осуществляется оценка ее качества и построение точечных и интервальных прогнозов. Это делается путем проектирования для каждой модели основных электронных таблиц (ЭТ) и ЭТ дополнительных имен. Основные таблицы нужны для вычисления параметров модели и нахождения ее уравнения; для анализа качества модели; для точечного и интервального прогнозирования с помощью построенной модели. В этих таблицах широко используется автоматизация расчетов по формулам и автоматизация получения текстовых выводов об уравнении модели и ее качестве. Автоматизация расчетов и текстовых выводов, а также связь между основными таблицами модели осуществляется с помощью ее таблицы дополнительных имен. Работа логических формул, используемых для анализа качества моделей и получения соответствующих выводов, реализуется с помощью таблицы дополнительных имен общей для всех моделей.
Основные ЭТ и таблицу дополнительных имен каждой модели можно представить в виде отдельной электронной книги, предназначенной для прогнозирования только по этой модели. Для выполнения сравнительного анализа результатов прогнозирования, на основе разных моделей, основные и дополнительные таблицы всех моделей должны находиться в одной электронной книге. В этой общей электронной книге проектируются еще две основные сводные ЭТ. Одна из них предназначена для сравнительного анализа качества построенных моделей. Другая таблица используется для сравнения точечных и интервальных прогнозов, полученных на основе разных моделей. Сводные таблицы автоматически заполняются данными из основных таблиц и анализируются. Затем делается вывод о том, какую из моделей лучше использовать для прогнозирования исследуемого показателя.
Далее описанный процесс поясняется на примере электронной книги, которая предназначена для прогнозирования на пять шагов вперед (k=5) показателей, заданных ВР, состоящими из девяти уровней, (N=9), и поясняется на примере ВР, в котором отражена динамика сбыта продукции предприятия за девять месяцев (таблица 1).
Таблица 1. Динамика сбыта продукции.
Месяц |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Сбыт продукции (тыс. ед.) |
72 |
74 |
76 |
75 |
79 |
80 |
82 |
85 |
89 |
Прогнозирование на основе линейной модели
Прогнозирование на основе линейной модели (ЛМ) предполагает, что оценка прогнозируемого показателя Yр(t) осуществляется по формуле (1):
Yр(t) = a + b·t (1)
В формуле (1) a и b – параметры модели. Они оцениваются по методу наименьших квадратов (МНК) [7-9], согласно которому a = Yфср – b·tср. Такая оценка параметров выполняется с помощью таблицы “Оценка параметров ЛМ” (таблица 2). После указания в столбце Yф(t) информации о прогнозируемом показателе вычисляются параметры модели b = 118/60 = 1,9667 и a = 79,1111 – 1,9667·5 = 69,2778. Затем находится уравнение ЛМ (2).
Таблица 2. Оценка параметров ЛМ.
Номер п/п |
t |
t-tср |
(t-tср)2 |
Yф(t) |
Yф(t)- Yфср(t) |
(t-tср)·(Yф-Yфср) |
Yр(t) |
Е(t) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1 |
1 |
-4 |
16 |
72 |
-7,1111 |
28,4444 |
71,2444 |
0,7556 |
2 |
2 |
-3 |
9 |
74 |
-5,1111 |
15,3333 |
73,2111 |
0,7889 |
3 |
3 |
-2 |
4 |
76 |
-3,1111 |
6,2222 |
75,1778 |
0,8222 |
4 |
4 |
-1 |
1 |
75 |
-4,1111 |
4,1111 |
77,1444 |
-2,1444 |
5 |
5 |
0 |
0 |
79 |
-0,1111 |
0,0000 |
79,1111 |
-0,1111 |
6 |
6 |
1 |
1 |
80 |
0,8889 |
0,8889 |
81,0778 |
-1,0778 |
7 |
7 |
2 |
4 |
82 |
2,8889 |
5,7778 |
83,0444 |
-1,0444 |
8 |
8 |
3 |
9 |
85 |
5,8889 |
17,6667 |
85,0111 |
-0,0111 |
9 |
9 |
4 |
16 |
89 |
9,8889 |
39,5556 |
86,9778 |
2,0222 |
Сумма |
45 |
0 |
60 |
712 |
0,0000 |
118,0000 |
375,889 |
0,0000 |
Среднее значение |
5 |
79,1111 |
||||||
a |
69,2778 |
b |
1,9667 |
Yр(t) = 69,2778 + 1,9667·t (2)
Качество модели определяется ее адекватностью и достаточной точностью. Модель считается адекватной, если ее ряд остатков E(t) обладает свойствами случайности и независимости последовательных уровней, а также, с надежностью близкой к единице, подтверждается гипотеза о нормальности распределения последовательных уровней этого ряда.
Оценка качества модели выполняется с помощью ЭТ “Проверка случайности и независимости” и “Проверка нормальности и точности” [3]. При проектировании этих таблиц для проверки случайности уровней ряда остатков используется критерий поворотных точек. Проверка независимости (отсутствия автокорреляции) осуществляется путем проверки отсутствия в ряде остатков систематической составляющей. Это делается с помощью d-критерия Дарбина-Уотсона. Соответствие ряда остатков нормальному закону распределения определяется при помощи R/S-критерия. Ряд остатков ЛМ (2) указан в столбце E(t) таблицы 2. Применение к нему перечисленных критериев, с надежностью p близкой к единице, указывает на адекватность модели.
Точность модели определяется средним квадратичным отклонением s (точнее его наилучшей статистической оценкой) и средней относительной ошибкой Eотн. Для ЛМ (2) Eотн = 1,5573% (менее 5%), что свидетельствует об удовлетворительной точности этой модели.
Таблица 3. Точечное и интервальное прогнозирование по ЛМ.
t |
Шаг k |
Прогноз Yр(N+k) |
U(k) |
Нижняя граница Yр(N+k)-U(k) |
Верхняя граница Yр(N+k)+U(k) |
1 |
2 |
3 |
4 |
5 |
6 |
10 |
1 |
88,9444 |
1,6431 |
87,3014 |
90,5875 |
11 |
2 |
90,9111 |
1,7389 |
89,1722 |
92,6500 |
12 |
3 |
92,8778 |
1,8457 |
91,0321 |
94,7234 |
13 |
4 |
94,8444 |
1,9617 |
92,8827 |
96,8061 |
14 |
5 |
96,8111 |
2,0854 |
94,7257 |
98,8965 |
В таблице 3 указаны данные о точечном и интервальном прогнозировании (p = 0,7) на пять шагов вперед на основе ЛМ (3). Так как эта модель обладает свойствами адекватности и точности, то утверждение о том, что, при сохранении сложившихся закономерностей развития, результат прогноза попадет в интервал, образованный нижней и верхней границами, правомерно.
Прогнозирование на основе адаптивной модели
В прогнозировании, для лучшего учета особенностей изменения исследуемого показателя в конце интервала наблюдения, используются адаптивные модели. В таких моделях наибольшее значение при оценке параметров придается последним наблюдениям. Рассмотрим одну из таких моделей – модель Брауна (3), в которой k – число шагов прогнозирования,a(t – 1), b(t – 1) – параметры модели.
Yр(t) = a(t – 1) + b(t – 1)·k (3)
Корректировка a(t) и b(t), t = 1,2,…,N, осуществляется по формулам (4).
a(t) = a(t – 1) + b(t – 1) + E(t)·(1-B2), b(t) = b(t – 1) + E(t)·(1-B2). (4)
В этих формулах В – коэффициент дисконтирования данных, отражающий большую степень доверия к более поздним показаниям, E(t) – отклонение расчетного показателя от фактического, a(0), b(0) – начальные значения параметров модели.
Начальные значения параметров a(0) и b(0) являются базой для последующих уточнений. Они оцениваются по первым пяти известным уровням Yф(t), t = 1,2,…,5, при помощи МНК. Такая оценка выполняется в таблице 4. В результате получается b(0) = 15/10 = 1,5 и a(0) = 75,2 – 1,5·3 = 70,7. Затем эти оценки уточняются.
Таблица 4. Нахождение начальных значений параметров.
Номер п/п |
t |
t-tср |
(t-tср)2 |
Yф(t) |
Yф(t)-Yфср(t) |
(t-tср)·(Y(t)-Yфср(t)) |
Yр(t) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
1 |
-2 |
4 |
72 |
-3,2000 |
6,4000 |
72,2000 |
2 |
2 |
-1 |
1 |
74 |
-1,2000 |
1,2000 |
73,7000 |
3 |
3 |
0 |
0 |
76 |
0,8000 |
0,0000 |
75,2000 |
4 |
4 |
1 |
1 |
75 |
-0,2000 |
-0,2000 |
76,7000 |
5 |
5 |
2 |
4 |
79 |
3,8000 |
7,6000 |
78,2000 |
Сумма |
15 |
0 |
10 |
376 |
0,0000 |
15,0000 |
376 |
Среднее значение |
3 |
75,2000 |
|||||
a(0) |
70,7000 |
b(0) |
1,5000 |
Предположим, что k = 1. Тогда значения прогнозируемого показателя вычисляются по формуле (5).
Yр(t) = a(t – 1) + b(t – 1) (5)
Пусть в формулах (4) B = 0,6, тогда с учетом формулы (5), получаются формулы (6), которые используются для корректировки значений параметров.
a(t) = Yр(t) + E(t)·0,64, b(t) = b(t–1) + E(t)·0,16 (6)
Для уточнения текущих значений величин Yр(t), a(t), b(t), t = 1,2,…,9, по формулам (5) и (6), используется таблица 5.
После уточнения значений параметров на последнем шаге, c учетом того, что a(9) = 88,0443, b(9) = 2,3171, находится соответствующее уравнение модели Брауна (7), в котором N = 9.
Таблица 5 . Уточнение параметров АМ.
Номер п/п |
t |
Yф(t) |
t-1 |
a(t-1) |
a(t) |
b(t-1) |
b(t) |
Yp(t) |
E(t) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
1 |
72 |
0 |
70,7000 |
72,0720 |
1,5000 |
1,4680 |
72,2000 |
-0,2000 |
2 |
2 |
74 |
1 |
72,0720 |
73,8344 |
1,4680 |
1,5416 |
73,5400 |
0,4600 |
3 |
3 |
76 |
2 |
73,8344 |
75,7754 |
1,5416 |
1,6414 |
75,3760 |
0,6240 |
4 |
4 |
75 |
3 |
75,7754 |
75,8700 |
1,6414 |
1,2548 |
77,4168 |
-2,4168 |
5 |
5 |
79 |
4 |
75,8700 |
78,3249 |
1,2548 |
1,5548 |
77,1248 |
1,8752 |
6 |
6 |
80 |
5 |
78,3249 |
79,9567 |
1,5548 |
1,5740 |
79,8797 |
0,1203 |
7 |
7 |
82 |
6 |
79,9567 |
81,8311 |
1,5740 |
1,6491 |
81,5307 |
0,4693 |
8 |
8 |
85 |
7 |
81,8311 |
84,4529 |
1,6491 |
1,8923 |
83,4802 |
1,5198 |
9 |
9 |
89 |
8 |
84,4529 |
88,0443 |
1,8923 |
2,3171 |
86,3451 |
2,6549 |
Yр(N + k) = 88,0443 + 2,3171·k (7)
Проверка качества модели осуществляется по критериям, указанным для ЛМ (2), на основании ряда остатков E(t) таблицы 5. Его исследование с надежностью близкой к единице указывает на адекватность полученной АМ Брауна. Эта модель имеет удовлетворительную точность, т.к. имеет следующие характеристики точности: S = 1,5649, Eотн = 1,4234%.
Данные о прогнозирование на основе АМ (7) приводятся в таблице 6.
Таблица 6. Точечное и интервальное прогнозирование по АМ.
t |
Шаг k |
Прогноз Yр(N+k) |
U(k) |
Нижняя граница Yр(N+k)-U(k) |
Верхняя граница Yр(N+k)+U(k) |
1 |
2 |
3 |
4 |
5 |
6 |
10 |
1 |
90,3613 |
2,0310 |
88,3303 |
92,3923 |
11 |
2 |
92,6784 |
2,1494 |
90,5290 |
94,8278 |
12 |
3 |
94,9954 |
2,2814 |
92,7140 |
97,2768 |
13 |
4 |
97,3125 |
2,4248 |
94,8877 |
99,7373 |
14 |
5 |
99,6296 |
2,5777 |
97,0518 |
102,2073 |
Сравнительный анализ моделей
Результаты исследования качества ЛМ(2) и АМ(7) приводятся в таблице 7.
Таблица 7. Таблица качества моделей.
Модель |
Незави-симость |
Случай-ность |
Норма-льность |
Адекватность |
S |
Eотн, % |
Точность |
Линейная |
да |
да |
да |
выполняется |
1,266 |
1,2337 |
удовлетворительная |
Y(t)=69,2778+1,9667∙t |
|||||||
Адаптивная |
да |
да |
да |
выполняется |
1,5649 |
1,4234 |
удовлетворительная |
Y(t)=88,0443+2,3171∙k |
Результаты точечного и интервального прогнозирования (p = 0,7) приводятся в таблице 8.
Таблица 8. Таблица результатов прогнозирования.
t |
Шаг k |
Линейная модель |
Адаптивная модель |
||
Yр(N+k) |
U(k) |
Yр(N+k) |
U(k) |
||
1 |
2 |
3 |
4 |
5 |
6 |
10 |
1 |
88,9444 |
1,6431 |
90,3613 |
2,0310 |
11 |
2 |
90,9111 |
1,7389 |
92,6784 |
2,1494 |
12 |
3 |
92,8778 |
1,8457 |
94,9954 |
2,2814 |
13 |
4 |
94,8444 |
1,9617 |
97,3125 |
2,4248 |
14 |
5 |
96,8111 |
2,0854 |
99,6296 |
2,5777 |
В выводах, полученных на основании таблиц 7 и 8, указывается на то, что обе модели имеют практическую значимость, так как удовлетворяют свойствам точности и адекватности. Точечные прогнозные оценки моделей имеют явную близость. Характеристики точности лучше у линейной модели, поэтому для прогнозирования исследуемого показателя лучше использовать линейную модель. Дальнейший прогноз, на основании новых данных таблицы 1, может привести к другому результату.
Рассмотренная работа позволяет студентам лучше освоить практическое применение методов математической статистики и использование разных математических моделей. Также она способствует глубокому освоению табличного процессора Excel, который широко используется аналитиками.
Список литературы
- Четыркин Е.М. Статистические методы прогнозирования. –М.: Статистика , 1977. – 200с.
- Орлова И.В., Половников В.А., Федосеев В.В. Лекции по экономико-математическим моделированию. –М.: ВЗФЭИ, 2005.
- Антипова Т.Н. Автоматизация экономического прогнозирования в ТП Excel: Учебное пособие. - М.: Изд.-во МГУПИ, 2008. –86 с.
- Дуброва Т.А. Статистические методы прогнозирования в экономике: Учебное пособие / Дуброва Т.А., Архипова М.Ю. Московский государственный университет экономики, статистики и информатики. –М.,2004. –136с.
- Федосеев В.В. Экономико-математические модели и прогнозирование рынка труда: Вузовский учебник. – Инфра-М, 2013.– 144с.
- Боровиков В.П., Ивченко Г.И. Прогнозирование в системе STATISTICA в среде Windows . Основы теории и интенсивная практика на компьютере: Учебное пособие. –М.: Финансы и статистика, 2006. – 368с.
- Г.Корн, Т.Корн. Справочник по математике. Для научных сотрудников и инженеров. – М.: Наука, 1977. –.832с.
- Карасев А.И. Теория вероятностей и математическая статистика: Учебник для экономических специальностей вузов. – М.: Статистика, 1994.- 279с.
- Гмурман В.Е.Теория вероятностей и математическая статистика: Учебное пособие. – М.: Издательство Юрайт, 2010. – 479с.