УДК 681.3

Прогнозирование в MS Excel на основе разных математических моделей

Антипова Татьяна Николаевна – доцент кафедры Высшей математики МИРЭА – Российского технологического университета.

Аннотация: Рассматриваются вопросы статистического прогнозирования исследуемого показателя, на основе разных математических моделей, в табличном процессоре Excel. Для оценки основной компоненты используются линейная и адаптивная модели. В MS Excel для каждой модели проектируются электронные таблицы, которые используются для расчета параметров модели, анализа ее качества и нахождения точечных и интервальных оценок прогнозируемого показателя. На основании информации, полученной для каждой из математических моделей, строятся сводные таблицы, c помощью которых выбирается наиболее подходящая в данных условиях модель. Изложенный материал поясняется на конкретном примере. Предложенная работа позволяет студентам лучше освоить практическое применение методов математической статистики и математического моделирования, а также способствует успешному освоению табличного процессора MS Excel, который широко используется современными аналитиками. 

Ключевые слова: статистическое прогнозирование, линейная и адаптивная модели, электронные таблицы в Excel, точечные и интервальные оценки показателя.

Введение

В современном обществе большое внимание уделяется задачам прогнозирования. Решение таких задач можно выполнять методами статистического прогнозирования [1-5]. Процесс прогнозирования, опирающийся на такие методы, распадается на два основных этапа. Это обобщение данных, наблюдаемых за достаточно продолжительный период, и представление статистических закономерностей в виде модели, которая, как правило, выражается аналитической функцией. На практическую значимость и точность статистического прогноза сильно влияет выбор модели, используемой для оценки основной компоненты уровня. Нужная модель выбирается после оценки ее качества с статистической точки зрения, т.е. после исследования модели на адекватность и точность.

В статистическом прогнозировании информация о динамике показателей задается временными рядами (ВР) наблюдений, состоящими из N уровней Yф(t), t = 1,…,N. Формально задача прогнозирования сводится к получению оценок Yр(t) уровней ВР на некотором будущем временном интервале, т.е. в моменты времени t = N+1,…,N+k. Такой процесс связан с многочисленными расчетами и пересчетами, которые можно реализовать с помощью пакета MatLab, а также специальных статистических пакетов, таких как Statistica, Statgraphics и других [6]. Однако это можно сделать без финансовых и временных затрат на приобретение и освоение специального программного обеспечения с помощью программы MS Excel (ТП Excel), которая широко используется для работы с электронными таблицами.

В данной работе рассматривается статистическое прогнозирование исследуемого показателя в MS Excel, с использованием, при необходимости, автоматизации расчетов и текстовых выводов. Для прогнозирования используются линейная и адаптивная модели. После нахождения уравнения модели осуществляется оценка ее качества и построение точечных и интервальных прогнозов. Это делается путем проектирования для каждой модели основных электронных таблиц (ЭТ) и ЭТ дополнительных имен. Основные таблицы нужны для вычисления параметров модели и нахождения ее уравнения; для анализа качества модели; для точечного и интервального прогнозирования с помощью построенной модели. В этих таблицах широко используется автоматизация расчетов по формулам и автоматизация получения текстовых выводов об уравнении модели и ее качестве. Автоматизация расчетов и текстовых выводов, а также связь между основными таблицами модели осуществляется с помощью ее таблицы дополнительных имен. Работа логических формул, используемых для анализа качества моделей и получения соответствующих выводов, реализуется с помощью таблицы дополнительных имен общей для всех моделей.

Основные ЭТ и таблицу дополнительных имен каждой модели можно представить в виде отдельной электронной книги, предназначенной для прогнозирования только по этой модели. Для выполнения сравнительного анализа результатов прогнозирования, на основе разных моделей, основные и дополнительные таблицы всех моделей должны находиться в одной электронной книге. В этой общей электронной книге проектируются еще две основные сводные ЭТ. Одна из них предназначена для сравнительного анализа качества построенных моделей. Другая таблица используется для сравнения точечных и интервальных прогнозов, полученных на основе разных моделей. Сводные таблицы автоматически заполняются данными из основных таблиц и анализируются. Затем делается вывод о том, какую из моделей лучше использовать для прогнозирования исследуемого показателя.

Далее описанный процесс поясняется на примере электронной книги, которая предназначена для прогнозирования на пять шагов вперед (k=5) показателей, заданных ВР, состоящими из девяти уровней, (N=9), и поясняется на примере ВР, в котором отражена динамика сбыта продукции предприятия за девять месяцев (таблица 1).

Таблица 1. Динамика сбыта продукции.

Месяц

1

2

3

4

5

6

7

8

9

Сбыт продукции (тыс. ед.)

72

74

76

75

79

80

82

85

89

Прогнозирование на основе линейной модели

Прогнозирование на основе линейной модели (ЛМ) предполагает, что оценка прогнозируемого показателя Yр(t) осуществляется по формуле (1):

Yр(t) = a + b·t      (1)

В формуле (1) a и b – параметры модели. Они оцениваются по методу наименьших квадратов (МНК) [7-9], согласно которому 1  Yфср  – b·tср. Такая оценка параметров выполняется с помощью таблицы “Оценка параметров ЛМ” (таблица 2). После указания в столбце Yф(t) информации о прогнозируемом показателе вычисляются параметры модели b = 118/60 = 1,9667 и a = 79,1111 – 1,9667·5 = 69,2778. Затем находится уравнение ЛМ (2).

Таблица 2. Оценка параметров ЛМ.

Номер п/п

t

t-tср

(t-tср)2

Yф(t)

Yф(t)- Yфср(t)

(t-tср)·(Yф-Yфср)

Yр(t)

Е(t)

1

2

3

4

5

6

7

8

9

1

1

-4

16

72

-7,1111

28,4444

71,2444

0,7556

2

2

-3

9

74

-5,1111

15,3333

73,2111

0,7889

3

3

-2

4

76

-3,1111

6,2222

75,1778

0,8222

4

4

-1

1

75

-4,1111

4,1111

77,1444

-2,1444

5

5

0

0

79

-0,1111

0,0000

79,1111

-0,1111

6

6

1

1

80

0,8889

0,8889

81,0778

-1,0778

7

7

2

4

82

2,8889

5,7778

83,0444

-1,0444

8

8

3

9

85

5,8889

17,6667

85,0111

-0,0111

9

9

4

16

89

9,8889

39,5556

86,9778

2,0222

Сумма

45

0

60

712

0,0000

118,0000

375,889

0,0000

Среднее значение

5

   

79,1111

       

a

 

69,2778

   

b

 

1,9667

 

Yр(t) = 69,2778 + 1,9667·t      (2)

Качество модели определяется ее адекватностью и достаточной точностью. Модель считается адекватной, если ее ряд остатков E(t) обладает свойствами случайности и независимости последовательных уровней, а также, с надежностью близкой к единице, подтверждается гипотеза о нормальности распределения последовательных уровней этого ряда.

Оценка качества модели выполняется с помощью ЭТ “Проверка случайности и независимости” и “Проверка нормальности и точности” [3]. При проектировании этих таблиц для проверки случайности уровней ряда остатков используется критерий поворотных точек. Проверка независимости (отсутствия автокорреляции) осуществляется путем проверки отсутствия в ряде остатков систематической составляющей. Это делается с помощью d-критерия Дарбина-Уотсона. Соответствие ряда остатков нормальному закону распределения определяется при помощи R/S-критерия. Ряд остатков ЛМ (2) указан в столбце E(t) таблицы 2. Применение к нему перечисленных критериев, с надежностью p близкой к единице, указывает на адекватность модели.

Точность модели определяется средним квадратичным отклонением s (точнее его наилучшей статистической оценкой) и средней относительной ошибкой Eотн. Для ЛМ (2) Eотн = 1,5573% (менее 5%), что свидетельствует об удовлетворительной точности этой модели.

Таблица 3. Точечное и интервальное прогнозирование по ЛМ.

t

Шаг k

Прогноз Yр(N+k)

U(k)

Нижняя граница

Yр(N+k)-U(k)

Верхняя граница

Yр(N+k)+U(k)

1

2

3

4

5

6

10

1

88,9444

1,6431

87,3014

90,5875

11

2

90,9111

1,7389

89,1722

92,6500

12

3

92,8778

1,8457

91,0321

94,7234

13

4

94,8444

1,9617

92,8827

96,8061

14

5

96,8111

2,0854

94,7257

98,8965

В таблице 3 указаны данные о точечном и интервальном прогнозировании (p = 0,7) на пять шагов вперед на основе ЛМ (3). Так как эта модель обладает свойствами адекватности и точности, то утверждение о том, что, при сохранении сложившихся закономерностей развития, результат прогноза попадет в интервал, образованный нижней и верхней границами, правомерно.

Прогнозирование на основе адаптивной модели

В прогнозировании, для лучшего учета особенностей изменения исследуемого показателя в конце интервала наблюдения, используются адаптивные модели. В таких моделях наибольшее значение при оценке параметров придается последним наблюдениям. Рассмотрим одну из таких моделей – модель Брауна (3), в которой k – число шагов прогнозирования,a(t  1), b(t  1) – параметры модели.

Yр(t) = a(t  1) + b(t  1)·k      (3)

Корректировка a(t) и b(t), t = 1,2,…,N, осуществляется по формулам (4). 

a(t) = a(t – 1) + b(t – 1) + E(t)·(1-B2), b(t) = b(t – 1) + E(t)·(1-B2).      (4)

В этих формулах В – коэффициент дисконтирования данных, отражающий большую степень доверия к более поздним показаниям, E(t) – отклонение расчетного показателя от фактического, a(0), b(0) – начальные значения параметров модели.

Начальные значения параметров a(0) и b(0) являются базой для последующих уточнений. Они оцениваются по первым пяти известным уровням Yф(t), t = 1,2,…,5, при помощи МНК. Такая оценка выполняется в таблице 4. В результате получается b(0) = 15/10 = 1,5 и a(0) = 75,2 – 1,5·3 = 70,7. Затем эти оценки уточняются.

Таблица 4. Нахождение начальных значений параметров.

Номер п/п

t

t-tср

(t-tср)2

Yф(t)

Yф(t)-Yфср(t)

(t-tср)·(Y(t)-Yфср(t))

Yр(t)

1

2

3

4

5

6

7

8

1

1

-2

4

72

-3,2000

6,4000

72,2000

2

2

-1

1

74

-1,2000

1,2000

73,7000

3

3

0

0

76

0,8000

0,0000

75,2000

4

4

1

1

75

-0,2000

-0,2000

76,7000

5

5

2

4

79

3,8000

7,6000

78,2000

Сумма

15

0

10

376

0,0000

15,0000

376

Среднее значение

3

   

75,2000

 

a(0)

 

70,7000

 

b(0)

 

1,5000

 

Предположим, что k = 1. Тогда значения прогнозируемого показателя вычисляются по формуле (5).

Yр(t) = a(t – 1) + b(t – 1)      (5)

Пусть в формулах (4) B = 0,6, тогда с учетом формулы (5), получаются формулы (6), которые используются для корректировки значений параметров.

a(t) = Yр(t) + E(t)·0,64, b(t) = b(t–1) + E(t)·0,16      (6)

Для уточнения текущих значений величин Yр(t), a(t), b(t), t = 1,2,…,9, по формулам (5) и (6), используется таблица 5.

После уточнения значений параметров на последнем шаге, c учетом того, что a(9) = 88,0443, b(9) = 2,3171, находится соответствующее уравнение модели Брауна (7), в котором N = 9.

Таблица 5 . Уточнение параметров АМ.

Номер п/п

t

Yф(t)

t-1

a(t-1)

a(t)

b(t-1)

b(t)

Yp(t)

E(t)

1

2

3

4

5

6

7

8

9

10

1

1

72

0

70,7000

72,0720

1,5000

1,4680

72,2000

-0,2000

2

2

74

1

72,0720

73,8344

1,4680

1,5416

73,5400

0,4600

3

3

76

2

73,8344

75,7754

1,5416

1,6414

75,3760

0,6240

4

4

75

3

75,7754

75,8700

1,6414

1,2548

77,4168

-2,4168

5

5

79

4

75,8700

78,3249

1,2548

1,5548

77,1248

1,8752

6

6

80

5

78,3249

79,9567

1,5548

1,5740

79,8797

0,1203

7

7

82

6

79,9567

81,8311

1,5740

1,6491

81,5307

0,4693

8

8

85

7

81,8311

84,4529

1,6491

1,8923

83,4802

1,5198

9

9

89

8

84,4529

88,0443

1,8923

2,3171

86,3451

2,6549

Yр(N + k) = 88,0443 + 2,3171·k (7)

Проверка качества модели осуществляется по критериям, указанным для ЛМ (2), на основании ряда остатков E(t) таблицы 5. Его исследование с надежностью близкой к единице указывает на адекватность полученной АМ Брауна. Эта модель имеет удовлетворительную точность, т.к. имеет следующие характеристики точности: S = 1,5649, Eотн = 1,4234%.

Данные о прогнозирование на основе АМ (7) приводятся в таблице 6.

Таблица 6. Точечное и интервальное прогнозирование по АМ.

t

Шаг k

Прогноз Yр(N+k)

U(k)

Нижняя граница

Yр(N+k)-U(k)

Верхняя граница Yр(N+k)+U(k)

1

2

3

4

5

6

10

1

90,3613

2,0310

88,3303

92,3923

11

2

92,6784

2,1494

90,5290

94,8278

12

3

94,9954

2,2814

92,7140

97,2768

13

4

97,3125

2,4248

94,8877

99,7373

14

5

99,6296

2,5777

97,0518

102,2073

Сравнительный анализ моделей

Результаты исследования качества ЛМ(2) и АМ(7) приводятся в таблице 7.

Таблица 7. Таблица качества моделей.

Модель

Незави-симость

Случай-ность

Норма-льность

Адекватность

S

Eотн, %

Точность

Линейная

да

да

да

выполняется

1,266

1,2337

удовлетворительная

Y(t)=69,2778+1,9667∙t

             

Адаптивная

да

да

да

выполняется

1,5649

1,4234

удовлетворительная

Y(t)=88,0443+2,3171∙k

             

Результаты точечного и интервального прогнозирования (p = 0,7) приводятся в таблице 8.

Таблица 8. Таблица результатов прогнозирования.

t

Шаг k

Линейная модель

Адаптивная модель

   

Yр(N+k)

U(k)

Yр(N+k)

U(k)

1

2

3

4

5

6

10

1

88,9444

1,6431

90,3613

2,0310

11

2

90,9111

1,7389

92,6784

2,1494

12

3

92,8778

1,8457

94,9954

2,2814

13

4

94,8444

1,9617

97,3125

2,4248

14

5

96,8111

2,0854

99,6296

2,5777

В выводах, полученных на основании таблиц 7 и 8, указывается на то, что обе модели имеют практическую значимость, так как удовлетворяют свойствам точности и адекватности. Точечные прогнозные оценки моделей имеют явную близость. Характеристики точности лучше у линейной модели, поэтому для прогнозирования исследуемого показателя лучше использовать линейную модель. Дальнейший прогноз, на основании новых данных таблицы 1, может привести к другому результату.

Рассмотренная работа позволяет студентам лучше освоить практическое применение методов математической статистики и использование разных математических моделей. Также она способствует глубокому освоению табличного процессора Excel, который широко используется аналитиками.

Список литературы

  1. Четыркин Е.М. Статистические методы прогнозирования. –М.: Статистика , 1977. – 200с.
  2. Орлова И.В., Половников В.А., Федосеев В.В. Лекции по экономико-математическим моделированию. –М.: ВЗФЭИ, 2005.
  3. Антипова Т.Н. Автоматизация экономического прогнозирования в ТП Excel: Учебное пособие. - М.: Изд.-во МГУПИ, 2008. –86 с.
  4. Дуброва Т.А. Статистические методы прогнозирования в экономике: Учебное пособие / Дуброва Т.А., Архипова М.Ю. Московский государственный университет экономики, статистики и информатики. –М.,2004. –136с.
  5. Федосеев В.В. Экономико-математические модели и прогнозирование рынка труда: Вузовский учебник. – Инфра-М, 2013.– 144с.
  6. Боровиков В.П., Ивченко Г.И. Прогнозирование в системе STATISTICA в среде Windows . Основы теории и интенсивная практика на компьютере: Учебное пособие. –М.: Финансы и статистика, 2006. – 368с.
  7. Г.Корн, Т.Корн. Справочник по математике. Для научных сотрудников и инженеров. – М.: Наука, 1977. –.832с.
  8. Карасев А.И. Теория вероятностей и математическая статистика: Учебник для экономических специальностей вузов. – М.: Статистика, 1994.- 279с.
  9. Гмурман В.Е.Теория вероятностей и математическая статистика: Учебное пособие. – М.: Издательство Юрайт, 2010. – 479с.

Интересная статья? Поделись ей с другими: