Применение электронных таблиц в статистическом анализе на примере статистической группировки

Здор Дмитрий Валерьевич – кандидат педагогических наук, доцент кафедры Физики и высшей математики Приморской государственной сельскохозяйственной академии.

Савельева Екатерина Владимировна – кандидат технических наук, доцент, зав. кафедрой Физики и высшей математики Приморской государственной сельскохозяйственной академии.

Островская Ирина Эдуардовна – старший преподаватель кафедры Физики и высшей математики Приморской государственной сельскохозяйственной академии.

Аннотация: В статье рассмотрены электронные таблицы в аспекте применения их в качестве средства статистического анализа. Целью работы является изучение алгоритма реализации статистической группировки с применением электронных таблиц. В статье алгоритм проведения статистической группировки представлен на примере группировки условных предприятий по себестоимости овощей. Несмотря на имеющиеся различия в зависимости от типа решаемой задачи, акцент был сделан на иллюстрацию инвариантных элементов рассматриваемого алгоритма. Описание решения задачи статистической группировки выполнено достаточно подробно, что может служить основой для дальнейшей разработки вопросов применения электронных таблиц в качестве инструментального средства статистического анализа.

Ключевые слова: Статистический анализ, статистическая группировка, электронная таблица, реализация статистической группировки.

Электронные таблицы получили широкое распространение для решения прикладных задач в различных сферах практической деятельности человека. Они оказались удобным инструментом для обработки информации, которая представляется в табличной форме.

Объектом рассмотрения в рамках данной статьи является применение электронных таблиц для проведения статистического анализа. Предметом изучения является проведение статистической группировки средствами электронных таблиц.

Алгоритм осуществления статистической группировки с применением электронных таблиц рассмотрим на примере группировки условных сельскохозяйственных предприятий по себестоимости овощей.

Себестоимость продукции относится к наиболее значимому показателю деятельности предприятия, который выражает в денежной форме все затраты предприятия, связанные с производством и реализацией продукции. Анализ себестоимости важен для выявления резервов предприятия и основных направлений работы коллективов предприятий по снижению себестоимости.

Группировка представляет собой аналитико-синтетический процесс разделения статистической совокупности на части с последующим детальным изучением однородных групп [3, c. 28].

Выполнение статистической группировки начинается с выбора группировочного признака. В данном случае группировку будем проводить для изучения характера распределения условных хозяйств по себестоимости овощей.

Затем необходимо выполнить построение дискретного ряда распределения. Дискретный ряд характеризуется числовыми значениями, выстроенными в произвольном порядке.

Построение дискретного ряда распределения предприятий по себестоимости овощей производим путем ввода в ячейки электронной таблицы исходных данных (таблица 1). Так как рассматриваются условные предприятия, то обозначим их номерами с 90 по 109. Не имеет принципиального значения порядок ведения нумерации условных предприятий. Вместо номеров могут использоваться названия предприятий либо любые другие обозначения. В таблице в одной строке с номером предприятия указана себестоимость единицы продукции.

Таблица 1. Дискретный ряд распределения по себестоимости овощей.

№ п/п

Себестоимость, руб.

90

601

91

589

92

680

93

809

94

910

95

919

96

589

97

568

98

549

99

125

100

258

101

589

102

548

103

950

104

254

105

450

106

458

107

409

108

608

109

507

Следующим этапом в проведении статистической группировки является построение ранжированного ряда распределения. В ранжированном ряде показатели группировочного признака располагаются в определенном порядке, например, по возрастанию. Для выполнения операции ранжирования в электронных таблицах необходимо выделить ячейки таблицы, в которых содержатся данные дискретного ряда и выполнить команду сортировки. Ранжированный ряд по себестоимости овощей представлен в таблице 2.

Таблица 2. Ранжированный ряд распределения по себестоимости овощей.

№ п/п

Себестоимость, руб.

99

125

104

254

100

258

107

409

105

450

106

458

109

507

102

548

98

549

97

568

91

589

96

589

101

589

90

601

108

608

92

680

93

809

94

910

95

919

103

950

Таким образом, данные о себестоимости овощей по условным предприятиям расположены в возрастающем порядке. Ранжированный ряд показывает амплитуду колебаний величины группировочного признака и интенсивность его возрастания при переходе от первого к последующим номерам предприятий в ранжире.

Ранжированный ряд удобно представить графически в виде точечной диаграммы [5, c. 42]. Для ее построения на оси абсцисс отмечают номера предприятий по ранжиру, на оси ординат – величину группировочного признака в масштабе. Полученный график называется «Огива Гальтона» (рис. 1).

Рисунок 1. Огива Гальтона.

Огива Гальтона показывает плавный характер изменения себестоимости. Следовательно, число групп можно определить по формуле Стерджесса:

 

где N – численность единиц в совокупности.

Формулу Стерджесса можно задать в произвольной ячейке электронной таблицы.

n = 1+3,322 lg 20

lg 20 = 1,30103

n = 1+3,322 *1,30103 = 5 групп 

Определение величины интервала по формуле: 

h = (Xmax – Xmin)/n,

где

h – величина интервала;

X max – максимальное значение признака;

X min – минимальное значение признака.

n – число групп.

Задав соответствующие формулы в электронной таблице, получим h=165.

Далее необходимо выполнить группировку предприятий по себестоимости овощей (таблица 3).

Таблица 3. Группировка предприятий по себестоимости овощей.

Номер группы

Группа по себестоимости овощей

Число условных предприятий, f

1

125

290

3

2

290

455

2

3

455

620

10

4

620

785

1

5

785

950

4

     

20

Графически выполненную группировку удобно представить в виде гистограммы полученного интервального распределения [4, c. 25]. В электронных таблицах данная операция выполняется по команде Вставка – Диаграмма (тип диаграммы – гистограмма). Гистограмма интервального распределения представлена на рис. 2.

Рисунок 2. Гистограмма распределения.

Для расчета характеристик группового признака необходимо составить таблицу, в которой в зависимости от положения ячеек с данными ввести формулы электронной таблицы, руководствуясь приведенными шаблонами для конструирования формул вычисления характеристик рассматриваемого признака.

Чтобы рассчитать частость W нужно:

(частоту f / количество предприятий)* 100

Чтобы рассчитать абсолютную плотность распределения Ра нужно:

частоту f / величину интервала h

Для расчета относительной плотности распределения нужно:

частость w / величину интервала h 

Характеристика интервального ряда распределения по себестоимости овощей представлена в таблице 4.

Графическим изображением интервального ряда распределения является кумулятивная кривая (рис. 3). При построении кумулятивной кривой по оси абсцисс откладываются середины полученных интервалов, а по оси ординат – соответствующая кумулятивная частота [4, c. 27]. В электронных таблицах данная операция выполняется с помощью построения диаграммы.

Таблица 4. Характеристика интервального ряда распределения по себестоимости овощей.

Группы по себестоимости, х

частота,

среднее значение интервала, х ср.

величина интервала, h

частость, w в %

кумулятивная частота, S

плотность распределения

fi

Абсолют

Относи

 

ная, Ра

тельная., Ро

125-290

3

207,5

165

15

3

0,018181818

0,090909091

290-455

2

372,5

165

10

5

0,012121212

0,060606061

455-620

10

537,5

165

50

15

0,060606061

0,303030303

620-785

1

702,5

165

5

16

0,006060606

0,03030303

785-950

4

867,5

165

20

20

0,024242424

0,121212121

               

Итого

20

-

-

100

-

-

-

Рисунок 3. Кумулятивная кривая.

Проведенная статистическая группировка может служить основой для дальнейшего статистического анализа рассматриваемого признака. Например, можно выполнить анализ средних величин и показателей вариации себестоимости овощей в разрезе выделенных групп, вычислить иные статистические показатели для проведения глубокого статистического анализа.

В статье алгоритм проведения статистической группировки представлен на примере группировки условных предприятий по себестоимости овощей. Несмотря на имеющиеся различия в зависимости от конкретной задачи, в описании алгоритма представлены инвариантные элементы алгоритма статистической группировки, что позволяет использовать его в качестве шаблона. Выполненное описание может служить основой для дальнейшей разработки вопросов применения электронных таблиц в качестве инструментального средства статистического анализа.

Список литературы

  1. Ефимова О.В. Microsoft Excel 2003. Электронные таблицы. – М.: Интеллект-Центр, 2006. – 112 с.
  2. Информатика: Практикум по технологии работы на компьютере / Под ред. Н.В. Макаровой. – М.: Финансы и статистика, 2005. – 256 с.
  3. Косач О.И. Статистика: учебное пособие. – Уссурийск: ПГСХА, 2006. – 250 с.
  4. Макарова Н.В., Трофимец В.Я. Статистика в Excel. – М.: Финансы и статистика, 2002. – 368 с.
  5. Сайков Б.П. Excel: построение диаграмм // Информатика и образование. – 2001. – № 3. – С. 37-44.

Интересная статья? Поделись ей с другими: