Применение электронных таблиц в статистическом анализе на примере статистической группировки
Здор Дмитрий Валерьевич – кандидат педагогических наук, доцент кафедры Физики и высшей математики Приморской государственной сельскохозяйственной академии.
Савельева Екатерина Владимировна – кандидат технических наук, доцент, зав. кафедрой Физики и высшей математики Приморской государственной сельскохозяйственной академии.
Островская Ирина Эдуардовна – старший преподаватель кафедры Физики и высшей математики Приморской государственной сельскохозяйственной академии.
Аннотация: В статье рассмотрены электронные таблицы в аспекте применения их в качестве средства статистического анализа. Целью работы является изучение алгоритма реализации статистической группировки с применением электронных таблиц. В статье алгоритм проведения статистической группировки представлен на примере группировки условных предприятий по себестоимости овощей. Несмотря на имеющиеся различия в зависимости от типа решаемой задачи, акцент был сделан на иллюстрацию инвариантных элементов рассматриваемого алгоритма. Описание решения задачи статистической группировки выполнено достаточно подробно, что может служить основой для дальнейшей разработки вопросов применения электронных таблиц в качестве инструментального средства статистического анализа.
Ключевые слова: Статистический анализ, статистическая группировка, электронная таблица, реализация статистической группировки.
Электронные таблицы получили широкое распространение для решения прикладных задач в различных сферах практической деятельности человека. Они оказались удобным инструментом для обработки информации, которая представляется в табличной форме.
Объектом рассмотрения в рамках данной статьи является применение электронных таблиц для проведения статистического анализа. Предметом изучения является проведение статистической группировки средствами электронных таблиц.
Алгоритм осуществления статистической группировки с применением электронных таблиц рассмотрим на примере группировки условных сельскохозяйственных предприятий по себестоимости овощей.
Себестоимость продукции относится к наиболее значимому показателю деятельности предприятия, который выражает в денежной форме все затраты предприятия, связанные с производством и реализацией продукции. Анализ себестоимости важен для выявления резервов предприятия и основных направлений работы коллективов предприятий по снижению себестоимости.
Группировка представляет собой аналитико-синтетический процесс разделения статистической совокупности на части с последующим детальным изучением однородных групп [3, c. 28].
Выполнение статистической группировки начинается с выбора группировочного признака. В данном случае группировку будем проводить для изучения характера распределения условных хозяйств по себестоимости овощей.
Затем необходимо выполнить построение дискретного ряда распределения. Дискретный ряд характеризуется числовыми значениями, выстроенными в произвольном порядке.
Построение дискретного ряда распределения предприятий по себестоимости овощей производим путем ввода в ячейки электронной таблицы исходных данных (таблица 1). Так как рассматриваются условные предприятия, то обозначим их номерами с 90 по 109. Не имеет принципиального значения порядок ведения нумерации условных предприятий. Вместо номеров могут использоваться названия предприятий либо любые другие обозначения. В таблице в одной строке с номером предприятия указана себестоимость единицы продукции.
Таблица 1. Дискретный ряд распределения по себестоимости овощей.
№ п/п |
Себестоимость, руб. |
90 |
601 |
91 |
589 |
92 |
680 |
93 |
809 |
94 |
910 |
95 |
919 |
96 |
589 |
97 |
568 |
98 |
549 |
99 |
125 |
100 |
258 |
101 |
589 |
102 |
548 |
103 |
950 |
104 |
254 |
105 |
450 |
106 |
458 |
107 |
409 |
108 |
608 |
109 |
507 |
Следующим этапом в проведении статистической группировки является построение ранжированного ряда распределения. В ранжированном ряде показатели группировочного признака располагаются в определенном порядке, например, по возрастанию. Для выполнения операции ранжирования в электронных таблицах необходимо выделить ячейки таблицы, в которых содержатся данные дискретного ряда и выполнить команду сортировки. Ранжированный ряд по себестоимости овощей представлен в таблице 2.
Таблица 2. Ранжированный ряд распределения по себестоимости овощей.
№ п/п |
Себестоимость, руб. |
99 |
125 |
104 |
254 |
100 |
258 |
107 |
409 |
105 |
450 |
106 |
458 |
109 |
507 |
102 |
548 |
98 |
549 |
97 |
568 |
91 |
589 |
96 |
589 |
101 |
589 |
90 |
601 |
108 |
608 |
92 |
680 |
93 |
809 |
94 |
910 |
95 |
919 |
103 |
950 |
Таким образом, данные о себестоимости овощей по условным предприятиям расположены в возрастающем порядке. Ранжированный ряд показывает амплитуду колебаний величины группировочного признака и интенсивность его возрастания при переходе от первого к последующим номерам предприятий в ранжире.
Ранжированный ряд удобно представить графически в виде точечной диаграммы [5, c. 42]. Для ее построения на оси абсцисс отмечают номера предприятий по ранжиру, на оси ординат – величину группировочного признака в масштабе. Полученный график называется «Огива Гальтона» (рис. 1).
Рисунок 1. Огива Гальтона.
Огива Гальтона показывает плавный характер изменения себестоимости. Следовательно, число групп можно определить по формуле Стерджесса:
где N – численность единиц в совокупности.
Формулу Стерджесса можно задать в произвольной ячейке электронной таблицы.
n = 1+3,322 lg 20
lg 20 = 1,30103
n = 1+3,322 *1,30103 = 5 групп
Определение величины интервала по формуле:
h = (Xmax – Xmin)/n,
где
h – величина интервала;
X max – максимальное значение признака;
X min – минимальное значение признака.
n – число групп.
Задав соответствующие формулы в электронной таблице, получим h=165.
Далее необходимо выполнить группировку предприятий по себестоимости овощей (таблица 3).
Таблица 3. Группировка предприятий по себестоимости овощей.
Номер группы |
Группа по себестоимости овощей |
Число условных предприятий, f |
|
1 |
125 |
290 |
3 |
2 |
290 |
455 |
2 |
3 |
455 |
620 |
10 |
4 |
620 |
785 |
1 |
5 |
785 |
950 |
4 |
20 |
Графически выполненную группировку удобно представить в виде гистограммы полученного интервального распределения [4, c. 25]. В электронных таблицах данная операция выполняется по команде Вставка – Диаграмма (тип диаграммы – гистограмма). Гистограмма интервального распределения представлена на рис. 2.
Рисунок 2. Гистограмма распределения.
Для расчета характеристик группового признака необходимо составить таблицу, в которой в зависимости от положения ячеек с данными ввести формулы электронной таблицы, руководствуясь приведенными шаблонами для конструирования формул вычисления характеристик рассматриваемого признака.
Чтобы рассчитать частость W нужно:
(частоту f / количество предприятий)* 100
Чтобы рассчитать абсолютную плотность распределения Ра нужно:
частоту f / величину интервала h
Для расчета относительной плотности распределения нужно:
частость w / величину интервала h
Характеристика интервального ряда распределения по себестоимости овощей представлена в таблице 4.
Графическим изображением интервального ряда распределения является кумулятивная кривая (рис. 3). При построении кумулятивной кривой по оси абсцисс откладываются середины полученных интервалов, а по оси ординат – соответствующая кумулятивная частота [4, c. 27]. В электронных таблицах данная операция выполняется с помощью построения диаграммы.
Таблица 4. Характеристика интервального ряда распределения по себестоимости овощей.
Группы по себестоимости, х |
частота, |
среднее значение интервала, х ср. |
величина интервала, h |
частость, w в % |
кумулятивная частота, S |
плотность распределения |
|
fi |
Абсолют |
Относи |
|||||
ная, Ра |
тельная., Ро |
||||||
125-290 |
3 |
207,5 |
165 |
15 |
3 |
0,018181818 |
0,090909091 |
290-455 |
2 |
372,5 |
165 |
10 |
5 |
0,012121212 |
0,060606061 |
455-620 |
10 |
537,5 |
165 |
50 |
15 |
0,060606061 |
0,303030303 |
620-785 |
1 |
702,5 |
165 |
5 |
16 |
0,006060606 |
0,03030303 |
785-950 |
4 |
867,5 |
165 |
20 |
20 |
0,024242424 |
0,121212121 |
Итого |
20 |
- |
- |
100 |
- |
- |
- |
Рисунок 3. Кумулятивная кривая.
Проведенная статистическая группировка может служить основой для дальнейшего статистического анализа рассматриваемого признака. Например, можно выполнить анализ средних величин и показателей вариации себестоимости овощей в разрезе выделенных групп, вычислить иные статистические показатели для проведения глубокого статистического анализа.
В статье алгоритм проведения статистической группировки представлен на примере группировки условных предприятий по себестоимости овощей. Несмотря на имеющиеся различия в зависимости от конкретной задачи, в описании алгоритма представлены инвариантные элементы алгоритма статистической группировки, что позволяет использовать его в качестве шаблона. Выполненное описание может служить основой для дальнейшей разработки вопросов применения электронных таблиц в качестве инструментального средства статистического анализа.
Список литературы
- Ефимова О.В. Microsoft Excel 2003. Электронные таблицы. – М.: Интеллект-Центр, 2006. – 112 с.
- Информатика: Практикум по технологии работы на компьютере / Под ред. Н.В. Макаровой. – М.: Финансы и статистика, 2005. – 256 с.
- Косач О.И. Статистика: учебное пособие. – Уссурийск: ПГСХА, 2006. – 250 с.
- Макарова Н.В., Трофимец В.Я. Статистика в Excel. – М.: Финансы и статистика, 2002. – 368 с.
- Сайков Б.П. Excel: построение диаграмм // Информатика и образование. – 2001. – № 3. – С. 37-44.