УДК 519.2

Исследование проблемных тем курса теории вероятностей и математической статистики

Бессарабская Ирина Эдуардовна – кандидат технических наук, МИРЭА – Российский технологический университет

Аннотация: В работе рассматриваются наиболее характерные ошибки, допускаемые студентами в процессе изучения курса по теории вероятностей и математической статистике. Ошибки выделены при анализе тестовых и экзаменационных работ студентов и являются типичными, а не вызванными особенностями отдельных конкретных задач.

Ключевые слова: статистика, теория вероятностей, преподавание, ошибки понимания, вероятность, случайная величина, закон распределения.

Понимание статистики на уровне высшего образования довольно сложно освоить, поскольку представленный материал абстрактен. При изучении статистики студентам необходимы математические способности, в том числе способность понимать статистические концепции. Понимание статистических концепций – это деятельность по обнаружению истины или ошибки и обоснованию каждого шага процесса понимания [1, 2]. Статистика играет важную роль в исследованиях, как при подготовке моделей, формулировании гипотез, разработке инструментов сбора данных, так и при разработке планов исследований, определении выборок и анализе данных [1]. Во многих случаях обработка и анализ данных не обходятся без применения специфических статистических приемов и методик, наличие которых может послужить основой для объяснения возникающих взаимосвязей [3]. Статистика может быть использована в качестве инструмента для выяснения того, существует ли причинно-следственная связь между двумя или более переменными в эмпирической причинно-следственной связи или эта связь просто случайна или неслучайна без причины [4].

Целью работы является исследование типичных трудностей и ошибок, которые допускают студенты в процессе освоения курса теории вероятностей. Статья построена следующим образом. Формулируется название раздела курса теории вероятностей, затем приводятся характерные ошибки и даются рекомендации.

Одна из характерных ошибок при определении условной вероятности состоит в том, что при подсчете условной вероятности не учитывается изменение условий опыта при наступлении события А. Нередко ошибки происходят из-за того, что при решении путают ситуации: «произойдет хотя бы одно событие» и «произойдет только одно событие». Если в условии сказано, что должно произойти только одно событие, то, значит, следует рассмотреть случаи, когда одновременно одно событие происходит, а все остальные – нет. Если же в условии говорится, что произойдет хотя бы одно событие, то проще решать подобную задачу с помощью обратного события, которое формулируется следующим образом: «ни одно событие не произойдет». Найдя вероятность этого события, и вычтя его из единицы, получим вероятность исходного события.

Нередко трудности возникают при решении задач на последовательный выбор элементов разного типа – в них требуется найти вероятность, с которой элементы будут выбраны в определенной последовательности. Это задача на условную вероятность, в которой необходимо учесть последовательность наступления событий. Ошибкой является то, что последовательность наступления событий не учитывается.

При решении задач с использованием формул полной вероятности и Байеса чаще всего выделяются два характерных типа ошибок. Во-первых, неправильное выделение гипотез; во-вторых, неправильное определение вероятностей гипотез. По поводу ошибок первого рода следует сказать, что при выделении гипотез следует внимательно сформулировать производимый эксперимент и рассмотреть возможные варианты исходов эксперимента. Гипотезами могут быть только такие исходы, из которых какой-то один обязательно произойдет, но два одновременно произойти не могут. Только такое множество событий будет удовлетворять определению гипотез.

Однако больше всего ошибок происходит при определении вероятностей гипотез. Сумма вероятностей гипотез обязательно должна быть равна 1, так как гипотезы в сумме дают достоверное событие. Это свойство можно применять для проверки правильности определения вероятностей гипотез.

Для решения задач в условиях схемы последовательных независимых испытаний применяется формула Бернулли, а также теоремы Пуассона и Муавра-Лапласа. При этом наибольшая сложность заключаются в правильном выборе применяемой для решения данной конкретной задачи теоремы. Формула Бернулли дает точный ответ и в этом смысле предпочтительнее, но она может быть применена только при небольшом количестве испытаний. Если же число испытаний велико, можно найти вероятность приближенно, используя теоремы Пуассона или Муавра-Лапласа. При выборе нужной теоремы необходимо руководствоваться следующими правилами: теорема Пуассона неприменима если вероятность наступления события в одном испытании, р близка к ½. Она применяется только при малых р. Локальная теорема Муавра-Лапласа, наоборот, дает результат тем точнее, чем ближе р к ½ и не применяется при малых р. Интегральная теорема Муавра-Лапласа применяется в случае, когда необходимо найти вероятность наступления события А не один раз, а несколько, то есть когда количество m наступлений события А находится в некотором интервале.

При решении задач на применение формулы Бернулли, теоремы Пуассона или теорем Муавра-Лапласа нередки ситуации, когда возникают проблемы при переводе в математические символы словесной формулировки. Так, часто возникают трудности с пониманием фразы «хотя бы …». Например, фраза: «событие А в пяти испытаниях наступит хотя бы 3 раза» нередко понимается так, что А наступит ровно 3 раза. Необходимо запомнить, что фраза «хотя бы m раз …» означает, что А наступит m и более раз. В данном примере эта фраза означает, что событие А наступит или 3, или 4, или 5 раз. Поэтому необходимо отдельно найти вероятности событий A1 = {А наступит ровно 3 раза}, A2 = {А наступит ровно 4 раза}, A= {А наступит ровно 5 раз}. Эти события несовместны друг с другом, поэтому вероятность события В={А в пяти испытаниях наступит хотя бы 3 раза} определяется как сумма: Р(В)=Р(A1)+Р(A2)+Р(A3).

Аналогично ошибочно понимаются фразы «не более m раз» как ровно m раз, «не менее m раз» как ровно m раз. В то время как эти фразы означают «менее или равно m раз» и «более или равно m раз» соответственно.

Тема случайных величин (СВ) необычайно важна и порождает наибольшее количество однотипных ошибок. Эту тему можно разделить на две части: дискретные СВ и непрерывные СВ. В задачах по теме дискретных СВ, как правило, требуется определить закон распределения СВ, исходя из условий задачи, определить функцию распределения вероятностей данной СВ – F(x) и построить ее график.

Часто встречается следующая ошибка: при построении закона распределения дискретной СВ полученные вероятности в сумме меньше или больше единицы.

Типичной ошибкой при построении гипергеометрического закона распределения является то, что его путают с биномиальным законом.

По определению функция распределения вероятностей (ФРВ) F(x) – это вероятность, с которой СВ Х может принять значение меньшее аргумента х. В данной теме много ошибок возникает при построении ФРВ F(x) и ее графика. При построении F(x) для заданной дискретной СВ следует помнить, что F(x) – неубывающая функция, которая в силу особенности дискретной СВ разрывна и возрастает скачками в значениях случайной величины Х на величину Р(Х= ), поэтому график F(x) для дискретной СВ состоит из горизонтальных отрезков, причем для каждого из последующих отрезков координата Y возрастает. Неправильно изображать F(x), как ломаную соединяющую точки с координатами (xi, Fi), так как F(x) остается постоянной на каждом из полуинтервалов (xi, xi+1].

При изучении непрерывных СВ особое внимание уделяется функции плотности вероятности f(x) случайной величины.

Одной из частых ошибок при определении плотности вероятности f(x) по заданной функции распределения вероятностей F(x) является то, что на тех участках значений СВ, на которых F(x) постоянна, плотность f(x) отлична от нуля. В частности, это касается области, в которой F(x) равна 1. Распространенная ошибка заключается в том, что в этой области полагают f(x) также равной 1.

Для дискретной случайной величины вероятность попадания в интервал может быть определена только посредством функции распределения вероятностей: вероятность попадания в интервал равна приращению функции распределения вероятностей на этом интервале Р(a<X<b)=F(b)-F(a). 

При определении вероятности, с которой непрерывная СВ попадет в заданный интервал можно использовать два способа.

Первый основан на свойствах функции распределения вероятностей: вероятность попадания в интервал равна приращению функции распределения вероятностей на этом интервале Р(a<X<b)=F(b)-F(a).

Второй способ основан на использовании плотности вероятности f(x). Для определения вероятности, с которой СВ Х попадет в интервал [a,b] необходимо найти интеграл от плотности вероятности в пределах от a до b.

Знание свойств математического ожидания и дисперсии являются необходимыми при определении этих числовых характеристик для линейных комбинаций случайных величин. Наиболее распространенной ошибкой является путаница с вынесением константы из-под знака дисперсии.

В теме случайных величин много внимания уделяется определению их числовых характеристик. 

При подсчете дисперсии случайной величины можно использовать формулу: D(X)=М(Х²)-(M(Х))². Однако, второе слагаемое часто забывают, полагая дисперсию D(X) равной М(Х²).

Стандартной ошибкой при определении математического ожидания и дисперсии дискретной случайной величины является использование формул М(Х)=np, D(X)=npq.

Изучение математической статистики начинается с методов точечных оценок параметров генеральной совокупности. В первую очередь интерес представляют оценки математического ожидания, дисперсии генеральной совокупности, а также точечные оценки коэффициента корреляции между двумя признаками генеральной совокупности. Одной из самых распространенных ошибок в данном разделе является путаница, возникающая при определении несмещенной оценки дисперсии. Несмещенной называется такая оценка параметра θ, математическое ожидание которой равно оцениваемому параметру θ٭, М(θ)=θ٭. Следует помнить, что несмещенной является только исправленная дисперсия, а выборочная дисперсия – смещенная оценка.

При определении интервальных оценок параметров генеральной совокупности и проверке статистических гипотез, требуется определять критические точки, играющие в получении оценок и принятии решений основную роль. При решении задач касающихся неизвестного математического ожидания генеральной совокупности ошибка в определении критических точек совершается наиболее часто. Она заключается в использовании при определении критических точек таблицы нормального распределения – таблицы функции Лапласа. Однако эту таблицу можно использовать, только если известна дисперсия генеральной совокупности, или если размер выборки, по которой проводится проверка гипотезы, более 30. Если же эти условия не выполнены, то для определения критических точек используется таблица распределения Стьюдента.

Способность студентов понимать математические концепции в курсе теории вероятностей все еще недостаточно хороша. Это можно увидеть на примере некоторых студентов, которые все еще испытывают трудности с пониманием сути концепции, включая трудности с проверкой правильного понимания концепции и написанием используемых концепций.

В рамках этого исследования преподавателю, который преподает курс теории вероятностей, рекомендуется учитывать типичные ошибки и обращать на них внимание обучаемого, чтобы улучшить способность студентов понимать математические концепции. Статья также будет полезна и студентам высших учебных заведений и позволит им более успешно овладеть курсом статистики.

Список литературы

  1. Tinungki GM. Zone Proximal Development Gives a New Meaning To the Students’ Intelligence in Statistical Method Lesson. J Honai Math. 2019; 2 (2): 129-
  2. Аристова Е. Ю. Методика преподавания курса «Теория вероятностей и математическая статистика» в техническом вузе //Актуальные проблемы гуманитарных и естественных наук. – 2015. – №. 12-4. – С. 64-66.
  3. Borovcnik M., Kapadia R. A. Historical and Philosophical Perspective on Probability. In: Probabilistic Thinking, Advances in Mathematics Education. Dordrecht: Springer Science+ Business Media; 2014. p. 7-
  4. Добрин А. В., Лопухин А. М. Содержательные характеристики вероятностного стиля мышления: теоретические основы исследования //Психология образования в поликультурном пространстве. – 2019. – №. – С. 32-48.
  5. Гмурман В. Теория вероятностей и математическая статистика 12-е изд. Учебник для вузов. – Litres, 2022.
  6. Ивановский Р. И. Теория вероятностей и математическая статистика. Основы, прикладные аспекты с примерами и задачами в среде Mathcad. – БХВ-Петербург, 2008.
  7. Куликов В. Б. Анализ методов идентификации законов распределения случайных величин и процессов. Новые методы идентификации на основе алгоритмов регуляризации //Cloud of science. – 2019. – Т. 6. – №. 4. – С. 565-589.
  8. Кулешов Е. Л., Петров К. А., Кириллова Т. С. Критерий согласия на основе доверительных границ функции распределения вероятностей //Информатика и системы управления. – 2017. – №. 2. – С. 72-84.
  9. Крейдик Е. Л. Методика расчета доверительного интервала оценки случайной величины, подчиненной композиции нормального и равномерного законов распределения //Доклады Белорусского государственного университета информатики и радиоэлектроники. – 2017. – №. 7 (109). – С. 25-31.
  10. Панченко Е. И. Числовые характеристики случайных величин в задачах с практическим содержанием //Актуальные проблемы преподавания математики в техническом вузе. – 2016. – №. 4. – С. 104-108.
  11. Газарян А. Ш., Мокриков С. С. Точечные оценки параметров распределения //Международный студенческий научный вестник. – 2018. – №. 3-1. – С. 56-58.
  12. Гордиенко И. В., Чернаков Е. А. Интервальные оценки // Потенциал российской экономики и инновационные пути его реализации. – 2016. – С. 82-85.
  13. Боровков А. А., Могульский А. А. Большие уклонения и проверка статистических гипотез //Математические труды. – 1992. – Т. 19. – № 0. – С. 2-220.

{social)