Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Проверка формы дискретного распределения в MS Excel






 

Проверка гипотезы о том, что случайная величина подчиняется какому-либо дискретному закону распределения, осуществляется с помощью –критерия Пирсона, использование которого предполагает группировку исходных выборочных данных. Процесс группировки данных наблюдения над дискретной случайной величиной зависит от числа различных возможных значений этой случайной величины. В том случае, когда велико (больше 20 – 25), процесс группировки ничем не отличается от процесса группировки данных наблюдения над непрерывной случайной величиной. Если число невелико (менее 20 – 25), то группировка сводится к подсчету частоты появления каждого из различных возможных значений исследуемой случайной величины.

 

Пример №1.

На рис. 1 в диапазоне ячеек А1: Е10 рабочего листа MS Excel приведены результаты наблюдения над некоторой случайной величиной . Необходимо используя эти данные на уровне значимости 5% проверить гипотезу о том, что случайная величина подчиняется распределению Пуассона.

Рис. 1. Исходные данные для примера №1

Определим число различных возможных значений случайной величины . Для этого в ячейках В11 и В12 используя встроенные статистические функции МИН и МАКС определим минимальное и максимальное наблюдённое значение, которые равны:

Таким образом, и группировка сводится к подсчету частоты появления каждого из возможных значений случайной величины.

В диапазон ячеек G2: G12 введем целые числа , соответствующие возможным значениям случайной величины . Частоту появления каждого из возможных значений определим с помощью встроенной статистической функции ЧАСТОТА. Для этого выделим диапазон ячеек H2: H13 и нажатием клавиш Shift+F3 вызовем диалоговое окно мастера функций. В открывшемся диалоговом окне в списке Категория выберем Статистические, в списке функций выделяем ЧАСТОТА и щелкнем на кнопке ОK. В результате на экране появиться панель функции (рис. 2).

Рис. 2. Панель функции ЧАСТОТА

В поле первого аргумента Массив_данных введем ссылку на диапазон А1: E10, в котором находятся данные наблюдения. В поле ввода Массив_интервалов введем ссылку на диапазон G2: G12, в котором записаны возможные значения случайной величины. Нажатием клавиш Shift+Ctrl+Enter введем функцию ЧАСТОТА как функцию массива. В результате в диапазоне H2: H13 появятся значения эмпирических частот (рис. 3). В последней ячейке данного диапазона содержится значение количества элементов выборки не попавших ни в один из интервалов группировки. В ячейке H14 с использованием кнопки Автосумма найдем суммарное значение эмпирических частот, равное числу наблюденных значений случайной величины.

Рис. 3. Результаты группировки данных наблюдения

над дискретной случайной величиной

При использовании критерия согласия Пирсона в качестве меры расхождения между эмпирическим и гипотетическим распределениями используется выборочная статистика вида:

(1)

где – относительная частота попадания выборочных значений случайной величины в i -й интервал группировки (эмпирическая вероятность попадания в i -й интервал); – теоретическая вероятность попадания случайной величины в i -й интервал при ее подчинении гипотетическому закону распределения (то есть при условии, что проверяемая гипотеза верна); n – число экспериментальных данных; k – количество интервалов группировки; – число значений случайной величины попавших в i –й интервал (эмпирическая частота); – ожидаемая (теоретическая) частота попадания случайной величины i -й интервал при истинности .

При определении теоретических вероятностей () левая граница первого интервала группировки расширяется до , а правая граница последнего интервала до :

(2)

где – функция распределения теоретического закона; – нижняя (левая) граница i -го интервала группировки; – верхняя (правая) граница i -го интервала группировки.

Таким образом, для использования –критерия необходимо найти значения функции распределения закона Пуассона для различных возможных значений случайной величины . Для этого, в свою очередь необходимо найти оценку параметра рассматриваемого распределения по формуле:

(3)

где i -е возможное значение случайной величины; – частота появления i -го возможного значения.

Для нахождения значения в ячейку I2 введем формулу =G2*H2, после чего используя маркер заполнения, скопируем её в ячейки I3: I12. В результате в диапазоне I2: I12 появятся значения произведений . В ячейке I13 с помощью Автосуммы найдем сумму всех произведений. Затем в ячейку I15 введем формулу =I13/H14, реализующую вычисление в соответствии с выражением (3). В итоге получим значение оценки параметра распределения (рис. 4).

Рис. 4. Нахождение оценки параметра распределения

При нахождении значений функции распределения закона Пуассона в качестве границ интервалов группировки принимаем:

Вначале определим функции распределения для нижних границ. Так как распределение Пуассона определённо только для положительных значений случайной величины, то в ячейку J2 вводим значение равное нулю.

Выделим ячейку J3 нажмем кнопку Вставка функции (f x), в списке Категория выберем Статистические, в списке функций выберем ПУАССОН[1]и нажмем ОK. В результате в строке формул появится функция =ПУАССОН(), а на экране – панель этой функции с полями для ввода аргументов (рис. 5).

Рис. 5. Панель функции ПУАССОН

В поле Х вводим G3-1, (ячейка G3 содержит второе возможное значение случайной величины).

В поле Среднее введем абсолютную ссылку на ячейку I15, содержащую выборочную оценку параметра распределения .

В поле Интегральная вводится логическая константа, определяющая вид вычисляемой функции: если в это поле ввести 0 (ЛОЖЬ), то функция выдаст значение функции вероятности , соответствующее заданному значению . Если в это поле ввести 1 (ИСТИНА), то функция выдаст значение функции распределения , соответствующее заданному значениюаргумента. Т.к. нам необходимо определить значение функции распределения, то в это поле вводим значение 1.

Используя маркер автозаполнения, заполним диапазон ячеек J4: J12, значениями функций распределения от нижних границ интервалов группировки.

Теперь определим значения функции распределения от верхних границ. Для этого выделим ячейку K2, вызовем панель функции ПУАССОНи в поле Х введем ссылку на ячейку G2. Остальные поля заполняются так же, как и для нижних границ. Используя маркер заполнения, копируем функцию в остальные ячейки диапазона K2: K12.

Наконец, в диапазоне ячеек L2: L12, используя выражения (2), находим значения теоретических вероятностей, после чего в диапазоне М2: М12 рассчитываем значения теоретических частот по формуле:

Используя кнопку Автосумма, проверяем выполнение условий нормировки для теоретических вероятностей и частот. Результаты расчётов приведены на рис. 6.

Рис. 6. Расчёт теоретических вероятностей и частот

Из рис. 6 видно, что значения теоретических частот для некоторых интервалов меньше пяти, поэтому необходимо провести объединение соответствующих интервалов. При этом эмпирическая и теоретическая частоты объединенного интервала равны сумме соответствующих частот объединяемых интервалов (рис. 7).

Рис. 7. Результат объединения интервалов

Рассчитаем значения слагаемых статистики . Для этого выделим ячейку Q3 и введем в неё формулу: =(P3-O3)^2/O3. В результате получим значение слагаемого для первого интервала. Используя маркер заполнения, определим значения слагаемых для остальных пяти интервалов.

С помощью кнопки Автосумма или функции СУММ, находим в ячейке Q9 по формуле (1) значение статистики .

Так как, после объединения осталось шесть интервалов группировки, и по выборочным данным была найдена одна оценка параметра распределения, то число степеней свободы распределения статистики равно:

Рассчитанное значение статистики необходимо сравнить с верхней процентной точкой распределения. Для её нахождения воспользуемся функцией ХИ2.ОБР[2]– выделим ячейку Q10, нажмем кнопку Вставка функции или клавиши Shift + F3, в диалоговом окне мастера функций в категории Статистические выберем ХИ2.ОБР и нажмем OK. На экране появиться панель функции (рис. 8). В поле ввода Вероятность введем значение уровня значимости в виде десятичной дроби, а в поле Степени_свободы – число 4 и нажмем кнопку OK. В результате в ячейке Q10 появиться значение верхней процентной точки (рис. 9).

Рис. 8. Панель функции ХИ2.ОБР

Рис. 9. Расчет статистики и её критического значения

Т.к. расчетное значение статистики меньше её критического значения , то критерий отклонения нулевой гипотезы не выполняется, следовательно, нет оснований считать, что противоречит опытным данным. Таким образом, на уровне значимости 5% можно считать, что исследуемая случайная величина подчинена распределению Пуассона.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.