Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Краткие теоретические сведения. Под статистической гипотезой понимают всякое высказывание о генеральной совокупности (случайной величине)






 

Под статистической гипотезой понимают всякое высказывание о генеральной совокупности (случайной величине), проверяемое по выборке (по результатам наблюдений). Процедуру сопоставления высказанной гипотезы с выборочными данными называют проверкой статистической гипотезы.

В ходе статистической обработки данных можно выделить следующие основные виды высказываемых гипотез:

1) о типе закона распределения исследуемой случайной величины;

2) об однородности двух или нескольких обрабатываемых выборок или некоторых характеристик анализируемых совокупностей;

3) о числовых значениях исследуемой генеральной совокупности;

4) о типе зависимости между компонентами исследуемого многомерного признака;

5) о независимости и стационарности обрабатываемого ряда наблюдений.

Проверяемую статистическую гипотезу принято называть основной (или нулевой) гипотезой Н0, а противоречащую ей гипотезу – альтернативной (или конкурирующей) Н1.

При проверке правильности выдвинутой статистической гипотезы возможно возникновение двух видов ошибки:

1) ошибка первого рода – отвергается правильная нулевая гипотеза;

2) ошибка второго рода – нулевая гипотеза не отвергается, тогда как в действительности она неверна.

Проверка статистических гипотез осуществляется с помощью различных статистических критериев. В качестве критерия используется некоторая случайная величина, точное или приближенное распределение которой известно. Множество всех возможных значений критерия разбивается на два подмножества:

1) критическая область – совокупность значений критерия, при которых нулевую гипотезу отвергают;

2) область принятия гипотезы – совокупность значений критерия, при которых гипотезу принимают.

Критическая область выбирается таким образом, чтобы вероятность совершить ошибку первого рода не превосходила некоторого заранее определенного положительного числа a – уровня значимости (0, 05; 0, 01; 0, 001). Вероятность совершить ошибку второго рода обозначается b. Величина 1- b называется мощностью критерия, она равна вероятности отвергнуть неверную гипотезу.

Чаще всего множество возможных значений критерия принадлежит некоторому интервалу, интервалом является и критическая область. Граничные точки критической области называются критическими точками. Критические точки выбираются таким образом, чтобы при выбранном уровне значимости a мощность критерия 1- b была наибольшей.

Возможны три вида расположения критической области (в зависимости от вида нулевой и альтернативной гипотез, вида и распределения статистического критерия j):

1) правосторонняя критическая область, состоящая из интервала (xкрпр, a; +¥), где точка xкрпр, a называется правосторонней критической точкой, отвечающей уровню значимости a, и определяется из условия P (j > xкрпр, a)= a (рис. 1 а);

2) левосторонняя критическая область, состоящая из интервала (-¥; xкрлев, a), где точка xкрлев, a называется левосторонней критической точкой, отвечающей уровню значимости a, и определяется из условия P (j < xкрлев, a)= a (рис. 1 б);

3) двусторонняя критическая область, состоящая из двух интервалов (-¥; xкрлев, a) и (xкрпр, a; +¥), где точки xкрлев, a и xкрпр, a называются двусторонними критическими точками и определяются из условий P (j < xкрлев, a)= a/ 2 и P (j > xкрпр, a)= a/ 2 (рис. 1 в).

 
 

Наиболее распространенными являются критерии c 2, Стьюдента, Фишера.

 

Проверка гипотезы о нормальном распределении

случайной величины

 

Проверка гипотезы и предполагаемом законе распределения проводится при помощи специально подобранной случайной величины – критерия согласия. Одним из используемых критериев согласия является критерий c 2 Пирсона.

С целью проверки гипотезы о нормальном распределении генеральной совокупности с применением критерия Пирсона сравниваются эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты. Критерий Пирсона устанавливает на принятом уровне значимости согласие или несогласие гипотезы с данными наблюдений.

Пусть по выборке объема n получено эмпирическое распределение:

варианты xi x 1 x 2 xs
эмпирические частоты ni n 1 n 2 ns

В предположении нормального распределения генеральной совокупности вычислены теоретические частоты i. При уровне значимости a требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально. В качестве критерия проверки нулевой гипотезы примем случайную величину

. (1)

Чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия, и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений. Доказано, что при n ®¥ случайная величина (1) стремится к закону распределения c 2 с k степенями свободы.

Число степеней свободы находят по равенству

, (2)

где s – число групп (частичных интервалов) выборки; r – число параметров предполагаемого распределения.

Если предполагаемое распределение – нормальное, то оценивают два параметра (математическое ожидание и стандартное отклонение), поэтому r =2 и число степеней свободы k = s -3.

Поскольку односторонний критерий более «жестко» отвергает нулевую гипотезу, чем двусторонний, строят правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости a:

. (3)

Таким образом, правосторонняя критическая область определяется неравенством c 2 > c 2 кр (a; k), а область принятия нулевой гипотезы – неравенством c 2 < c 2 кр (a; k).

Обозначив значение критерия, вычисленное по данным наблюдений, через c 2 набл формулируют правило проверки нулевой гипотезы следующим образом:

Правило. Для того чтобы на заданном уровне значимости проверить нулевую гипотезу Н 0: генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия

(4)

и по таблице критических точек распределения c2, по заданному уровню значимости a и числу степеней свободы k = s -3 найти критическую точку c2кр(a; k). Если c2набл < c2кр – нет оснований отвергнуть нулевую гипотезу; если c2набл > c2кр – нулевую гипотезу отвергают.

Проверку попадания c 2-критерия в критическую область в режиме работы Анализ данных табличного процессора Microsoft Excel проводят при помощи функций ХИ2РАСП и ХИ2ОБР.

1. Функция ХИ2РАСП (x; степени_свободы) рассчитывает c 2-распределение. Аргументы: x: значение, для которого рассчитывается c 2-распределение; степени_свободы: число степеней свободы.

2. Функция ХИ2ОБР (вероятность; степени_свободы) рассчитывает обратное c 2-распределение. Аргументы: вероятность: вероятность, связанная с c 2-распределением (уровень значимости a); степени_свободы: число степеней свободы. Функция ХИ2ОБР использует метод итераций для вычисления значения и производит вычисления, пока не получит результат с точность до ±3× 10-7.

Для расчета нормального распределения используется функция НОРМРАСП (x; среднее; стандартное_откл; интегральная). Аргументами этой функции являются: x – значение, для которого вычисляется нормальное распределение; среднее – средняя арифметическая распределения; стандартное_откл – стандартное отклонение распределения; интегральная – логическое значение, определяющее форму функции. Если аргумент интегральная =1, то функция НОРМРАСП рассчитывает интегральную функцию распределения; если аргумент интегральная =0 – дифференциальную функцию распределения.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.