Краткие теоретические сведения. Под статистической гипотезой понимают всякое высказывание о генеральной совокупности (случайной величине)

⇐ ПредыдущаяСтр 6 из 16Следующая ⇒

Под статистической гипотезой понимают всякое высказывание о генеральной совокупности (случайной величине), проверяемое по выборке (по результатам наблюдений). Процедуру сопоставления высказанной гипотезы с выборочными данными называют проверкой статистической гипотезы.

В ходе статистической обработки данных можно выделить следующие основные виды высказываемых гипотез:

1) о типе закона распределения исследуемой случайной величины;

2) об однородности двух или нескольких обрабатываемых выборок или некоторых характеристик анализируемых совокупностей;

3) о числовых значениях исследуемой генеральной совокупности;

4) о типе зависимости между компонентами исследуемого многомерного признака;

5) о независимости и стационарности обрабатываемого ряда наблюдений.

Проверяемую статистическую гипотезу принято называть основной (или нулевой) гипотезой Н₀, а противоречащую ей гипотезу – альтернативной (или конкурирующей) Н₁.

При проверке правильности выдвинутой статистической гипотезы возможно возникновение двух видов ошибки:

1) ошибка первого рода – отвергается правильная нулевая гипотеза;

2) ошибка второго рода – нулевая гипотеза не отвергается, тогда как в действительности она неверна.

Проверка статистических гипотез осуществляется с помощью различных статистических критериев. В качестве критерия используется некоторая случайная величина, точное или приближенное распределение которой известно. Множество всех возможных значений критерия разбивается на два подмножества:

1) критическая область – совокупность значений критерия, при которых нулевую гипотезу отвергают;

2) область принятия гипотезы – совокупность значений критерия, при которых гипотезу принимают.

Критическая область выбирается таким образом, чтобы вероятность совершить ошибку первого рода не превосходила некоторого заранее определенного положительного числа a – уровня значимости (0, 05; 0, 01; 0, 001). Вероятность совершить ошибку второго рода обозначается b. Величина 1- b называется мощностью критерия, она равна вероятности отвергнуть неверную гипотезу.

Чаще всего множество возможных значений критерия принадлежит некоторому интервалу, интервалом является и критическая область. Граничные точки критической области называются критическими точками. Критические точки выбираются таким образом, чтобы при выбранном уровне значимости a мощность критерия 1- b была наибольшей.

Возможны три вида расположения критической области (в зависимости от вида нулевой и альтернативной гипотез, вида и распределения статистического критерия j):

1) правосторонняя критическая область, состоящая из интервала (x^кр_пр,_a; +¥), где точка x^кр_пр,_a называется правосторонней критической точкой, отвечающей уровню значимости a, и определяется из условия P (j > x^кр_пр,_a)= a (рис. 1 а);

2) левосторонняя критическая область, состоящая из интервала (-¥; x^кр_лев,_a), где точка x^кр_лев,_a называется левосторонней критической точкой, отвечающей уровню значимости a, и определяется из условия P (j < x^кр_лев,_a)= a (рис. 1 б);

3) двусторонняя критическая область, состоящая из двух интервалов (-¥; x^кр_лев,_a) и (x^кр_пр,_a; +¥), где точки x^кр_лев,_a и x^кр_пр,_a называются двусторонними критическими точками и определяются из условий P (j < x^кр_лев,_a)= a/ 2 и P (j > x^кр_пр,_a)= a/ 2 (рис. 1 в).

Наиболее распространенными являются критерии c ², Стьюдента, Фишера.

Проверка гипотезы о нормальном распределении

случайной величины

Проверка гипотезы и предполагаемом законе распределения проводится при помощи специально подобранной случайной величины – критерия согласия. Одним из используемых критериев согласия является критерий c ² Пирсона.

С целью проверки гипотезы о нормальном распределении генеральной совокупности с применением критерия Пирсона сравниваются эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты. Критерий Пирсона устанавливает на принятом уровне значимости согласие или несогласие гипотезы с данными наблюдений.

Пусть по выборке объема n получено эмпирическое распределение:

варианты	x_i	x ₁	x ₂	…	x_s
эмпирические частоты	n_i	n ₁	n ₂	…	n_s

В предположении нормального распределения генеральной совокупности вычислены теоретические частоты n¢ _i. При уровне значимости a требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально. В качестве критерия проверки нулевой гипотезы примем случайную величину

. (1)

Чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия, и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений. Доказано, что при n ®¥ случайная величина (1) стремится к закону распределения c ² с k степенями свободы.

Число степеней свободы находят по равенству

, (2)

где s – число групп (частичных интервалов) выборки; r – число параметров предполагаемого распределения.

Если предполагаемое распределение – нормальное, то оценивают два параметра (математическое ожидание и стандартное отклонение), поэтому r =2 и число степеней свободы k = s -3.

Поскольку односторонний критерий более «жестко» отвергает нулевую гипотезу, чем двусторонний, строят правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости a:

. (3)

Таким образом, правосторонняя критическая область определяется неравенством c ² > c ² _кр (a; k), а область принятия нулевой гипотезы – неравенством c ² < c ² _кр (a; k).

Обозначив значение критерия, вычисленное по данным наблюдений, через c ² _набл формулируют правило проверки нулевой гипотезы следующим образом:

Правило. Для того чтобы на заданном уровне значимости проверить нулевую гипотезу Н ₀: генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия

(4)

и по таблице критических точек распределения c², по заданному уровню значимости a и числу степеней свободы k = s -3 найти критическую точку c²_кр(a; k). Если c²_набл < c²_кр – нет оснований отвергнуть нулевую гипотезу; если c²_набл > c²_кр – нулевую гипотезу отвергают.

Проверку попадания c ²-критерия в критическую область в режиме работы Анализ данных табличного процессора Microsoft Excel проводят при помощи функций ХИ2РАСП и ХИ2ОБР.

1. Функция ХИ2РАСП (x; степени_свободы) рассчитывает c ²-распределение. Аргументы: x: значение, для которого рассчитывается c ²-распределение; степени_свободы: число степеней свободы.

2. Функция ХИ2ОБР (вероятность; степени_свободы) рассчитывает обратное c ²-распределение. Аргументы: вероятность: вероятность, связанная с c ²-распределением (уровень значимости a); степени_свободы: число степеней свободы. Функция ХИ2ОБР использует метод итераций для вычисления значения и производит вычисления, пока не получит результат с точность до ±3× 10^-7.

Для расчета нормального распределения используется функция НОРМРАСП (x; среднее; стандартное_откл; интегральная). Аргументами этой функции являются: x – значение, для которого вычисляется нормальное распределение; среднее – средняя арифметическая распределения; стандартное_откл – стандартное отклонение распределения; интегральная – логическое значение, определяющее форму функции. Если аргумент интегральная =1, то функция НОРМРАСП рассчитывает интегральную функцию распределения; если аргумент интегральная =0 – дифференциальную функцию распределения.

⇐ Предыдущая 1 2 3 4 567 8 9 10 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.