Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Статистическое решение и вероятность ошибки






До сих пор под проверкой статистической гипотезы мы подразумевали про­цедуру определения надежности связи (р-уровня, как показателя статистичес­кой значимости). Однако в конечном итоге проверка статистической гипотезы должна заканчиваться принятием статистического решения о том, какая же гипотеза верна: нулевая — об отсутствии связи или альтернативная — о ее нали­чии. Соответственно, от этого зависит и окончательный, содержательный вывод исследования: подтверждена или нет исходная научная гипотеза.

Вполне очевидно, что основанием для принятия исследователем решения о том, какая гипотеза верна, является р-уровень — вероятность того, что вер­на все-таки нулевая гипотеза. Чем меньше р-уровень, тем с большей уверен­ностью можно отклонить Н0 в пользу Н1, тем самым подтвердив исходную содержательную гипотезу. Не менее очевидно и то, что, принимая решение, исследователь всегда допускает вероятность его ошибочности: ведь исследо­вание проведено на выборке, а вывод делается в отношении генеральной со­вокупности. При отклонении Н0 в пользу Н1 исследователь рискует, что связи на самом деле в генеральной совокупности нет. И наоборот, решение в пользу Н0 вовсе не исключает наличие связи. Рассмотрим возможные исходы приня­тия решения в зависимости от действительного положения дел:

В действительности:

Решение исследователя: Отклонить Н0 (принять Н1)  

Н0 истинна Н1 истинна

Неправильное решение, ошибка I рода, вероятность = α   Правильное решение, вероятность = 1 — β (мощность или чувствительность критерия)
Правильное решение, вероятность = 1 — α (доверительная вероятность) Неправильное решение, ошибка II рода, вероятность = β

 

Принять Н0

 

 

Как следует из таблицы, решение исследователя зависит от того, какую ве­роятность ошибки I рода α, он считает допустимой: если р-уровень, получен­ный в процессе проверки гипотезы, меньше или равен α, исследователь отклоняет Н0, и это, как правило, желательный для него результат (содержа­тельная гипотеза подтверждается!). Отметим, что в этом случае вероятность ошибки известна, она меньше или равна α, точнее, равна р-уровню. Если же р-уровень превышает α, то принимается Н0 и содержательная гипотеза не под­тверждается. Но при этом вероятность ошибки II рода β — того, что верна все же Н1 обычно остается неизвестной.

Рассмотрим соотношение ошибок I и II рода. Предположим, как и в прошлых примерах, проверяется гипотеза об отличии среднего значения от некоторой величины А. Нулевой гипотезе Н0: М =А соответствует известное теорети­ческое распределение со средним А. Предположим также, что в генеральной совокупности на самом деле среднее значение больше А и равно В, а исследо­ватель, как обычно, об этом даже и не догадывается. Этому положению дел бу­дет соответствовать свое, «альтернативное» теоретическое распределение, сход­ное с распределением для Н0, но со средним В (рис. 7.3). На рис. 7.3 видно, что с уменьшением α растет «доверительная вероятность» 1 — α, которая определя­ет величину отклонения выборочного среднего от А для принятия Н0: умень­шая α, исследователь увеличивает возможное отклонение выборочного сред­него от А, при котором принимается Н0. Принятие Н0 при больших отклонениях выборочного среднего от А увеличивает вероятность ошибки II рода, β, вероят­ность того, что на самом деле верна альтернативная гипотеза. Таким образом, снижение величины α увеличивает риск допустить ошибку II рода - не обнару­жить различия или связи, которые на самом деле существуют.

Величина (1—α) называется доверительной вероятностью; она задает дове­рительный интервал значений выборочной статистики (в нашем примере — среднего). Если выборочное значение попадает в этот интервал, то гипотеза Н0 не отклоняется.

Вероятность (1—β) называется мощностью (чувствительностью) критерия, Эта величина характеризует статистический критерий (метод, тест) с точки зрения его способности отклонять Н0, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестной.

Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины α, удов­летворяющее двум противоречивым требованиям. Величина α должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Н0. Величина α должна быть достаточно велика, чтобы откло­нить Н0 при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина α является приемлемой, не имеет однозначного отве­та. Есть лишь общие соображения, которыми можно руководствоваться при назначении α для статистического вывода:

- Для установленного значения α вероятность ошибки β уменьшается с ростом объема выборки.

- Вероятность ошибки β уменьшается при увеличении значения α (на­пример, с 0, 01 до 0, 05).

Вопрос о величине α — вопрос о том, при каком же р-уровне исследова­тель может отклонить Н0, решается преимущественно исходя из неформаль­ных соглашений. Традиционная интерпретация различных уровней значи­мости исходит из α = 0, 05 и приведена в табл. 7.1. В соответствии с ней приемлемым для отклонения Н0 признается уровень р < 0, 05. Такая относи­тельно высокая вероятность ошибки I рода может быть рекомендована для небольших выборок (когда высока вероятность ошибки II рода). Если объ­емы выборок около 100 и более объектов, то порог отклонения Н0 целесооб­разно снизить до α = 0, 01 и принимать решение о наличии связи (различий) при р< 0, 01.

Таблица 7, 1

Традиционная интерпретация уровней значимости при α = 0, 05

Уровень значимости Решение Возможный статистический вывод
р> 0, 1   Принимается Н0   «Статистически достоверные разли­чия не обнаружены»
р≤ 0, 1   Сомнения в истинности Н0, неопределенность «Различия обнаружены на уровне ста­тистической тенденции»
р≤ 0, 05   Значимость, отклонение Н0   «Обнаружены статистически досто­верные (значимые) различия»
р≤ 0, 01   Высокая значимость, откло­нение Н0   «Различия обнаружены на высоком уровне статистической значимости»

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.