Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Оценка значимости коэффициента корреляции и коэффициентов уравнений регрессии.
Оценка значимости коэффициента корреляции Поскольку коэффициент корреляции r определяется по данным случайной выборки, то он может отличаться от коэффициента корреляции r, который соответствует генеральной совокупности. В случае, когда объем выборки N ³ 20, то предполагают, что коэффициент корреляции является случайной величиной, распределенной по нормальному закону. Пусть sr – среднеквадратичное отклонение выборочного коэффициента корреляции r. Тогда при N ³ 20 доверительный интервал для r будет равен (r - xpsr, r + xpsr), где хр– параметр нормального распределения вероятностей: . Значение хр определяется по таблице функции распределения Ф(х) в зависимости от вероятности Р. Для оперативного определения значения хр при Р ³ 0, 9, можно использовать таблицу 2. Таблица 2.
Значение среднеквадратичного отклонения sr можно определить по формуле . Подставим в доверительный интервал вместо неизвестной величины r его оценку по выборке r и sr. Тогда . Для проверки значимости выборочного коэффициента корреляции r чаще используется так называемая нулевая гипотеза: H0: r = 0 (H1: r ¹ 0). Суть нулевой гипотезы состоит в том, что в случае, когда для случайных величин х и y на основании выборок и получено½ r½ > 0, т.е. между ними имеется корреляционная связь, предполагается, что в генеральной совокупности этой связи нет (H0: r = 0). При r = 0, получим: . При проверке нулевой гипотезы достаточно использовать только левый (нижний) предел доверительного интервала . Так как r = 0, то . Данное условие означает, что нулевая гипотеза с вероятностью Ф(хр) подтверждается. Если , то нулевая гипотеза с вероятностью Ф(хр) отвергается, а, следовательно, связь между х и y имеет место. В тех случаях, когда размер выборки N< 30, для проверки нулевой гипотезы (r = 0) используется t – критерий Стьюдента. Алгоритм использования t – критерия Стьюдента 1. а) Для анализа значимости коэффициента корреляции определяется расчетное значение по формуле (если N< 30) (если N> 30) б) Для анализа значимости частного коэффициента корреляции определяется расчетное значение tрасч . по формуле: , где - частный коэффициент корреляции, k – номер частного коэффициента корреляции (k – число исключенных факторов). в) Для анализа значимости корреляционного отношения определяется расчетное значение tрасч . по формуле:
2. По таблице критических точек распределения Стьюдента по значению числа степеней свободы k = N - n (n – число параметров) и уровню значимости a (уровень значимости - это вероятность совершить ошибку первого рода, т.е. отвергнуть правильную нулевую гипотезу) определяется теоретическое значение tтеор. (критическая точка). Таблица 3. Таблица критических точек для a=5%
Рис.1.
Если ½ tрасч½ £ tтеор., то нулевая гипотеза Н0 принимается (r = 0), если ½ tрасч½ > tтеор., то Н0 – отвергается (r ¹ 0), следовательно, случайные величины х и y коррелированы, то есть между ними существует линейная связь, следовательно: a) коэффициент корреляции r значим; b) частный коэффициент корреляции значим;
c) корреляционное отношение значимо. Оценка значимости коэффициентов уравнений регрессии В общем случае значимость коэффициентов уравнений регрессии определяется с помощью t – критерия Стьюдента.
|