Вычисление стандартного отклонения

⇐ ПредыдущаяСтр 13 из 25Следующая ⇒

Предупреждаю, что самостоятельное вычисление вам врядли понадобиться, т.к. основные программы обработки данных имеют встроенную функцию вычисления стандартного отклонения. Например, в Microsoft Excel эта функция называется СТАНДОТКЛОН.

Вручную вычислить стандартное отклонение не очень интересно, но полезно для опыта. Стандартное отклонение можно выразить формулой STD=√ [(∑ (x-x)²)/n], что звучит как корень из суммы квадратов разниц между элементами выборки и средним, деленной на количество элементов в выборке.

Если количество элементов в выборке превышает 30, то знаменатель дроби под корнем принимает значение n-1. Иначе используется n.

Пошагово вычисление стандартного отклонения:

1. вычисляем среднее арифметическое выборки данных

2. отнимаем это среднее от каждого элемента выборки

3. все полученные разницы возводим в квадрат

4. суммируем все полученные квадраты

5. делим полученную сумму на количество элементов в выборке (или на n-1, если n> 30)

6. вычисляем квадратный корень из полученного частного (именуемого дисперсией)

Модели линейной регрессии являются вероятностными – только лишь оценками истинных параметров зависимости эндогенной переменной от некоторых экзогенных. Таким образом, нужно проверить, насколько данные оценки верны относительно истинных коэффициентов. Это осуществляется путем проверки:
· статистической значимости коэффициентов регрессии;
· близости расположения фактических данных к рассчитанной линии регрессии.
Оценки коэффициентов регрессии так же, как и ошибка (стохастическая компонента уравнения регрессии), предположительно нормально распределены. Статистическая значимость коэффициентов измеряется степенью вариации вокруг оценочного значения. Для измерения величины вариации нормально распределенных ошибок, остатков используется среднее квадратическое отклонение этих остатков – стандартные ошибки коэффициентов. Для определения степени значимости коэффициентов используется t-критерий. Для того чтобы иметь возможность их определить, нужно узнать оценки их дисперсий и, таким образом, средних квадратических отклонений. После можно проверить гипотезу относительно коэффициентов либо определить для них доверительные интервалы.

Оценки параметров уравнения парной линейной регрессии. Надежность полученных оценок коэффициентов, очевидно, зависит от дисперсии стохастической компоненты уравнения регрессии. Однако по данным выборки значений переменных модели дисперсия не может быть оценена, то при анализе надежности оценок коэффициентов регрессии используется дисперсия отклонений эмпирических значений переменной Y от рассчитанных на основе полученного уравнения: еi = Yi – a – bxi.

Для t-статистики проверяется гипотеза о равенстве ее нулю. t = 0 будет означать b = 0. При оценке коэффициента линейной регрессии можно использовать следующее грубое правило. Если стандартная ошибка коэффициента больше его модуля, то он не может быть признан «хорошим», значимым, поскольку доверительная вероятность при двусторонней альтернативной гипотезе составляет менее приблизительно 0, 7. Если стандартная ошибка меньше модуля коэффициента, но больше его половины, то данная оценка коэффициента может рассматриваться как более или менее значимая Несомненно, определенную роль играет количество наблюдений: чем их больше, тем надежнее при прочих равных условиях выводы о наличии связи и тем меньше граница доверительного интервала для данного числа степеней свободы и уровня значимости.

Для осуществления проверки значимости оценок коэффициентов регрессии нужно решить, будет ли она односторонней или двусторонней. Выбор определяется теоретическим обоснованием модели связи зависимой и независимой переменных. При этом односторонняя проверка предполагает, что характер связи между X и Y однозначен: либо связь отрицательна, либо положительна, но не одновременно. При двусторонней проверке исходят из предположения, что связь между X и Y может быть как положительной, так и отрицательной.

С помощью рассчитанных стандартных отклонений и значений t-статистики можно определить доверительный интервал значений с заданной доверительной вероятностью. Предполагаемые значения будут находиться в рамках этого интервала, если же нет, то придется отвергнуть предположение, выдвинутое относительно величины: b – Sb• tкрит < b + Sb• tкрит, a – S• tкрит < a + S• tкрит

Как уже упоминалось ранее, коэффициенты a и b являются лишь оценками коэффициентов, представляют собой параметры линии регрессии для генеральной совокупности значений переменных X и Y, включающей все возможные их значения, а a и b являются параметрами регрессии для выборочной совокупности значений X и Y, которые непосредственно известны нам на основе некоторого числа наблюдений. Для другой выборки значений X и Y, возможно, будут найдены другие оценки, однако предполагается, что их значения будут варьироваться в пределах стандартных отклонений величин a и b. Если учесть, что не все выборочные значения Y лежат на линии регрессии Yi = a + bxi, то в это уравнение надо добавить выборочные случайные отклонения еi = Yi – a – bxi, аналогичные стохастической компоненте в генеральной совокупности: Yi = a + bxi + еi

⇐ Предыдущая 8 9 10 11 121314 15 16 17 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.