Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Программных средств Microsoft Excel






1. Для целей регрессионного анализа используется линейная модель множественной регрессии, имеющей вид:

 

= а0 + а1х1 + а2х2 + … аnxn,...........................(2)

 

где: – среднемесячная выработка одного рабочего, занятого на СМР;

а0 – свободный член уравнения (характеризует постоянную «нераспределенную» часть вне зависимости от воздействия факторных признаков);

а1…аn – коэффициенты регрессии, характеризующие изменение выработки от изменения каждого факторного признака на единицу фиксированных значений остальных факторов;

x1…xn – факторные признаки (независимые переменные).

Построение корреляционной матрицы осуществляется с помощью средств пакета анализа программного продукта Excel (Сервис→ Анализ данных→ Корреляция).

При выполнении работы используются инструменты «Пакета анализа» Excel «Корреляция», «Регрессия». При этом, в учебных целях, в работе могут быть использованы не все показатели, рассчитанные с помощью названных инструментов. При использовании инструмента «Корреляция» в работе используются коэффициенты регрессии и прогнозные значения результирующего признака. Все остальные показатели, необходимые для достижения поставленных в работе целей, должны быть рассчитаны с помощью формул, которые приведены в методических указаниях к выполнению работы.

2. На основе расчетных значений коэффициентов корреляции корреляционной матрицы, полученных в ходе выполнения пункта 1, следует оценить их статическую значимость и проверку наличия мультиколлинеарности. Отбор независимых переменных для исключения их из дальнейшего анализа производится если:

· теснота связи Rxx≥ 0, 85 (в этом случае одна из независимых переменных, связь которой с зависимой слабее, исключается);

· знак коэффициента корреляции Ryx не отвечает известному экономическому содержанию связи между зависимой и независимой переменными (или студент испытывает затруднения с интерпретацией полученной связи);

· теснота статистической связи Ryx статически несущественна.

Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального.

При линейной однофакторной связи t-критерий можно рассчитать по формуле:

.......................................(3)

где (n - 2) – число степеней свободы при заданном уровне значимости α и объеме выборки n (число первоначальных наблюдений = 48).

Полученное значение tрасч сравнивают с табличным (Приложение №4) значением t-критерия (для α = 0, 05 с n-2 степенями свободы). Если рассчитанное значение tрасч превосходит табличное значение критерия tтабл, то практически невероятно, что найденное значение обусловлено только случайными колебаниями (то есть отклоняется гипотеза о его случайности).

После проведения корреляционного анализа, в соответствии с пунктами 1 – 2 количество факторных признаков, которые будут использоваться в дальнейшей работе может сократиться.

3. Построение множественной регрессии с помощью средств пакета анализа программного продукта Excel (Сервис→ Анализ данных→ Регрессия).

4. В целях возможного отсева грубых погрешностей, в составе исходных данных массива наблюдений, определяются и анализируются отклонения фактических значений зависимой переменной Y от прогноза по регрессии. Если выявленное отклонение превышает тройное среднеквадратическое отклонение уравнения регрессии, то данное наблюдение необходимо исключить, после чего вновь выполняется построение регрессии.

Среднеквадратическое отклонение необходимо рассчитать по формуле:

........................................(4)

 

где n – количество наблюдений,

y – значения результирующего признака в соответствии с исходными данными,

- прогнозное значения результирующего признака.

Исключение наблюдений производится до тех пор, пока фактическое значение переменной Y от прогноза по регрессии не будет превышать тройное среднеквадратическое отклонение по уравнению регрессии.

5. Окончательная проверка значимости всех факторов, включаемых в уравнение регрессии проводится в результате многошагового регрессионного анализа, в ходе которого проверяется значимость каждого фактора в отдельности при одновременном определении каждого коэффициента регрессии, путем вычисления отношения:

 

................................................(5)

 

где ak – коэффициент множественной регрессии k-го фактора;

- среднеквадратическое отклонение k-го фактора.

Среднеквадратическое отклонение каждого факторного признака множественной регрессии рассчитывается по формуле:

 

...............................................................(6)

 

где x - значение факторного признака в соответствии с исходными данными;

- среднеарифметическое значение факторного признака.

Значение рассчитывается для всех факторов, входящих в состав уравнения множественной регрессии, за исключением тех факторов, которые были поочередно (по одному) исключены из уравнения регрессии на предыдущих этапах работы по разным причинам:

· если отношение меньше табличного tα , ν , найденного по таблице t-распределения Стьюдента (Приложение №4) с α = 0, 05 и ν = n-m-1 (n – число наблюдений, m - число объясняющих переменных), то с вероятностью 95% рассматриваемый факторный признак является в уравнении регрессии незначимым с n-m-1 степенями свободы;

· если отношение меньше табличного одновременно для нескольких факторов, то незначимые факторы исключаются из уравнения множественной регрессии поочередно по одному, начиная с того факторного признака у которого отношение минимальное. После исключения каждого факторного признака необходимо заново построить регрессию, поскольку ранее незначимые факторы могут стать значимыми после исключения одного из них;

· процесс исключения повторяется до тех пор, пока для всех факторных признаков будет выполняться неравенство ≥ tα , ν , что свидетельствует о том, что все факторы значимы.

6. Окончательная оценка статистической значимости полученного уравнения множественной регрессии в целом производится с учетом статистики F- распределения Фишера:

.............................................(7)

 

где B – исчисленный коэффициент детерминации множественной регрессии;

n – количество наблюдений, оставшихся в ходе построения регрессии;

m – количество учитываемых объясняющих переменных.

Коэффициент детерминации рассчитывается по формуле:

 

...........................................................(8)

 

Полученное значение F сравнивается с табличным значением F-распределения Фишера (Приложение №4). Если F≥ Fα, то с вероятностью 95 % связь по уравнению регрессии является статистически значимой и нулевая гипотеза отвергается.

В результате многошагового корреляционно-регрессионного анализа необходимо получить статистически значимое уравнение множественной регрессии вида:

 

= а0 + а1х1 + а2х2 + … аnxn....................................................(9)

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.