Разделы сайта

Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Программных средств Microsoft Excel

⇐ ПредыдущаяСтр 3 из 15Следующая ⇒

1. Для целей регрессионного анализа используется линейная модель множественной регрессии, имеющей вид:

= а₀ + а₁х₁ + а₂х₂ + … а_nx_n,...........................(2)

где: – среднемесячная выработка одного рабочего, занятого на СМР;

а₀ – свободный член уравнения (характеризует постоянную «нераспределенную» часть вне зависимости от воздействия факторных признаков);

а₁…а_n – коэффициенты регрессии, характеризующие изменение выработки от изменения каждого факторного признака на единицу фиксированных значений остальных факторов;

x₁…x_n – факторные признаки (независимые переменные).

Построение корреляционной матрицы осуществляется с помощью средств пакета анализа программного продукта Excel (Сервис→ Анализ данных→ Корреляция).

При выполнении работы используются инструменты «Пакета анализа» Excel «Корреляция», «Регрессия». При этом, в учебных целях, в работе могут быть использованы не все показатели, рассчитанные с помощью названных инструментов. При использовании инструмента «Корреляция» в работе используются коэффициенты регрессии и прогнозные значения результирующего признака. Все остальные показатели, необходимые для достижения поставленных в работе целей, должны быть рассчитаны с помощью формул, которые приведены в методических указаниях к выполнению работы.

2. На основе расчетных значений коэффициентов корреляции корреляционной матрицы, полученных в ходе выполнения пункта 1, следует оценить их статическую значимость и проверку наличия мультиколлинеарности. Отбор независимых переменных для исключения их из дальнейшего анализа производится если:

· теснота связи Rxx≥ 0, 85 (в этом случае одна из независимых переменных, связь которой с зависимой слабее, исключается);

· знак коэффициента корреляции Ryx не отвечает известному экономическому содержанию связи между зависимой и независимой переменными (или студент испытывает затруднения с интерпретацией полученной связи);

· теснота статистической связи Ryx статически несущественна.

Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального.

При линейной однофакторной связи t-критерий можно рассчитать по формуле:

.......................................(3)

где (n - 2) – число степеней свободы при заданном уровне значимости α и объеме выборки n (число первоначальных наблюдений = 48).

Полученное значение t_расч сравнивают с табличным (Приложение №4) значением t-критерия (для α = 0, 05 с n-2 степенями свободы). Если рассчитанное значение t_расч превосходит табличное значение критерия t_табл, то практически невероятно, что найденное значение обусловлено только случайными колебаниями (то есть отклоняется гипотеза о его случайности).

После проведения корреляционного анализа, в соответствии с пунктами 1 – 2 количество факторных признаков, которые будут использоваться в дальнейшей работе может сократиться.

3. Построение множественной регрессии с помощью средств пакета анализа программного продукта Excel (Сервис→ Анализ данных→ Регрессия).

4. В целях возможного отсева грубых погрешностей, в составе исходных данных массива наблюдений, определяются и анализируются отклонения фактических значений зависимой переменной Y от прогноза по регрессии. Если выявленное отклонение превышает тройное среднеквадратическое отклонение уравнения регрессии, то данное наблюдение необходимо исключить, после чего вновь выполняется построение регрессии.

Среднеквадратическое отклонение необходимо рассчитать по формуле:

........................................(4)

где n – количество наблюдений,

y – значения результирующего признака в соответствии с исходными данными,

- прогнозное значения результирующего признака.

Исключение наблюдений производится до тех пор, пока фактическое значение переменной Y от прогноза по регрессии не будет превышать тройное среднеквадратическое отклонение по уравнению регрессии.

5. Окончательная проверка значимости всех факторов, включаемых в уравнение регрессии проводится в результате многошагового регрессионного анализа, в ходе которого проверяется значимость каждого фактора в отдельности при одновременном определении каждого коэффициента регрессии, путем вычисления отношения:

................................................(5)

где a_k – коэффициент множественной регрессии k-го фактора;

- среднеквадратическое отклонение k-го фактора.

Среднеквадратическое отклонение каждого факторного признака множественной регрессии рассчитывается по формуле:

...............................................................(6)

где x - значение факторного признака в соответствии с исходными данными;

- среднеарифметическое значение факторного признака.

Значение рассчитывается для всех факторов, входящих в состав уравнения множественной регрессии, за исключением тех факторов, которые были поочередно (по одному) исключены из уравнения регрессии на предыдущих этапах работы по разным причинам:

· если отношение меньше табличного t_α_,_ν, найденного по таблице t-распределения Стьюдента (Приложение №4) с α = 0, 05 и ν = n-m-1 (n – число наблюдений, m - число объясняющих переменных), то с вероятностью 95% рассматриваемый факторный признак является в уравнении регрессии незначимым с n-m-1 степенями свободы;

· если отношение меньше табличного одновременно для нескольких факторов, то незначимые факторы исключаются из уравнения множественной регрессии поочередно по одному, начиная с того факторного признака у которого отношение минимальное. После исключения каждого факторного признака необходимо заново построить регрессию, поскольку ранее незначимые факторы могут стать значимыми после исключения одного из них;

· процесс исключения повторяется до тех пор, пока для всех факторных признаков будет выполняться неравенство ≥ t_α_,_ν, что свидетельствует о том, что все факторы значимы.

6. Окончательная оценка статистической значимости полученного уравнения множественной регрессии в целом производится с учетом статистики F- распределения Фишера:

.............................................(7)

где B – исчисленный коэффициент детерминации множественной регрессии;

n – количество наблюдений, оставшихся в ходе построения регрессии;

m – количество учитываемых объясняющих переменных.

Коэффициент детерминации рассчитывается по формуле:

...........................................................(8)

Полученное значение F сравнивается с табличным значением F-распределения Фишера (Приложение №4). Если F≥ Fα, то с вероятностью 95 % связь по уравнению регрессии является статистически значимой и нулевая гипотеза отвергается.

В результате многошагового корреляционно-регрессионного анализа необходимо получить статистически значимое уравнение множественной регрессии вида:

= а₀ + а₁х₁ + а₂х₂ + … а_nx_n_{....................................................}(9)

⇐ Предыдущая 1 234 5 6 7 8 9 10 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.