Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Корреляционно-регрессионный анализ






Практическая работа №3

ЗАДАНИЕ НА ПРАКТИЧЕСКУЮ РАБОТУ

1. Подготовить исходные данные для анализа

2. Построить уравнение парной линейной регрессии.

3. Измерить тесноту связи.

4. Проверить на значимость коэффициенты регрессии

5. Построить уравнение множественной регрессии.

6. Измерить тесноту связи.

7. Проверить на значимость коэффициенты множественной регрессии.

 

СОДЕРЖАНИЕ РАБОТЫ

1. Подготовка исходных данных

На основании данных Приложения А сформировать уточнённые исходные данные, сформировав таблицу 6:

Таблица 6

№ п/п Субъект РФ Региональное таможенное управление Объём экспорта Объём импорта Сальдо
           
           
           

 

Далее следует провести двойную группировку по объемам экспорта и импорта и выделить наибольшую группу выборки. Эта группа и будет необходима для последующего анализа. Названия РТУ следует заменить соответствующим номером:

Таблица 7

Центральное  
Северо-западное  
Южное  
Приволжское  
Уральское  
Сибирское  
Дальневосточное  
Северо-кавказское  

Определите фактор, оказывающий влияние (x) и результативный признак (y). В данном случае фактором будет столбец «Региональное таможенное управление», а результативным признаком – Объём экспорта и импорта (по отдельности). Т.о. необходимо будет построить и проанализировать 2 уравнения регрессии.

Для построения уравнения регрессии воспользуемся Пакетом анализа: Данные – Анализ данных – Регрессия. Если строки Анализ данных в Данных нет, то надо предварительно выполнить следующие действия: Файл – Параметры – Надстройки – Пакет анализа – Перейти – Анализ данных (отметить флажком).

В окне Регрессия:

Входной интервал Х – это столбец данных, определенных вами как фактор (причина); Входной интервал Y – это столбец данных, определенных вами как результат. Выходной интервал – несколько чистых ячеек на том же листе, где находятся исходные данные, или на отдельном листе. В результате получаем таблицу расчетов (см. пример в таблице 8).

Таблица 8. «Вывод итогов»

Регрессионная статистика  
Множественный R 0, 502621  
R-квадрат 0, 252628  
Нормированный R-квадрат 0, 159206  
Стандартная ошибка 25, 16016  
Наблюдения    
Дисперсионный анализ  
  df SS MS F Значимость F
Регрессия   1711, 83 1711, 83 2, 704169 0, 138707
Остаток   5064, 27 633, 0337    
Итого   6776, 1      
  Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 18, 37277 19, 30663 0, 95163 0, 369146
Переменная x1 0, 533713 0, 324557 1, 644436 0, 138707
                   

 

2. Из таблицы берем значения коэффициентов регрессии и получаем уравнение: у = 18, 37277 + 0, 533713 х1 (коэффициенты при y – пересечении и переменной x1).

3. Проверка на значимость заключается в проверке гипотезы Н0: а0 = 0, т.е. проверке гипотезы о статистической незначимости проверяемого параметра а0, другими словами, проверки вывода о том, что проверяемый параметр сформировался под влиянием случайных причин, а не в результате достаточно сильного влияния, т.е. закономерности. При этом уровень значимости представляет собой вероятность ошибки отклонения правильной гипотезы. Договоримся, что допустимый уровень значимости при выполнении практической работы примем равным 0, 05 или 5%.

Проверку значимости коэффициентов уравнения можно сделать по таблице 8, где кроме значений t -статистики, дан уровень значимости t -статистики (графа «Р- Значение»). Если уровень значимости, приведенный в таблице, не превышает 0, 05 (5%), делаем вывод, что проверяемый коэффициент значим и наоборот. В таблице уровень значимости (Р -значение t -статистики при Y -пересечении) равен 0, 369146, что значительно превышает уровень 0, 05 или 5%. Делаем вывод о том, что гипотезу о незначимости коэффициента регрессии а0 принимаем. Аналогично проверяем гипотезу о незначимости параметра b1 (при переменной x1).

Поскольку оба значения ошибки гораздо больше 5%, гипотеза о незначимости коэффициентов уравнения, следовательно и самого уравнения регрессии, принимается. Коэффициент a0 может быть принят лишь с вероятностью (1–0, 369146) или 63%, коэффициент b1 – с вероятностью (1-0, 138707) или 88%.

 

4. Оценку тесноты связи делаем по R – квадрат.

R – квадрат измеряет тесноту связи через отношение дисперсий результативного признака. Чем ближе R –квадрат к 0, тем слабее связь между x и y, чем ближе R –квадрат с 1, тем сильнее связь.

5. Определите факторы, оказывающие влияние и обозначьте их (x1, x2, …..xk). Определите результативный признак (y). В данном случае факторами будут столбцы Региональное таможенное управление, Объем экспорта, Объём импорта, а результативным признаком – столбец Сальдо.

Для построения уравнения регрессии воспользуемся Пакетом анализа MS Ехсеl: Данные – Анализ данных – Регрессия. В окне Регрессия:

Входной интервал Х – это столбцы данных, определенных вами как факторы (выделяются единым массивом); Входной интервал Y – это столбец данных, определенных вами как результат. Выходной интервал – несколько чистых ячеек на том же листе, где находятся исходные данные, или на отдельном листе. В результате получаем таблицу расчетов (см. пример в таблице 9).

Таблица 9. «Вывод итогов »

Регрессионная статистика  
Множественный R 0, 502621  
R-квадрат 0, 252628  
Нормированный R-квадрат 0, 159206  
Стандартная ошибка 25, 16016  
Наблюдения    
Дисперсионный анализ  
  df SS MS F Значимость F
Регрессия   1711, 83 1711, 83 0, 455188 0, 769029
Остаток   5064, 27 633, 0337    
Итого   6776, 1      
  Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 22, 80765 19, 30663 0, 351022 0, 739878
Переменная x1 0, 469454 0, 324557 0, 812186 0, 453601
Переменная x2 0, 119464 36, 14581 0, 226852 0, 829522
Переменная x3 19, 47716 0, 023568 2, 692154 0, 017188
Переменная x4 10, 17820 0, 014578 2, 811450 0, 005123
                   

 

Из таблицы берем значения коэффициентов регрессии и получаем уравнение:

y =22, 80765+0, 469454 x1 +0, 119464 x2 +19, 47716 x3 -10, 1782 x4 (коэффициенты при y – пересечении и переменных x1, x2, x3, x4.

 

6. Проверка на значимость заключается в проверке гипотезы о статистической незначимости проверяемых параметров, или проверки вывода о том, что проверяемый параметр сформировался под влиянием случайных причин, а не в результате достаточно сильного влияния, т.е. закономерности. При этом уровень значимости представляет собой вероятность ошибки отклонения правильной гипотезы. Договоримся, что допустимый уровень значимости при выполнении практической работы примем равным 0, 05 или 5%.

Проверка значимости коэффициентов уравнения проводится аналогично шагу 3.

 

7. Оценку тесноты связи делаем аналогично шагу 4 по показателю R – квадрат.

Нормированный R –квадрат дает скорректированную оценку коэффициента детерминации, т.е. долю вариации результата за счет включенных в уравнение регресии факторов в общей вариации результата с учетом степеней свободы общей и остаточной дисперсии. R –квадрат представляет собой нескорректированную оценку тесноты связи (без учета числа степеней свободы).

Различия между скорректированной и нескорректированной оценкой становятся важными, если мы должны сравнивать между собой модели с различным числом факторов. Сопоставлять уравнения регрессии с различным числом факторных признаков можно только по скорректированным значениям (Нормированный R - квадрат).


Приложение А






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.