Разделы сайта

Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Ковариация и регрессия. Построение выборочного уравнения линии регрессии. Методические указания.

⇐ ПредыдущаяСтр 3 из 4Следующая ⇒

В приложениях часто требуется оценить характер зависимости между наблюдёнными переменными. Основная задача при этом состоит в выравнивании (сглаживании) экспериментальных данных с помощью специально подобранных кривых, называемых линиями или поверхностями регрессии, которые с большей или меньшей надёжностью характеризуют корреляционную зависимость между наблюдаемыми переменными.

Пусть (X, Y)– двумерный случайный вектор, где случайные величины X и Y являются зависимыми. Зависимость y (x) математического ожидания Y от значения x случайной величины X есть функция регрессии Y на X: E (Y/X=x) =y (x). Можно показать, что случайная величина y (X), где y (x) - функция регрессии Y на X, является наилучшим в среднеквадратичном приближением случайной величины Y функциями от случайной величины X, т.е. математическое ожидание E (Y – f (X))² минимально при f (x) =y (x).

Таблица 5. X = -0.05; S ² = 0, 97

Приме-чания

å = 1

å = 200

å = 209.16

(1, 5; +¥)

+¥

1, 0000

0, 0548

10, 96

5, 84

(1; 1, 5)

1, 60

0, 9452

0, 0809

16, 18

20, 02

(0, 5; 1)

1, 08

0, 8643

0, 1386

27, 72

52, 09

(0; 0, 5)

0, 57

0, 7257

0, 1859

37, 18

36, 82

(-0, 5; 0)

0, 05

0, 5398

0, 2313

46, 26

24, 99

(-1; -0, 5)

-0, 46

0, 3085

0, 1498

29, 96

38, 58

(-1, 5-1)

-0, 98

0, 1587

0, 0919

18, 38

13, 93

(-2; -1, 5)

-1, 49

0, 0668

0, 0440

S= 0, 0666

S= 15

S= 225

13, 32

16, 89

(-2, 5; -2)

-2, 01

0, 0228

0, 0166

(-3; -2, 5)

-2, 53

0, 0062

0, 0048

(-3, 5; -3)

-3, 04

0, 0014

0, 0012

(-¥; -3, 5)

-3, 56

0, 0002

Интер- валы

Z_i

Ф(Z_i)

p_i

n_i

n_i²

np_i

n_i²/np_i

В качестве оценки функции y (x) выбирают, как правило, функции, линейно зависящие от неизвестных параметров, т.е. функцию регрессии ищут в виде:

где - известные функции, - подлежащие оценке параметры. Для оценки параметров по выборке (x_i, y_i), i= 1, 2, …, n используют метод наименьших квадратов. При этом оценка находится как вектор, минимизирующий сумму

Необходимым (а в данном случае и достаточным) условием минимума функции S является выполнение равенств

, j= 1, 2 ,..., n,

которые приводят к системе уравнений, линейных относительно .

Простейшей функцией регрессии является линейная функция . В этом случае решение задачи имеет вид

где r (X, Y)– коэффициент корреляции X и Y, - среднеквадратичные отклонения X и Y. Функция регрессии при этом задается формулой

. (3)

В свою очередь метод наименьших квадратов приводит к следующему выражению для выборочной функции регрессии

. (4)

Здесь и - оценки математических ожиданий E (X)и E (Y), - оценки среднеквадратичных отклонений σ (X) и σ (Y), - оценка коэффициента корреляции r (X, Y); т.е. при построении выборочной регрессии при помощи метода наименьших квадратов все моменты в (3) заменяются своими выборочными оценками (см. пособие с. 96-102).

При обработке выборок большого объёма часто предварительно проводят группировку значений Х и Y подобно тому, как это было описано в первой части типового расчёта. При этом для частичных интервалов , i= 1, …, k и , j= 1, …, m определяют число элементов выборки , попавших в прямоугольник , и вычисляют середины интервалов по формулам: , . Все элементы выборки, попавшие в прямоугольник , считают равными (x_i*, y_j*), причём количество значений x_i* будет равно а количество значений y_j* будет равно Объём выборки равен Все эти данные заносят в таблицу 6.

Таблица 6

y_j* x_i*	y ₁ *	Y ₂ *	…	y_m*	n_i
x ₁ *	n ₁₁	N ₁₂	…	n _{1 m}	n ₁
x ₂ *	n ₂₁	N ₂₂	…	n _{2 m}	n ₂
…	…	…	…	…	…
x_k*	n_k ₁	N_k ₂	…	n_{k m}	n_k
N_j	n ₁	N ₂	…	n_m	n

Для расчёта коэффициентов в выборочном уравнении линии регрессии (4) используют формулы:

, , (5) , , (6)

. (7)

В вариантах заданий предлагается таблица группированных данных, на основании которой необходимо найти величины

n_i, i= 1, …, k; n_j, j= 1, …, m; n;

затем, используя формулы (5), (6), (7) определить точечные оценки математических ожиданий - и , средних квадратичных отклонений - и , коэффициента корреляции - и получить выборочное уравнение линии регрессии (4).

В качестве примера рассмотрим построение выборочного уравнения линии линейной регрессии по таблице группированных данных 7.

Таблица 7

y_j* x_i*						n_i






n_j						n =200

По формулам (5) находим

=35, 75, =35, 9;

по формулам (6) находим

11, 06, 12, 09;

по формуле (7) находим

0, 603.

Подставив найденные величины в формулу (4), получим искомое выборочное уравнение линейной регрессии Y на X.

или, окончательно,

. (8)

Сравним оценки условных математических ожиданий, вычисленные

а) на основе последнего уравнения,

б) по данным таблицы 7, полагая, как и ранее, P (y_j^*) = p_j^*=n_i _j/ n_i.

Например, при x* = 30 имеем:

а) ;

б) .

Как видно, соответствие удовлетворительное.

Заметим, что уравнения линейной регрессии (3) и выборочной линейной регрессии (4), (8) являются уравнениями, задающими прямую линию.

Варианты индивидуальных заданий

y_j* x_i *

y_j* x_i*

Вариант 1 Вариант 2

Вариант 3 Вариант 4

y_j* x_i *

y_j* x_i *

Вариант 5 Вариант 6

Y_j* x_i *

y_j* x_i *

Вариант 7 Вариант 8

y_j* x _i*

y_j* x _i*

Вариант 9 Вариант 10

Вариант 9 Вариант 10

Y_j* x_i *

y_j* x_i *

Вариант 11 Вариант 12

y_j* x_i *

Y_j* x _i*

Вариант 13 Вариант 14

y* x_i *_j

y_j* x _i*

Вариант 15 Вариант 16

y_j* x _i*

y_j* x_i *

Вариант 17 Вариант 18

y_j* x _i*

y_j* x _i*

Вариант19

Вариант 19 Вариант 20

y_j* x_i *

y_j* x_i *

Вариант 21 Вариант 22

y_j* x _i*

y_j* x_i *

Вариант23

Вариант 23 Вариант 24

y_j* x_i *

y_j* x_i*

Вариант 25 Вариант 26

y_j* x_i*

y_j* x_i *

Вариант 27 Вариант 28

y_j* x_i *

y_j* x_i*

Вариант 29 Вариант 30

y_j* x_i*

y_j* x_i*

Приложение 1

Приближённые значения функции стандартного нормального распределения , умноженные на 10⁵

⇐ Предыдущая 1 234 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.