Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Ковариация и регрессия. Построение выборочного уравнения линии регрессии. Методические указания.






 

В приложениях часто требуется оценить характер зависимости между наблюдёнными переменными. Основная задача при этом состоит в выравнивании (сглаживании) экспериментальных данных с помощью специально подобранных кривых, называемых линиями или поверхностями регрессии, которые с большей или меньшей надёжностью характеризуют корреляционную зависимость между наблюдаемыми переменными.

Пусть (X, Y)– двумерный случайный вектор, где случайные величины X и Y являются зависимыми. Зависимость y (x) математического ожидания Y от значения x случайной величины X есть функция регрессии Y на X: E (Y/X=x) =y (x). Можно показать, что случайная величина y (X), где y (x) - функция регрессии Y на X, является наилучшим в среднеквадратичном приближением случайной величины Y функциями от случайной величины X, т.е. математическое ожидание E (Y – f (X))2 минимально при f (x) =y (x).

 
 

 

 


 

Таблица 5. X = -0.05; S 2 = 0, 97

 

 

 

  Приме-чания     å = 1 å = 200   å = 200 å = 209.16
  (1, 5; +¥) 1, 0000 0, 0548     10, 96 5, 84
  (1; 1, 5) 1, 60 0, 9452 0, 0809     16, 18 20, 02
  (0, 5; 1) 1, 08 0, 8643 0, 1386     27, 72 52, 09
(0; 0, 5) 0, 57 0, 7257 0, 1859     37, 18 36, 82
  (-0, 5; 0) 0, 05 0, 5398 0, 2313     46, 26 24, 99
  (-1; -0, 5) -0, 46 0, 3085 0, 1498     29, 96 38, 58
  (-1, 5-1) -0, 98 0, 1587 0, 0919     18, 38 13, 93
  (-2; -1, 5) -1, 49 0, 0668 0, 0440 S= 0, 0666   S= 15 S= 225 13, 32 16, 89
  (-2, 5; -2) -2, 01 0, 0228 0, 0166  
  (-3; -2, 5) -2, 53 0, 0062 0, 0048  
  (-3, 5; -3) -3, 04 0, 0014 0, 0012  
  (-¥; -3, 5) -3, 56 0, 0002 0, 0002  
Интер- валы Z i Ф(Z i) pi ni ni 2 npi ni 2/npi

 

В качестве оценки функции y (x) выбирают, как правило, функции, линейно зависящие от неизвестных параметров, т.е. функцию регрессии ищут в виде:

,

где - известные функции, - подлежащие оценке параметры. Для оценки параметров по выборке (xi, yi), i= 1, 2, …, n используют метод наименьших квадратов. При этом оценка находится как вектор, минимизирующий сумму

.

Необходимым (а в данном случае и достаточным) условием минимума функции S является выполнение равенств

, j= 1, 2 ,..., n,

которые приводят к системе уравнений, линейных относительно .

Простейшей функцией регрессии является линейная функция . В этом случае решение задачи имеет вид

,

где r (X, Y)– коэффициент корреляции X и Y, - среднеквадратичные отклонения X и Y. Функция регрессии при этом задается формулой

. (3)

В свою очередь метод наименьших квадратов приводит к следующему выражению для выборочной функции регрессии

. (4)

Здесь и - оценки математических ожиданий E (XE (Y), - оценки среднеквадратичных отклонений σ (X) и σ (Y), - оценка коэффициента корреляции r (X, Y); т.е. при построении выборочной регрессии при помощи метода наименьших квадратов все моменты в (3) заменяются своими выборочными оценками (см. пособие с. 96-102).

При обработке выборок большого объёма часто предварительно проводят группировку значений Х и Y подобно тому, как это было описано в первой части типового расчёта. При этом для частичных интервалов , i= 1, …, k и , j= 1, …, m определяют число элементов выборки , попавших в прямоугольник , и вычисляют середины интервалов по формулам: , . Все элементы выборки, попавшие в прямоугольник , считают равными (xi*, yj*), причём количество значений xi* будет равно а количество значений yj* будет равно Объём выборки равен Все эти данные заносят в таблицу 6.

 

Таблица 6

yj* xi* y 1 * Y 2 * ym* ni
x 1 * n 11 N 12 n 1 m n 1
x 2 * n 21 N 22 n 2 m n 2
xk* nk 1 Nk 2 nk m nk
Nj n 1 N 2 nm n

 

Для расчёта коэффициентов в выборочном уравнении линии регрессии (4) используют формулы:

, , (5) , , (6)

. (7)

 

В вариантах заданий предлагается таблица группированных данных, на основании которой необходимо найти величины

ni, i= 1, …, k; nj, j= 1, …, m; n;

затем, используя формулы (5), (6), (7) определить точечные оценки математических ожиданий - и , средних квадратичных отклонений - и , коэффициента корреляции - и получить выборочное уравнение линии регрессии (4).

В качестве примера рассмотрим построение выборочного уравнения линии линейной регрессии по таблице группированных данных 7.

 

Таблица 7

yj* xi*           ni
             
             
             
             
             
             
nj           n =200

 

 

По формулам (5) находим

=35, 75, =35, 9;

по формулам (6) находим

11, 06, 12, 09;

по формуле (7) находим

0, 603.

Подставив найденные величины в формулу (4), получим искомое выборочное уравнение линейной регрессии Y на X.

,

или, окончательно,

. (8)

 

Сравним оценки условных математических ожиданий, вычисленные

а) на основе последнего уравнения,

б) по данным таблицы 7, полагая, как и ранее, P (yj*) = pj*=ni j / ni.

Например, при x* = 30 имеем:

а) ;

б) .

Как видно, соответствие удовлетворительное.

Заметим, что уравнения линейной регрессии (3) и выборочной линейной регрессии (4), (8) являются уравнениями, задающими прямую линию.

 

Варианты индивидуальных заданий

yj* xi *        
         
         
         

yj* xi*        
         
         
         

 

Вариант 1 Вариант 2

 

Вариант 3 Вариант 4

yj* xi *        
         
         
         

 

yj* xi *        
         
         
         

 

 

 

Вариант 5 Вариант 6

Yj* xi *        
         
         
         

yj* xi *        
         
         
         

 

 

Вариант 7 Вариант 8

       
 
yj* x i*        
         
         
         

 

 
yj* x i*        
         
         
         

 

 

 


Вариант 9 Вариант 10

 

 

Вариант 9 Вариант 10

 

Yj* xi *        
         
         
         
yj* xi *        
         
         
         

 

Вариант 11 Вариант 12

 

yj* xi *        
         
         
         
Yj* x i*        
         
         
         

 

 

Вариант 13 Вариант 14

 

y* xi *j        
         
         
         
yj* x i*        
         
         
         

 

Вариант 15 Вариант 16

yj* x i*        
         
         
         

yj* xi *        
         
         
         

 

 

Вариант 17 Вариант 18

yj* x i*        
         
         
         

 

yj* x i*        
         
         
         

 

 

Вариант19

 

Вариант 19 Вариант 20

yj* xi *        
         
         
         

yj* xi *        
         
         
         

 

 

Вариант 21 Вариант 22

       
 
yj* x i*        
         
         
         

 

   
yj* xi *        
         
         
         

 

 

 

 


Вариант23

 

 

Вариант 23 Вариант 24

yj* xi *        
         
         
         
yj* xi*        
         
         
         

 

Вариант 25 Вариант 26

yj* xi*        
         
         
         
yj* xi *        
         
         
         

 

 

Вариант 27 Вариант 28

 

yj* xi *        
         
         
         
yj* xi*        
         
         
         

 

Вариант 29 Вариант 30

 

yj* xi*        
         
         
         
yj* xi*        
         
         
         

 

Приложение 1

Приближённые значения функции стандартного нормального распределения , умноженные на 105






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.