Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Математико-статистические идеи метода. Исходным положением линейного МРА является возможность представления значений «зависимой» переменной y через значения «независимых» переменных х1






 

Исходным положением линейного МРА является возможность представления значений «зависимой» переменной Y через значения «независимых» переменных х1, х2,..., хР в виде линейного уравнения:

 

 

где b — свободный член (Intercept), bb..., bP — bкоэффициенты регрессии (Unstandardized Coefficients), eошибка оценки (Residual). Коэффициенты рег­рессии вычисляются методом наименьших квадратов при решении системы из линейных уравнений, с минимизацией ошибки е.

После вычисления регрессионных коэффициентов по значениям независимых переменных для каждого из объектов могут быть вычислены оценки зависимой переменной Y (Predicted Values):

(15.2)

Сопоставление значений зависимой переменной Yi c их оценками , по вы­борке испытуемых, для которых значения Yi, известны, называется анализом остатков или ошибок (residual analysis). Он позволяет оценить возможные погрешности предсказания. Значения оценок могут быть вычислены и для испы­туемых, истинные значения зависимой переменной для которых неизвестны.

Далее можно вычислить коэффициент корреляции Пирсона между извест­ными значениями «зависимой» переменной и ее оценками. Это один из спо­собов получения коэффициента множественной корреляции (КМК) между «зависимой» и «независимыми» переменными. Коэффициент множественной корреляции — это мера линейной связи одной переменной с множеством других переменных; принимает положительные значения от 0 (отсутствие связи) до 1 (строгая прямая связь). КМК наряду с разностями между исходными и оцененными значениями «зависимой» переменной (ошибки е) — основные показатели качества модели множественной регрессии.

Если «зависимая» и «независимые» переменные представлены в z -значениях, то уравнение регрессии принимает вид:

 

(15.3)

 

где стандартные коэффициенты регрессии, или -коэффициенты (Standardized Coefficients).

Стандартные коэффициенты регрессии связаны с исходными корреляциями следующим уравнением (в матричной форме):

(15.4)

 

где В — вектор-столбец стандартных коэффициентов регрессии, — матрица, обратная корреляционной матрице «независимых» переменных, А — вектор-столбец корреляций «независимых» переменных с «зависимой» переменной. На практике регрессионный анализ начинается именно с вычисле­ния стандартных коэффициентов регрессии.

Напомним, что в случае двумерной регрессии — при наличии всего одной независимой переменной, уравнение 15.3 имеет вид:

 

 

то есть стандартный коэффициент регрессии равен коэффициенту корреля­ции зависимой и независимой переменных.

Знак -коэффициента соответствует знаку корреляции данной независимой и зависимой переменной. При наличии двух и более независимых пе­ременных абсолютная величина -коэффициент зависит не только от корреляции данной независимой и зависимой переменных, но и от величин и знаков корреляций этой независимой переменной с другими независимыми переменными. Если данная независимая переменная никак не связана с другими независимыми переменными, то -коэффициент, как и в двумер­ном случае, равен ее корреляции с зависимой переменной. Чем больше -коэффициент по абсолютной величине, тем выше относительное влияние данной независимой переменной (с учетом влияния других независимых переменных), то есть тем выше информативность (уникальность) данной переменной для предсказания зависимой переменной. Статистические программы МРА (например, SPSS) оценивают p -уровень значимости каждого -коэффициента.

Следует отметить, что взаимовлияние (системный эффект) независимых переменных может как уменьшать, так и увеличивать абсолютную величину -коэффициентов (и их уровень значимости).

Произведение коэффициента и коэффициента корреляции данной независимой и зависимой переменной — это вклад переменной i в диспер­сию зависимой переменной.

Если зависимая переменная в z -значениях (дисперсия равна 1), то эта единичная дисперсия «зависимой» переменной DY может быть выражена форму­лой:

где De часть дисперсии, обусловленная влиянием неучтенных факторов, или дисперсия ошибки предсказания.

Часть дисперсии «зависимой» переменной, обусловленная влиянием «независимых» переменных, — это коэффициент множественной детерминации (КМД), который равен коэффициенту множественной корреляции в квадра­те или R2:

 

 

Соответственно, второй способ вычленить КМК:

 

 

Интерпретация КМДочевидна: это та часть дисперсии «зависимой» переменной, которая определяется «независимыми» переменными. Следователь­но, (1 – КМД) — это дисперсия ошибки оценки. Например, если КМК= 0, 8, то КМД = (КМК)2 = 0, 64. Это означает, что 64% дисперсии «зависимой» пе­ременной определяется исходными переменными, а 36% ее дисперсии отно­сится к ошибке оценки.

Основной показатель состоятельности МРА(модели множественной регрессии) — коэффициент множественной корреляции (R). Подобно корреляции Пирсона, он является мерой линейной взаимосвязи одной переменной с совокупностью других переменных, но в отличие от него, принимает только положительные значения (от 0 до 1). Статистическая значимость КМК определяется по критерию F -Фишера для соответствующих степеней свободы. Для полноценной интерпретации результатов МРАнеобходимо, чтобы статистически значимыми были КМК и все -коэффициенты.

Таким образом, основными целями МРАявляются:

1. Определение того, в какой мере «зависимая» переменная связана с совокупностью «независимых» переменных, какова статистическая значимость этой взаимосвязи. Показатель — коэффициент множественной корреляции (КМК) и его статистическая значимость по критерию F -Фишера.

2. Определение существенности вклада каждой «независимой» перемен­ной в оценку «зависимой» переменной, отсев несущественных для предсказания «независимых» переменных. Показатели — регрессионные коэффици­енты , их статистическая значимость по критерию t -Стьюдента.

3. Анализ точности предсказания и вероятных ошибок оценки «зависи­мой» переменной. Показатель — квадрат КМК, интерпретируемый как доля дисперсии «зависимой» переменной, объясняемая совокупностью «незави­симых» переменных. Вероятные ошибки предсказания анализируются по рас­хождению (разности) действительных значений «зависимой» переменной и оцененных при помощи модели МРА.

4. Оценка (предсказание) неизвестных значений «зависимой» переменной по известным значениям «независимых» переменных. Осуществляется по вычисленным параметрам множественной регрессии.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.