Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Ковариационный анализ

Лабораторная работа № 9

I. В таблице 9 содержатся данные о цене продажи жилых домов.

Табл.9 цена продажи (в дол.), площадь (в квадратных футах)

Категория
Неплохой (1) Хороший (2) Превосходный (3)
цена   полезная площадь цена   полезная площадь цена   полезная площадь
             
Среднее 85496, 6   777, 83   157158, 8   1350, 13   250240, 0   1715, 00

 

Ковариационный анализ представляет собой метод, соединяющий черты дисперсионного и регрессионного анализа. Применим ковариационный анализ к изучению данных табл.9. В результате анализа данных табл.9 мы хотим узнать, зависит ли цена дома от категории, в которую дом был отнесен. Очевидно, что имеется существенное различие между средними ценами по столбцам, дисперсионный анализ наблюдений, несомненно, подтвердит этот вывод. Однако, как нетрудно заметить, дома, считающиеся неплохими, в таблице 9 имеют сравнительно небольшую полезную площадь, площадь домов, считающихся хорошими, заметно больше. Таким образом, величина , которую часто называют сопутствующей переменной, на самом деле, может иметь даже большее значение для объяснения различий в ценах, чем категория дома. В данном случае сопутствующая переменная является мешающей для оценки значимости влияния категории на цену дома.

Можно предложить следующую модель:

(1)

Здесь каждое наблюдение представлено в виде суммы среднего по столбцу (представляющего собой влияние категории, в которую отнесен дом), эффекта, вызванного тем, что соответствующая сопутствующая переменная отличается от общего среднего сопутствующей переменной и случайного слагаемого, моделирующего влияние неучтенных факторов.

Надо провести дисперсионный анализ, пользуясь ценами, скорректированными с учетом влияния полезной площади. Скорректированные цены определяются следующим образом:

 

(2)

Если коэффициент положителен, то есть и положительно связаны, тогда, если , то скорректированное значение окажется меньше, чем исходное значение . В случае отрицательного и выполнения неравенства результат коррекции окажется противоположным. Значение оценки дает регрессионный анализ. Затем, после учета коррекции, проводится дисперсионный анализ скорректированных данных. В модели (1) предполагается, что коэффициент один и тот же для всех классов. Иначе говоря, влияние полезной площади на цену дома одно и то же независимо от категории. Это предположение об отсутствии взаимодействия между сопутствующей переменной и схемой классификации существенно для последующего анализа. Вообще говоря, прежде чем приступать к ковариационному анализу, надо проверить справедливость предположения об общем коэффициенте. Проверка заключается в подборе линии регрессии для каждого из классов вида:

Затем проверяется гипотеза, что все равны. Если эта гипотеза принимается, то рассматривается общий угловой коэффициент и его оценка .

Введем обозначения:

,

 

Пользуясь методом наименьших квадратов, найдем объединенную оценку :

Остаток наименьших квадратов для (1) равен:

Оценкой для является скорректированное среднее , поэтому

.

Скорректированная сумма квадратов остатков равна:

Величина называется скорректированной остаточной вариацией.

Величина имеет степеней свободы, а объясненная вариация – одну степень свободы, то имеет степеней свободы, где

Проверяется нулевая гипотеза:

Альтернативная гипотеза:

не все математические ожидания по столбцам равны.

Если нулевая гипотеза верна, то модель (1) принимает вид:

 

 

, (3)

оценки метода наименьших квадратов для будут:

В этом случае остатки для модели (3) будут вычисляться по формуле:

а сумма квадратов остатков будет равна:

где называется скорректированной остаточной вариацией при условии, что справедлива нулевая гипотеза. Так как имеет степень свободы, то имеет

степеней свободы.

Расхождение между и должно быть мало, если верна нулевая гипотеза. Обозначим скорректированную вариацию столбцов .

Тогда отношение

Подчиняется распределению Фишера со степенями свободы .

 

Оценкой для дисперсии служит

.

<== предыдущая лекция | следующая лекция ==>
II. Задание. 1) В таблице 11 приводятся три индекса прожиточного минимума, относящиеся к 1900-1910гг в США | И методические указания по их выполнению




© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.