Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Анализ данных 3 страница






3) тогда и только тогда, когда , т.е. функция регрессии представляет собой горизонтальную прямую.

Доказательство. Равенство корреляционного отношения нулю () эквивалентно равенству факторной дисперсии нулю (). В свою очередь тогда и только тогда, когда или .

В случае, когда функция регрессии является линейной, корреляционное отношение называется коэффициентом детерминации, обозначается и интерпретируется как доля дисперсии случайной величины , которая объясняется изменением случайной величины .

Аналогично двумерному случаю строится наилучшая линейная аппроксимация случайной величины в многомерном случае. Рассмотрим k -мерный случайный вектор . Ставится задача найти наилучшую линейную аппроксимацию остальными компонентами случайного вектора :

 

(1.13)

 

или ,

 

где

.

Также как и в двумерном случае, для этого необходимо минимизировать дисперсию . Перепишем выражение (1.13) в виде:

 

или

 

, (1.14)

 

где – центрированные случайные величины, ;

– вектор центрированные случайных величин;

– вектор коэффициентов линейной аппроксимации остальными компонентами вектора .

Вычислим дисперсию :

 

 

где – ковариационная матрица случайных величин .

Таким образом, получили оптимизационную задачу вида:

 

 

Для нахождения точки минимума , воспользуемся необходимым условием существования экстремума функции:

 

.

 

Получили систему уравнений:

 

или .

 

Тогда вектор коэффициентов линейной аппроксимации рассчитывается следующим образом: . Вычислив обратную матрицу и поведя ряд преобразований, можно показать, что , где – алгебраическое дополнение к элементу ковариационной матрицы .

Решение можно записать через корреляционную матрицу R. Для этого перейдем к центрировано-нормированным случайным величинам. Ковариационная матрица центрировано-нормированных случайных величин будет являться корреляционной матрицей исходных случайных величин, а наилучшая линейная аппроксимация (1.14) примет вид:

 

.

 

Переходя к исходным случайным величинам, получаем:

 

, (1.15)

 

где , , ;

– алгебраическое дополнение к элементу корреляционной матрицы R.

Пусть . Тогда функция регрессии на остальные компоненты случайного вектора имеет вид:

 

(1.16)

 

Остаточная дисперсия и коэффициент детерминации при этом составляют:

 

; (1.17)

 

. (1.18)

 

Рассмотрим случайный вектор, состоящий из трех компонент вектора , например, , распределенный, как известно, по нормальному закону. Случайная величина может быть коррелированна со случайной величиной и случайная величина может быть коррелированна со случайной величиной . В этом случае корреляционная связь между и может проявляться за счет их опосредованной связи с . Для характеристики корреляционной связи между и , очищенной от влияния случайной величины , вводится частный коэффициент корреляции . Частным коэффициентом корреляции называется коэффициент, определяемый следующим образом:

 

, (1.19)

 

где ;

.

Таким образом, частный коэффициент корреляции между и , очищенный от влияния , представляет собой коэффициент корреляции между новыми случайными величинами и , построенными так, чтобы быть некоррелированными со случайной величиной .

Зная вид функции регрессии и формулу для вычисления остаточной дисперсии в случае нормального закона распределения, а также учитывая свойства ковариации, можно получить формулу для вычисления частного коэффициента корреляции в трехмерном случае:

 

 

Таким образом, частный коэффициент корреляции между и , очищенный от влияния , рассчитывается по формуле:

 

. (1.20)

 

Аналогичным образом строится частный коэффициент корреляции в k -мерном случае. Так, частный коэффициент корреляции между и , очищенный от влияния остальных (k -2)-х компонент вектора , определяется следующим образом:

 

, (1.21)

 

где ;

.

Формула для вычисления частного коэффициента корреляции в k -мерном случае имеет вид:

 

. (1.22)

 

Зная частный коэффициент корреляции, можно вычислить коэффициенты уравнения регрессии по формуле:

 

. (1.23)

 

1.5 Вопросы и задания к практическим занятиям

 

1. Дайте определение многомерных статистических методов

2. Что является объектом, предметом и задачами многомерного статистического анализа данных? Приведите примеры формулировок объекта и предмета многомерного статистического анализа в различных областях исследования

3. Приведите классификацию типов случайных величин и примеры на каждый из типов случайных величин

4. Охарактеризуйте особенности различных типов случайных величин

5. Приведите классификацию шкал измерения случайных величин и примеры шкал измерения экономических показателей

6. Какие преобразования допустимы в количественных, порядковых и номинальных шкалах измерения признаков?

7. Какие количественные характеристики положения используются для количественных, порядковых и номинальных признаков?

8. Дайте определение случайного вектора, дискретного случайного вектора, непрерывного случайного вектора

9. Что называется функцией распределения случайного вектора и каковы её свойства

10. Дайте определение плотности распределения случайного вектора и раскройте её свойства

11. Решите задачу нахождения законов распределения компонент случайного вектора. Охарактеризуйте возможность решения обратной задачи

12. Дайте определение условного закона распределения

13. Дайте определение независимости компонент случайного вектора

14. Дайте определение ковариации случайных величин. Сформулируйте и докажите её свойства

15. Дайте определение математического ожидания и ковариационной матрицы случайного вектора

16. Дайте определение многомерного нормального закона распределения. Каковы его свойства?

17. Постройте линии уровня двумерного нормально распределенного случайного вектора

18. Дайте определение коэффициента корреляции случайных величин, сформулируйте и докажите его свойства

19. Дайте определение корреляционной матрицы случайного вектора

20. Постройте наилучшую линейную аппроксимация одной случайной величины другой

21. Дайте определение функции регрессии. Найдите функции регрессии для нормально распределенного двумерного случайного вектора

22. Постройте наилучшую линейную аппроксимацию одной случайной величины остальными (k -1) компонентами случайного вектора. Запишите вид функции регрессии для k -мерного нормально распределенного случайного вектора

23. Сформулируйте определения и свойства остаточной дисперсии, факторной дисперсии, корреляционного отношения, коэффициента детерминации

24. Дайте определение частного коэффициента корреляции в трехмерном и многомерном случаях. Сформулируйте свойства частного коэффициента корреляции

 


2 Оценивание параметров распределения и проверка гипотез о параметрах распределения многомерной генеральной совокупности

2.1 Точечное оценивание параметров многомерной нормально распределенной генеральной совокупности

На практике чаще всего имеют дело с выборкой из генеральной совокупности, поскольку обследование всей генеральной совокупности бывает либо слишком трудоемко, либо принципиально невозможно. Задачи многомерного статистического анализа сводятся к обоснованному суждению об объективных свойствах генеральной совокупности на основе выборочных данных.

Выборочные данные объемом n из k -мерной генеральной совокупности будем представлять в виде матрицы X типа «объект-свойство», имеющей вид:

 

.

 

Элемент матрицы X интерпретируется как наблюдаемое значение признака (случайной величины) для i -го объекта выборочной совокупности, , . Таким образом, в i -ой строке матрицы Х содержатся значения признаков для i -го объекта наблюдения.

Как известно из математической статистики наблюдаемые значения признаков (апостериорные выборочные данные) нужны для вычисления количественных значений тех или иных характеристик генеральной совокупности. Для теоретического обоснования свойств генеральной совокупности используется случайная выборка . Случайную (априорную) выборку из k -мерной генеральной совокупности будем обозначать , где k -мерный случайный вектор, который будет наблюдаться в i -ом эксперименте, . При этом предполагается, что случайные векторы распределены так же, как и генеральная совокупность . Можно записать

 

.

 

Ставится задача на основе выборочных данных объемом n, извлеченных из k -мерной нормально распределенной генеральной совокупности и представленных в виде матрицы X типа «объект-свойство», осуществить точечное оценивание параметров распределения случайного вектора .

Так как случайный вектор распределен по нормальному закону (), то необходимо оценить вектор математических ожиданий и ковариационную матрицу .

Как известно, точечной оценкой математического ожидания является среднее арифметическое случайных величин. Тогда точечной оценкой вектора математических ожиданий будет являться вектор средних арифметических случайных величин , где – точечная оценка , .

Выборочное значение точечной оценки вектора математических ожиданий рассчитывается на основе матрицы X типа «объект-свойство» и обозначается , где – выборочное среднее арифметическое значение j -го признака, ; n – объем выборки; – наблюдаемое значение j -го признака на i -ом объекте выборочной совокупности.

Ковариационная матрица имеет вид:

 

,

 

где – дисперсия случайной величины , ;

– ковариация случайных величин и , являющаяся характеристикой линейной связи случайных величин, , .

Априорная оценка дисперсии имеет вид , . Следует отметить, что эта оценка является смещенной. Априорная оценка ковариации случайных величин и имеет вид , , . Апостериорные оценки дисперсии и ковариации случайных величин и рассчитываются по формулам:

 

, ;

 

, , .

 

Апостериорную оценку ковариационной матрицы будем обозначать . Матрицы имеет вид:

 

.

 

Для расчета в матричном виде вводится в рассмотрение матрица центрированных значений исходных признаков , где , , . Тогда оценка ковариационной матрицы рассчитывается следующим образом:

 

.

 

Исправленная (несмещенная) оценка ковариационной матрицы рассчитывается по формуле: . При этом .

 

2.2 Построение доверительной области для вектора математических ожиданий нормально распределенной генеральной совокупности

 

Основные понятия и определения интервального оценивания можно перенести на случай вектора параметров . Однако термин «доверительный интервал» в случае вектора параметров становится некорректным и его следует заменить на термин «доверительная область».

Доверительной областью для вектора параметров генеральной совокупности называется область, определяемая результатами наблюдений, которая с близкой к 1 доверительной вероятностью содержит неизвестное значение вектора [25].

Основную трудность в построении доверительных областей, так же как и доверительных интервалов, представляет определение подходящих для этого статистик и установление их законов распределения. В настоящее время эти вопросы хорошо разработаны только для нормально распределенных генеральных совокупностей.

Пусть по результатам n наблюдений из генеральной совокупности , распределенной по нормальному закону с параметрами и , рассчитана оценка вектора математических ожиданий , т.е. . Требуется с вероятностью построить доверительную область для вектора математических ожиданий .

Случай 1

Пусть ковариационная матрица известна. В скалярном случае для построения доверительного интервала для математического ожидания m при известном среднем квадратическом отклонении используется статистика . Возведем обе части статистики в квадрат и представим в виде: . Эта статистика распределена по закону «Хи-квадрат» с числом степеней свободы . Обобщим статистику на k -мерный случай:

 

. (2.1)

 

Статистика (2.1) распределена по закону «Хи-квадрат» с числом степеней свободы [25].

Для построения доверительной области необходимо решить уравнение . Получаем: и – квантиль уровня или -ая точка распределения «Хи-квадрат» с числом степеней свободы .

Перейдем к неслучайной величине . Выражение представляет собой положительно определенную квадратичную форму относительно вектора , вследствие чего неравенство определяет множество точек внутри поверхности уровня , геометрически представляющей k -мерный эллипсоид с центром в точке с координатами .






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.