Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Анализ данных 4 страница






Таким образом, с вероятностью можно утверждать, что вектор математических ожиданий – это точка внутри эллипсоида, задаваемого уравнением

 

 

или

 

.

 

Напомним, множество точек k -мерного евклидова пространства, удовлетворяющих условию , где с принадлежит множеству допустимых значений функции , называется поверхностью уровня функции . Таким образом, на поверхности уровня функция имеет постоянное значение. В случае k =2 это множество точек называется линией уровня. Линия уровня – это спроектированная на плоскость кривая пересечения графика функции с плоскостью, параллельной плоскости .

Случай 2

Пусть ковариационная матрица не известна. В скалярном случае для построения доверительного интервала для математического ожидания m в случае, когда среднее квадратическое отклонении не известно, используется статистика , где – несмещенная оценка дисперсии случайной величины . Возведем обе части статистики в квадрат и представим в виде: . Обобщим статистику на k -мерный случай:

 

. (2.2)

 

Статистика (2.2) называется статистикой Хотеллинга, её закон распределения связан с распределением Фишера следующим образом:

 

,

 

где -ая точка распределения Фишера-Снедекора с числом степеней свободы , [25].

Переходя к неслучайной величине , получаем уравнение поверхности, ограничивающей с вероятностью доверительную область для вектора математических ожиданий . Уравнение имеет вид:

 

или

 

, где .

 

Статистика Хотеллинга (2.2) используется для построения доверительной области для вектора математических ожиданий по всем k анализируемым признакам. Однако на практике может возникнуть необходимость построения доверительной области по нескольким признакам при условии нивелирования остальных признаков.

Пусть по результатам n наблюдений из генеральной совокупности , распределенной по нормальному закону с неизвестными параметрами и , рассчитана оценка вектора математических ожиданий и несмещенная оценка ковариационной матрицы . Требуется с вероятностью построить доверительную область для вектора математических ожиданий первых l компонент вектора .

Для решения поставленной задачи вводится в рассмотрение матрица C вида

 

.

 

Так как , то линейная комбинация нормально распределенных случайных величин . В этом случае статистика Хотеллига примет вид:

 

. (2.3)

 

Процентные точки распределения статистики Хотеллинга и распределения Фишера связаны соотношением

 

,

 

где -ая точка распределения Фишера-Снедекора с числом степеней свободы , .

 

2.3 Построение доверительной области для вектора параметров в форме прямоугольного параллелепипеда

 

Ставится задача построить с вероятностью доверительную область для неизвестного вектора параметров в форме прямоугольного параллелепипеда, ребрами которого будут являться доверительные интервалы для параметров . Обозначим доверительный интервал для параметра через , . Алгоритм построения доверительный интервалов известен. Возникает вопрос, с какой доверительной вероятностью строить доверительные интервалы , , чтобы доверительная область для вектора параметров была построена с вероятностью .

Обозначим через событие, состоящее в том, что , . Тогда событие состоит в том, что вектор параметров принадлежит доверительной области . Вероятность события A равна:

 

 

Получаем, [25].

Таким образом, для построения доверительной область для вектора параметров с вероятностью в форме прямоугольного параллелепипеда, необходимо с вероятностью построить доверительные интервалы для каждого из параметров , которые и будут являться ребрами параллелепипеда.

 

2.4 Проверка гипотезы о равенстве вектора математических ожиданий нормально распределенной генеральной совокупности вектору-стандарту

 

Пусть по результатам n наблюдений из генеральной совокупности , распределенной по нормальному закону с параметрами и , рассчитана оценка вектора математических ожиданий , т.е. . Требуется на уровне значимости проверить гипотезу о равенстве вектора математических ожиданий некоторому известному постоянному вектору – вектору-стандарту. Итак, сформулируем гипотезы:

Случай 1

Пусть ковариационная матрица известна. Тогда для проверки гипотезы воспользуемся статистикой

 

, (2.4)

 

которая при справедливости гипотезы распределена по закону «Хи-квадрат» с числом степеней свободы . Для построения критической области необходимо найти критические точки и из уравнений:

 

 

Первое уравнение можно записать в виде: . Из второго уравнения получаем:

 

;

 

Таким образом, – это квантиль уровня или -ая точка, – это квантиль уровня или -ая точка распределения «Хи-квадрат» с числом степеней свободы .

Критическая область имеет вид: . Если наблюдаемое значение статистики попадает в критическую область, то гипотеза отклоняется.

Случай 2

Пусть ковариационная матрица не известна. Тогда на основе выборочных данных рассчитаем несмещенную оценку ковариационной матрицы и для проверки гипотезы воспользуемся статистикой Хотеллинга:

 

. (2.5)

 

При справедливости гипотезы имеет место равенство:

 

, (2.6)

 

где -ая точка распределения Фишера-Снедекора с числом степеней свободы , .

Если наблюдаемое значение статистики окажется больше, чем критическое , то гипотеза отвергается.

Замечание: даже если гипотеза отвергается, значения математических ожиданий одних признаков могут существенно отличаться от соответствующих значений вектора-стандарта, а значения математических ожиданий других – несущественно. Поэтому может возникнуть необходимость проверки гипотез о значении математических ожиданий по каждому отдельному признаку или нескольким признакам при условии нивелирования значений остальных признаков.

2.5 Проверка гипотезы об однородности распределения двух многомерных нормально распределенных генеральных совокупностей

 

Две генеральные совокупности называются однородными, если кроме одних и тех же признаков эти совокупности имеют одинаковые законы распределения [25].

Рассмотрим две нормально распределенные генеральные совокупности: , . Так как законы распределения совокупностей принадлежат одному и тому же параметрическому семейству, то для проверки их однородности остается сравнить соответствующие параметры распределения, т.е. , и , . Если параметры распределений не известны, то проверка гипотезы об однородности сводится к проверке двух гипотез: 1) о равенстве ковариационных матриц; 2) о равенстве векторов математических ожиданий.

1. Проверка гипотезы о равенстве ковариационных матриц

Ставится задача на основе выборочных данных объемами и из генеральных совокупностей и соответственно на уровне значимости проверить гипотезу при альтернативной гипотезе .

Для проверки гипотезы используется статистика

 

, (2.7)

 

где ;

;

– несмещенная оценка ковариационной матрицы , рассчитанная на основе случайной выборки ;

– несмещенная оценка ковариационной матрицы , рассчитанная на основе случайной выборки ;

– несмещенная оценка ковариационной матрицы общей для генеральных совокупностей и .

Статистика W при справедливости гипотезы , больших и и малой величине

 

 

имеет распределение «Хи-квадрат» с числом степеней свободы [25].

Нахождение критических точек осуществляется так же, как и в п. 2.4 (случай 1). Если в результате проверки гипотеза отвергается, то можно сделать вывод, что генеральные совокупности и не однородны. В противном случае проверяется вторая гипотеза.

2. Проверка гипотезы о равенстве математических ожиданий

Ставится задача на основе выборочных данных объемами и из генеральных совокупностей и с неизвестными, но равными ковариационными матрицами на уровне значимости проверить гипотезу при альтернативной гипотезе .

В скалярном случае для проверки равенства математических ожиданий двух нормально распределенных генеральных совокупностей при неизвестных дисперсиях, но равных между собой, используется статистика , имеющая в случае справедливости нулевой гипотезы распределение Стьюдента с числом степеней свободы . Возведем обе части статистики в квадрат и обобщим результат на k -мерный случай. Получим статистику Хотеллинга

 

, (2.8)

 

закон распределения которой при справедливости нулевой гипотезы связан с распределением Фишера-Снедекора соотношением:

 

, (2.9)

 

где -ая точка распределения Фишера-Снедекора с числом степеней свободы , [25].

Если в результате проверки гипотеза отвергается, то можно сделать вывод, что генеральные совокупности и не однородны. В противном случае генеральные совокупности и считаются однородными.

 

2.6 Проверка гипотезы о нормальном законе распределения многомерной генеральной совокупности

 

Многие задачи многомерного статистического анализа в настоящее время решены только для нормально распределенных генеральных совокупностей. Это касается построения доверительных областей для вектора параметров, проверки различных статистических гипотез в многомерном случае, параметрического дискриминантного анализа, реализуемого в статистических пакетах только для нормально распределенных классов, и т.д. Кроме того, выполнение требования нормального закона распределения многомерной генеральной совокупности является необходимым условием применения корреляционного анализа для исследования взаимосвязи признаков, а также предпосылкой корректного использования статистик для проверки различных гипотез при реализации методов снижения размерности признакового пространства.

Каким же образом проверить гипотезу о нормальном законе распределения многомерной генеральной совокупности? Четкого ответа на этот вопрос нет ни в одном из отечественных учебников по прикладной статистике.

В многомерном случае с помощью критериев согласия можно проверить необходимое условие многомерного нормального закона распределения – нормальный закон распределения каждой из компонент случайного вектора [25]. В отечественной литературе по математической статистике основное внимание уделено трём статистическим критериям – критерию Колмогорова, критерию (омега-квадрат) и критерию согласия (хи-квадрат) [17, 28, 52, 2]. Наиболее полный перечень критериев нормальности можно найти в работе [27]. Большинство из рассмотренных здесь критериев согласия реализованы в программе AtteStat. К таким критериям относятся: критерий Колмогорова, критерий Смирнова, критерий , критерий Крамера-Мизеса, критерий Андерсона-Дарлинга, критерий Шапиро-Уилка, критерий Шапиро-Франсиа, критерии асимметрии и эксцесса, критерий Жарка-Бера, критерий Гири, критерий Д`Агостино, критерий Васичека, критерий Эппса-Палли.

Кроме того, в многомерном случае можно проанализировать двумерные частные законы распределения. Как известно, для двумерного нормального закона распределения линии уровня представляют собой эллипсы с центром в точке с координатами , а функции регрессии на и на являются линейными. Поэтому в выборочном случае основанием предполагать двумерный нормальный закон распределения является вытянутая вдоль некоторой прямой (вдоль одной из осей эллипса) форма корреляционного поля. Гипотезу о линейной регрессионной зависимости двух признаков можно проверить с помощью статистики Фишера, приведенной в учебнике [25].

В надстройке AtteStat пакета Excel реализованы три статистических критерия проверки многомерного нормального закона распределения: критерий асимметрии Мардиа, критерий эксцесса Мардиа и критерий Хенце-Цирклера. Описание этих и многих других статистических критериев можно найти в работах [3-9, 19, 20, 39].

 

2.7 Вопросы и задания к практическим занятиям

 

1. Сформулируйте постановку задачи точечного оценивания параметров многомерной нормально распределенной генеральной совокупности

2. Что является оценкой вектора математических ожиданий?

3. Что является оценкой ковариационной матрицы?

4. Как рассчитываются смещенная и несмещенная оценки ковариационной матрицы?

5. Дайте определение доверительной области для вектора параметров

6. В чем состоит основанная сложность решения задачи построения доверительной области для вектора параметров?

7. Какие подходы существуют к решению задачи построения доверительной области для вектора параметров?

8. Расскажите алгоритм решения задачи построения доверительной области для вектора математических ожиданий нормально распределенной генеральной совокупности в случае, когда ковариационная матрица известна

9. Расскажите алгоритм решения задачи построения доверительной области для вектора математических ожиданий нормально распределенной генеральной совокупности в случае, когда ковариационная матрица не известна

10. Что геометрически представляет собой доверительная область для вектора математических ожиданий нормально распределенной генеральной совокупности? Обоснуйте, почему?

11. Каким образом решается задача построения доверительной области для математического ожидания части компонент многомерного нормально распределенного вектора признаков при условии нивелирования значений остальных признаков?

12. Сформулируйте постановку задачи построения доверительной области для любого вектора параметров в форме прямоугольного параллелепипеда

13. При каком условии может быть решена задача построения доверительной области для вектора параметров в форме прямоугольного параллелепипеда?






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.