Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Другие характеристики вариационного ряда

Кроме выборочной средней и выборочной дисперсии применяются и другие характеристики вариационного ряда. Укажем главные из них.

Модой называют варианту, которая имеет наибольшую частоту. Например, для ряда

варианта 1 4 7 9

частота 5 1 20 6

мода равна 7.

Медианой называют варианту, которая делит вариационный ряд на две части, равные по числу вариант. Если число вариант нечетно, т.е. n = 2k+1, то = ; при четном n=2k медиана = .

Например, для ряда

2 3 5 6 7

медиана равна5; для ряда

2 3 5 6 7 9

медиана равна =5,5.

Размахом варьирования R называю разность между наибольшей и наименьшей вариантами:

Например, для ряда

1 3 4 5 6 10

размах равен 10-1=9.

Размах является простейшей характеристикой рассеяния вариационного ряда.

Средним абсолютным отклонением в называют среднее арифметическое абсолютных отклонений:

Θ=

Например, для ряда

1 3 6 16

4 10 5 1

имеем в =4; Θ=2,2.

Среднее абсолютное отклонение служит для характеристики рассеяния вариационного ряда.

Коэффициентом вариации V называют выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней:

V= ∙100%.

Коэффициент вариации служит для сравнения величин рассеяния двух вариационных рядов: тот из рядов имеет большее рассеяние, у которого коэффициент вариации больше.

Замечание. Выше предполагалось, что вариационный ряд составлен по данным выборки, поэтому все описанные характеристики называют выборочными; если вариационный ряд составлен по данным генеральной совокупности, то характеристики называют генеральными.

Вопросы для самопроверки

1.Что называется статистической оценкой?

2. Каким требованиям должны удовлетворять статистические оценки? Укажите и дайте их определения.

3.Что называется генеральной средней?

4. Что называется выборочной средней?

5.Поясните, почему выборочную среднюю можно рассматривать как случайную величину?

6.Что является статистической оценкой для генеральной средней? Является ли это оценка несмещенной?

7.Что называется генеральной дисперсией?

8.Что называется выборочной дисперсией?

9.Что является статистической оценкой для генеральной дисперсии? Является ли это оценка несмещенной?

10.Что является исправленной дисперсией? Является ли это оценка несмещенной?

11. Дайте определения следующих выборочных характеристик (мода, медиана, размах варьирования, среднее абсолютное отклонение, коэффициент вариации).

 

 

ЛЕКЦИЯ №12

ИНТЕРВАЛЬНЫЕ ОЦЕНКИ

ПЛАН:

1. Точность оценки, доверительная вероятность (надежность). Доверительный интервал.



2. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ.

3. Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ.

4. Доверительные интервалы для оценки среднеквадратического отклонения σ нормального распределения.

КЛЮЧЕВЫЕ СЛОВА

Точечная оценка, интервальная оценка, точность оценки, надежность (доверительная вероятность) оценки.

 

1. Точность оценки, доверительная вероятность (надежность). Доверительный интервал.

Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные в лекции №11 – точечные. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок (смысл этих понятий выясняется ниже).

Пусть найденная по данным выборки, статистическая характеристика Θ٭ служит оценкой неизвестного параметра Θ. Будем считать Θ постоянным числом (Θ может быть и случайной величиной). Ясно, что Θ٭ тем точнее определяет параметр Θ, чем меньше абсолютная величина разности |Θ-Θ٭|. Другими словами, если δ>0 и |Θ-Θ٭|< δ, то чем меньше δ, тем оценка точнее. Таким образом, положительное число δ характеризует точность оценки.



Однако статистические методы не позволяют категорически утверждать, что оценка Θ٭ удовлетворяет неравенству |Θ-Θ٭|< δ; можно лишь говорить о вероятности γ, с которой это неравенство осуществляется.

Надежность (доверительной вероятностью) оценки Θ по Θ٭ называют вероятностью γ, с которой осуществляется неравенство |Θ-Θ٭|< δ. Обычно надежность оценки задается наперед, причем в качестве γ берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

Пусть вероятность того, что |Θ - |<δ равна γ:

P(|Θ - |<δ)= γ

Заменив неравенство |Θ - |<δ равносильным ему неравенством – δ< Θ - <δ, или - δ<Θ< +δ, имеем

P( - δ< < +δ)= γ.

Это соотношение следует понимать так: вероятность того, что интервал -δ, + δ) заключает в себя (покрывает) неизвестный параметр Θ, равна γ.

Доверительным называют интервал ( -δ, + δ), который покрывает неизвестный параметр с заданной нежностью γ.

Замечание. Интервал ( -δ, + δ) имеет случайные концы (их называют границами). Действительно, в разных выборках, получаются различные значения . Следовательно, от выборки к выборки будут изменяться и концы доверительного интервала, т.е. доверительные границы сами являются случайными величинами – функциями от , ,…, . Так как случайной величиной является не оцениваемый параметр Θ, а доверительный интервал, то более правильно говорить не о вероятности попадания Θ в доверительный интервал, а о вероятности того, что доверительный интервал покроет Θ.

Метод доверительных интервалов разработан американским статистиком Ю.Нейманом, исходя из идей английского статистика Р.Фишера.

2. Доверительные интервалы для оценки математического ожидания нормального распределения при известном

Пусть количественный признак X генеральной совокупности распределен нормально, причем среднеквадратическое отклонение этого распределения известно. Требуется оценить неизвестное математическое ожидание а по выборочной средней . Поставим своей задачей найти доверительные интервалы, покрывающие параметр а с надежностью .

Будем рассматривать выборочную среднюю , как случайную величину X ( изменяется от выборки к выборке) и выборочные значения признака , ,…, , как одинаково распределенные независимые случайные величины , ,…, (эти числа также изменяются от выборки к выборке). Другими словами, математическое ожидание каждой из этих величин равно а и среднеквадратическое отклонение равно .

Примем без доказательства, что если случайная величина X распределена нормально, то выборочная средняя X, найденная по независимым наблюдением, также распределена нормально. Параметры распределения X таковы:

M(X)=a, =

Потребуем, чтобы выполнялось соотношение

P(| -a<δ|)=γ,

где γ – заданная надежность.

Пользуясь формулой

P(|X-a|<δ)=2Ф ,

Заменив X через и через M(X) = a, )= ,

получим

P(|X-a|<δ)=2Ф ,= 2Ф(t),

где t= .

Найдя из последнего равенства

P =2Ф(t).

Приняв во внимание, что вероятность Р задана и равна γ, окончательно имеем (чтобы получить рабочую формулу выборочную среднюю вновь обозначим через ):

P( -t <a< +t )=2Ф(t)=γ.

Смысл полученного таков: с надежностью γ можно утверждать, что доверительный интервал

( -t , +t ) покрывает неизвестный параметр а; точность оценки δ= t .

Итак, поставленная выше задача полностью решена.

Укажем еще, что число t определяется из равенства 2Ф(t)=γ, или Ф(t)= по таблице функции Лапласа находят аргумент t, и которому соответствует значение функции Лапласа, равное .

Замечание. Оценку| -a|<t· называют классической. Из формулы σ= t· , определяющей точность классической оценки, можно сделать следующие выводы:

1) при возрастании объема выборки n число убивает и, следовательно, точность оценки увеличивается;

2) надежности оценки γ=2Ф(t) приводит к увеличению t (Ф(t)- возрастающая функция), а следовательно, и к возрастанию δ; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.

Пример. Случайная величина X имеет нормальное распределение с известными средними квадратическим отклонением σ=3. Найти доверительные интервалы для оценки неизвестного математического ожидания а по выборочным средним если объем выборки n=36 и задана надежность оценки γ=0,95.

Решение. Найдем t. Из соотношения 2Ф(t)=0,95 получим Ф(t)=0,475. По таблице находим

t=1,96.

Найдем точность оценки:

δ=t· =1,96· =0,98.

Доверительные интервалы таковы:

( -0,98; +0,98).

Например, если х = 4,1, то доверительный интервал имеет следующие доверительные границы:

-0,98=4,1- 0,98=3,12; +0,98=4,1+ 0,98 = 5,08.

Таким образом, значения неизвестного параметра а, согласующиеся с данными выборки, удовлетворяют неравенству

3,12<а<5,08.

Подчеркнем, что было бы ошибочным написать:

Р(3,12<а<5,08)=0,95.

Действительно, так как а — постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12<а<5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12<а<5,8 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.

Поясним смысл, который имеет заданная надежность. Надежность γ=0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых параметр действительно заключен; лишь в 5% случаев он может выйти за границы доверительного интервала.

Замечание. Если требуется оценить математическое ожидание и наперед заданной точностью δ и надежностью γ, то минимальный объем выборки; который обеспечит эту точность, находят по формуле

n=

(следствие равенства σ=t )

3.Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ.

Пусть количественный признак X генеральной совокупности распределен нормально, причем среднеквадратическое отклонение σ неизвестно. Требуется оценить неизвестное математическое ожидание а при помощи доверительных интервалов. Разумеется, невозможно воспользоваться результатами предыдущего параграфа, в котором а предполагалось известным.

Оказывается, что по данным выборки можно построить случайную величину (ее возможные значения будем обозначать через t),

которая имеет распределение Стьюдента с k = n-1 степенями свободы; здесь Х-выборочная средняя, S — «исправленное» среднеквадратическое отклонение, n- объем выборки. Дифференциальная функция

S(t,n)= , где = .

Мы видим, что распределение Стьюдента определяется параметром n-объемом выборки, или, что то же, числом степеней свободы k =n-1 и не зависит от неизвестных параметров а и σ; эта особенность является его большим достоинством. Поскольку S(t,n) -четная функция от t,

вероятность осуществления неравенства Т = <γ определяется так

 

P =2Ф .

 

Заменив неравенство в круглых скобках равносильному ему двойным неравенством, получим

P = γ.

Итак, пользуясь распределением Стьюдента, мы нашли доверительный интервал

- ; + ,покрывающий неизвестный параметр а с надежностью γ. Здесь случайные величины и S заменены неслучайными величинами и s, найденными по выборке. По таблице значений по заданным γ и n можно найти .

Пример. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n=16 найдены выборочная средняя =20,2 и «исправленное» среднеквадратичное отклонение s=0,8. Оценить неизвестное математическое ожидание при помощи доверительного интервала с надежностью 0,95.

Решение. Найдем . Пользуясь таблицей знамени по заданным и n=16, находим =2,13.

Найдем доверительные границы:

- =20,2-2,13 =19,774.

+ =20,2+2,13 =20,626.

 

Итак, с надежностью 0,95 неизвестный параметр a заключен в доверительном интервале 19,774<а<20,626.

, =

следует, что при неограниченном возрастании объема выборки n распределение Стьюдента стремится к нормальному. Поэтому при n> 30 можно вместо распределения Стьюдента пользоваться нормальным распределением.

Однако важно подчеркнуть, что для малых выборок (n<30), в особенности для малых значений n, замена распределения нормальным приводит к грубым ошибкам, а именно — к неоправданному сужению доверительного интервала, т.е. к повышению точности оценки. Например, если n=5 и γ=0,99, то пользуясь распределением Стьюдента, найдем =4,6, а используя функцию Лапласа, найдем =2,58, т. е. доверительный интервал в последнем случае окажется более узким, чем найденный по распределению Стьюдента.

То обстоятельство, что распределение Стьюдента при малой выборке дает не вполне определенные результаты (широкий доверительный интервал), вовсе не свидетельствует о слабости метода Стьюдента, а объясняется тем, что малая выборка, разумеется, содержит малую информацию об интересующем нас признаке.

4. Доверительные интервалы для оценки среднеквадратического отклонения σ нормального распределения

Пусть количественный признак X генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднеквадратическое отклонение σ по «исправленному» выборочному среднеквадратическому отклонению s. Поставим перед собой задачу найти доверительные интервалы, покрывающие параметр σ с заданной надежностью γ. Потребуем, чтобы выполнялось соотношение

P(|σ-s|< )=γ

или

P(s-δ<σ<s+δ)=γ

Для того чтобы можно было пользоваться готовой таблицей, преобразуем двойное неравенство

s-δ<σ<s + σ

в равносильное неравенство

s <σ<s ,

Положив = q, получим

s(l-q)<σ<s(1 + q) . (1)

Остается найти q. С этой целью введем в рассмотрение случайную величину «хи»:

= ,

где n — объем выборки.

Доказано [1], что случайная величина распределена по закону , поэтому квадратный корень из нее обозначают через χ.

Дифференциальная функция распределения χ имеет вид:

R(χ,n)= (2)

Мы видим, что это распределение не зависит от оцениваемого параметра σ, а зависит лишь от объема выборки n. Преобразуем неравенство (1) так, чтобы оно приняло вид

< χ .

Вероятность этого неравенства равна заданной вероятности γ, т.е.

d = γ.

Предполагая, что q<l, перепишем неравенство (1)так:

.

Умножив все члены неравенства на S , получим

< или < < .

Вероятность того, что это неравенство, а следовательно, и равносильно ему неравенство (1) будет осуществлено, равна

Из этого уравнения можно по заданным n и найти q. Практически для отыскания q пользуются таблицей (приложение в учебниках по теории вероятностей.)

Вычислив по выборке s и найдя по таблице q , получим искомый доверительный интервал (1), покрывающий от с заданной надежностью , т. е. интервал

s(1-q)< <s(l + q).

Пример. Количественный признак X генеральной совокупноcти распределен нормально. По выборке объема n=25 найдено «исправленное» среднеквадратическое отклонение s=0,8 Найти доверительный интервал, покрывающий генеральное среднеквадратическое отклонение σ с надёжностью 0,95.

Решение. По таблице по данным γ=0,95 и n=25 найдем q =0,32.

Искомый доверительный интервал (1) таков:

0,8(1-0,32)< σ<0,8-(1+0,32)

или

0,544<а<1,056.

Замечание. Выше предполагалось, что q<l. Eсли q>l, то неравенство (1) примет вид (учитывая σ>0)

0<σ<s(l+q),

или (после преобразований, аналогичных случаю q<l)

Следовательно, значения q>l могут быть найдены из уравнения

Пример. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n=10 найдено «исправленное» среднеквадратическое отклонение s=0,16. Найти доверительный интервал, покрывающий генеральное среднеквадратическое отклонение а с надежностью 0,999.

Решение. По таблице по данным γ=0,999 и n=10 найдем q=1,80(q>1). Искомый доверительный интервал таков:

0<σ<0,16(1+1,8),

или

0<σ<0,448.

Вопросы для самопроверки

1. Что называется точечной оценкой?

2. Что называется интервальной оценкой?

З. Что означает точность и надежность оценок?

4. Что является случайной величиной? Оцениваемый параметр или доверительный интервал?

5.Как находят доверительные интервалы для оценки математического ожидания нормального распределения при известном σ.

6. Как находят доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ.

7. Как находят доверительные интервалы для оценки σ нормального распределения?

 

 


mylektsii.ru - Мои Лекции - 2015-2019 год. (0.035 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал