Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Исключение резко отклоняющихся значений




 

При обработке результатов измерений очень часто возникает не­обходимость обнаружить грубые погрешности и исключить из экспе­риментальных данных соответствующие результаты. Указанная задача также требует проверки гипотез и решается статистическими методами.

Будем считать, что результаты измерений xi имеют нормальное распределение. Чтобы проверить возможность отбросить сомнительный результат хс(хс– наибольший или наименьший из результатов), вы­числим величину

 

(3.7.1)

 

где и вычисляют с учетом всех n измерений.

Если все xi распределены нормально, то распределение величины не будет зависеть от параметров закона распределения xi, но будет зависеть от числа измерений n. Имеются таблицы (таблица «Процентные точки -распределения») рас­пределения максимальных по модулю отклонений результатов измере­ний от их среднего значения

 

(3.7.2)

 

Таким образом, проверяется гипотеза о том, что результат хсне содержит грубой погрешности. Условием принятия этой гипотезы яв­ляется .

Задаваясь уровнем значимости a и учитывая число измерений n, по таблице «Процентные точки -распределения» находим значение . Сравниваем вычисленное по (3.7.1) значение с .Если < ,то гипотеза не противоречит эксперимен­тальным данным. В противном случае гипотеза отклоняется, а соот­ветствующий результат хсисключается из массива экспериментальных данных. После этого снова вычисляются оценки и , а описанная выше процедура может быть повторена для следующего подозревае­мого результата.

 

Пример 3.7.3. При условиях, заданных в примере 3.7.1, необходимо про­верить гипотезу, состоящую в том, что наибольший результат измере­ний xс = 7,8 не содержит грубой погрешности.

Решение. Вычислим

 

 

Принимаем уровень значимости a = 0,05. Для n = 10 по таблице «Процентные точки -распределения» находим = 2,414. Так как > , то гипотеза отклоняется, т.е. следует считать, что результат xс = 7,8 содержит грубую погрешность, а следовательно, должен быть исключен из экспериментальных данных.

 

3.8. Построение эмпирических распределений

 

При исследовании случайных процессов не­обходимо знать не только числовые характеристики случайных ве­личин, но законы их распределения. Поэтому необходимо знать закон распределения случайной величины по статистическим данным, полученным в эксперименте. Пусть в результате экспери­мента получено п значений случайной величины х1, х2,..., хп (ста­тистический ряд). Под статистической функцией распределения случайной величины X понимают частоту события X < х в данном статистическом интервале.



 

(3.8.1)

 

Статистическая функция распределения любой случайной вели­чины является прерывной сту­пенчатой функцией, скачки которой соответствуют наблюдаемым значениям случайной величины (рис. 3.8.1); они равны частотам появ­ления этих значений ,где –число появлений i-ro значения случайной величины в п опытах.

 

Рис. 3.8.1. Статистическая функция распределения

 

Кроме статистического интегрального закона распределения вводят понятие статистического дифференциального закона распределения, под которым понимают зависимость плотности рас­пределения наблюдаемых значений случайной величины

 

(3.8.2)

 

где – частота появления случайной величины в интерва­ле в п опытах. Для наглядности статистический диффе­ренциальный закон распределения представляют гистограммой (рис. 3.8.2).

Для определения законов распределения случайной величины X проводят эксперимент, получают n значения случайной величины, по ним строят статистические законы распределения. При n ® ¥ эмпирическая функция распределения приближается к истинной функции рас­пределения. В реальности число опытов ограничено. Поэтому не­обходимо определять закон распределения случайной величины по ограниченному числу опытов. При обработке ограниченного по объему статистического материала приходится решать вопрос о том, как подобрать для данного статистического ряда тео­ретическую кривую распределения, выражающую лишь существен­ные черты статистического материала, а не случайности, связанные с недостаточным объемом экспериментальных данных. Такая задача подбора теоретической кривой распределения называется задачей выравнивания статистических рядов.



 

Рис. 3.8.2. Гистограмма статистического диф­ференциального зако­на

распределения

 

Принципиальный вид теоретической кривой вы­бирается либо заранее из соображений, связанных с существом задачи, либо исходя из внешнего вида статистического рас­пределения. Аналитическое выражение выбранной кривой распреде­ления зависит от некоторых параметров; задача выравнивания ста­тистического ряда переходит в задачу рационального выбора тех значений параметров, при которых соответствие между статистичес­ким и теоретическим распределениями наилучшее.

Любая выбранная аналитическая функция f(х), с помощью ко­торой выравнивается статистическое распределение, должна об­ладать основными свойствами плотности распределения:

 

(3.8.3)

 

Допустим, что функция f(х), с помощью которой выравнивается данное статисти­ческое распределение, выбрана. В выражение этой функции входит несколько параметров a, b, .... Требуется подобрать эти параметры так, чтобы функция f(х)наилучшим образом описывала данный статистичес­кий материал. Наиболее часто для решения этой задачи применяется метод моментов. Согласно ему, параметры а, b,... выбираются так, чтобы несколько важнейших числовых характерис­тик теоретического распределения были равны соответ­ствующим статистическим характеристикам. Например, если теоретическая кривая f(х)зависит только от двух параметров а и b, они выбираются так, чтобы математиче­ское ожидание и дисперсия теоретического распределения совпадали с соответствующими статистическими характеристиками и .Если кривая f(х)зависит от трех параметров, можно по­добрать их так, чтобы совпали первые три момента и т.д.

Пример 3.8.1. Пусть в результате эксперимента над случайной величиной X, которая может принимать значения в интервале (-¥; +¥), получен статистический ряд (500 измерений):

 

Ii -4; -3 -3; -2 -2; -1 -1; 0 0; 1 1; 2 2; 3 3; 4
ni
Pi 0,012 0,05 0,144 0,266 0,24 0,176 0,092 0,02

 

Требуется выровнять это распределение при помощи нормальногозакона:

 

 

Решение. Определим статистические моменты случайной величины X – матема­тическое ожидание и дисперсию:

 

 

где – представитель i-го разряда; – частота i-го разряда; k – число разрядов.

Выберем параметры и s нормального закона так, чтобы выполнялись условия:

 

 

т.е. = 0,168; s = 1,448. Тогда получим:

 

 

Используя таблицу «Распределение функции », вычислим значения на границах рядов:

 

x -4 -3 -2 -1
0,004 0,025 0,090 0,199 0,274 0,234 0,124 0,041 0,008

 

На рис. 3.8.3 приведены гистограмма и выравнивающая ее кривая распределения.

 

Рис. 3.8.3. Гистограмма и выравнивающая кривая

 

Пример 3.8.2. С целью исследования закона распределения ошибки из­мерения дальности с помощью радиодальномера произведено 400 измерений дальности. Результаты опытов представлены в виде статистического ряда:

 

Ii 20; 30 30; 40 40; 50 50; 60 60; 70 70; 80 80; 90 90; 100
ni
Pi 0,052 0,180 0,165 0,095 0,128 0,140 0,160 0,080

 

Выровнять статистический ряд с помощью закона равномерной плотности.

Решение. Закон равномерной плотности выражается формулой:

 

 

Выражения для математического ожидания и дисперсии для закона равномерной плотности имеют вид:

 

 

 

Для того чтобы упростить вычисления, перенесем начало отсчета в точку x0= 60 и примем за представителя каждого разряда его середину. Ряд распределения примет вид:

 

-35 -25 -15 -5
Pi 0,052 0,180 0,165 0,095 0,128 0,140 0,160 0,080

 

где – среднее для разряда значение ошибки радиодальномера X' при но­вом начале отсчета.

Приближенное значение статистического среднего ошибки X' равно:

 

 

Второй статистический момент величины X' равен:

 

 

откуда статистическая дисперсия:

 

 

Переходя к прежнему началу отсчета, получим новое статистическое среднее:

 

 

и ту же статистическую дисперсию

 

 

Параметры закона равномерной плот­ности определяются уравнениями:

 

 

Решая эти уравнения относительно a и b, имеем:

 

,

 

откуда

 

 

На рис. 3.8.4 показаны гистограмма и выравнивающий ее закон равномерной плотности .

 

Рис. 3.8.4. Гистограмма и выравнивающая кривая

 

На практике часто случается так, что заранее закон теоретический закон распределения не известен. Поэтому рассмотрим вопрос о том, каким выбрать теоретическое распределе­ние по статистическому ряду, когда заранее вид теоретического распределения не известен. В этом случае пользуются системой кривых Пирсона (рис. 3.8.5).

Для применения кривых на рис. 3.8.5 необходимо знать значения b1 и b2, которые определяются как

 

 

где m2, m3, m4 – второй, третий, четвертый центральные моменты случайной величины соответственно. Однако значения b1 и b2 обычно неизвестны. Поэтому для того, чтобы узнать, будут ли над­лежащим образом описаны полученные данные (статистический ряд) одним из показанных на рис. 3.8.5 распределений, необходимо найти выборочные оценки и .

 

Рис 3.8.5. Система кривых Пирсона

 

Для определения и необходимо найти статистические моменты , , по следующим формулам:

 

. (3.8.4)

 

Определив , и, нанеся эту точку на графики рис. 3.8.5, можно узнать, какое распределение наиболее подходит для выравнивания статистического ряда.

При применении этого метода необходимо следующие ограничения:

1) и являются лишь оценками для b1 и b2 и подвержены колебаниям от выборки к выборке, поэтому этим методом пользоваться не рекомендуется при малом числе на­блюдений (например, меньше 200);

2) в общем случае форма распре­деления не определяется однозначно его нормированными показа­телями асимметрии (b1) и островершинности (b2).

 

3.9. Критерии согласия

 

Допустим, что имеющееся статистическое рас­пределение выровнено с помощью теоретической кривой f(х).Между теоретической кривой и статистическим распределением неизбежны некоторые расхождения. Объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они являются существенными и связаны с тем, что подобранная кривая плохо выравнивает данное статисти­ческое распределение? Ответ на этот вопрос дают критерии согласия.

Их сущность заключается в следующем. На основании имеющегося статистического материала необходимо про­верить гипотезу Н,состоящую в том, что случайная величина X подчиняется некоторому определенному закону распределения. Пусть закон задан в виде F(х).Чтобы принять или от­бросить гипотезу H, необходимо выбрать некоторую величину W,характеризующую степень расхождения теоретического и статис­тического распределений. Ее можно выбрать различными способами; например, в качестве W взять сумму квадратов отклонений теоретических вероятностей Pi от соответствующих частот или сумму тех же квадратов с некоторыми весовыми коэффициентами, или максимальное отклонение статистической функции распределения от теоретической F(х)и т.д.

Пусть величина W выбрана.Онаявляется случайной с законом распределения, зависящим от закона распреде­ления величины X и числа опытов п. Допустим, что этот закон известен. Тогда мера расхождения результатов опыта равна и. Если вычислить вероятность события W ³ u и она ока­жется малой, то гипотезу Н следует отвергнуть как мало правдоподобную; если же эта вероятность значительна, следует принять, что экспериментальные данные не противоречат гипотезе Н.

 


mylektsii.ru - Мои Лекции - 2015-2019 год. (0.016 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал