Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Статистической обработки результатов наблюдений






Обработка результатов наблюдений (выборки), имеющихся у обра- ботчика в том порядке, в каком они были получены в ходе наблюдений, то есть в случайном (хаотичном), проводится в следующей последовательно- сти:

I) упорядочивание значений ряда наблюдений по возрастанию;

2) проверка результатов наблюдений на анормальность;

3) пересчет параметров статистических оценок;

4) выбор закона распределения, выравнивание ряда по выбранному и проверка согласия эмпирического и теоретического распределений.

Перечисленные пункты отражены в ГОСТ Р 50779.6* «Статистические методы обработки результатов измерений и испытаний» и ГОСТ Р

50779.2*Статистические методы. Правила определения и методы расчета статистических характеристик по выборочным данным». Знак * определяет конкретный номер соответствующей рубрики ГОСТа. Например, ГОСТ Р 50779.21-96 «Статистические методы. Правила определения и методы расчета статистических характеристик по выборочным данным. Часть 1. Нормальное распределение».

Упорядочивание результатов наблюдений осуществляется посредст­вом размещения их значений по возрастанию, от меньшего к большему.

Проверка на анормальность проводится в предположении, что ошиб­ки наблюдения подчиняются нормальному закону распределения.

Результат наблюдений является грубым или анормальным, если он существенно отличается по значению от остальных значений наблюдений в выборке.

Причинами появления подобных результатов могут быть сбои в ра­боте измерительной аппаратуры, ошибки (промахи) наблюдателя, природ­ная анормальность и пр. Вполне естественно, что для предотвращения искажения в описании статистическими данными сущности объекта грубые результаты должны быть исключены из выборки. Для этого выполняются следующие действия. Если проверка проводится по критерию Греббса (существуют также критерии Ирвина и Романовского), определяются среднее арифметическое выборки

= Σ xi, (2.26)

и выборочное среднее квадратическое S = (xi- )2 (2.27)

Затем, поскольку более вероятны существенные отклонения для крайних значений выборки, оценивается принадлежность первого и по­следнего элементов выборки (x 1- минимальное и хп - максимальное зна­чения) к выборочной совокупности. Процедура оценки осуществляется посредством вычисления так называемых u- статистик:

Здесь u1 и u n характеризуют относительные величины наибольших отклонений от среднего, которые подчиняются -распределению. При известном объеме выборки п и заданном уровне из таблиц, приведенных в [30], определяется табличное значение величины h (квантиль -распределения), которое в последующем сравнивается с u1 и ип. В случае соблюдения неравенств u 1 h, un h первый и последний элементы выборки считаются анормальными и могут быть исключены из ряда наблюдений. Далее процедура проверки результатов наблюдений на анормальность повторяется в той же последовательности, однако при этом в качестве проверяемых берутся следующие первый и последний элементы выборки, которые ранее закрывались исключенными элементами. Таким образом, процедура повторяется до тех пор, пока не будут соблюдаться следующие неравенства: u 1< h, un< h. Отметим также, что в каждом случае отбрасывания анормальных результатов производится пересчет статистических оценок – среднего арифметического, оценки дисперсии, среднего квадратического выборки.

В ряде случаев, когда определены предварительно частоты, для оп­ределения и S2 возможно использовать иные выражения, снижающие трудоемкость вычислений. Среднее арифметическое (оценка матожидания) вычисляется по выражению

где xi –i- й вариант для дискретной случайной величины или середина ин­тервала x i = (хi -1+ хi)/2 для непрерывной случайной величины; ni - частота i-го варианта или интервала; k количество вариантов или интервалов.

Выборочная дисперсия - статистическая оценка дисперсии - определяется как сумма квадратов отклонений вариантов или середин интервалов от среднего арифметического, деленная на объем выборки п минус единица:

Единица, вычитаемая из объема выборки п в выражении (2.30), учитывает одну степень свободы, использованную на вычисление среднего арифметического, и позволяет получить несмещенную оценку дисперсии для случаев, когда среднее арифметическое предварительно (априорно) неизвестно.

Средиеквадратическое отклонение определяется по выражению

S= (2.31)

И последний, завершающий, этап обработки производственной информации и случайного характера - это выбор закона распределения. Данная процедура позволяет в дальнейшем не занимать долговременную память компьютеров и не хранить записи с таблицами эмпирических данных. Выбранный закон распределения представляется в удобном формульном виде и позволяет в любой момент получать теоретические (сглаженные), более широко представляющие выборку, значения случайной величины и ее статистических оценок.

Графически законы распределения интерпретируются в виде графиков плотностей распределения (дифференциальной функции) и графиков функций распределения (интегральной функции) (см. рис. 2.2). График кривой плотности распределения представляет собой предельное положение гистограммы при стремлении объема выборки п . Поэтому в процессе выбора закона распределения для описания эмпирической выборки необходимо руководствоваться видом построенной гистограммы (для непрерывной) и многоугольника распределения (для дискретной) случайных величин, представлением физической сущности обрабатываемой случайной величины и знанием графического представления кривых плотностей известных законов распределения (см. рис. 2.2). Более подробно с информацией о законах распределения можно познакомиться в [26, 28-30].

Поскольку законов распределения существует определенное множе­ство, то при выборе конкретного закона и выравнивания по нему эмпири­ческого ряда необходимо пользоваться общим алгоритмом, приведенным ниже и определяющим порядок проведения данной процедуры.

1. Ha основе выборочных данных определяются статистические оценки матожидания (среднее арифметическое), дисперсии (выборочная дисперсия), среднего квадратического отклонения, если они не определе­ны.

2. Построение многоугольника распределения для дискретной или гистограммы для непрерывной случайных величин. Методика и правила построения многоугольников и гистограмм в частотах и частностях (относительных частотах) приведены в [29]. По оси ординат гистограмм откладываются частоты, в скобках, и соответствующие им плотности частот для гистограммы частот или частости (относительные частоты), в скобках, и соответствующие им плотности частостей для гистограммы частостей. По графической интерпретации эмпирического распределения в виде гистограммы (многоугольника) и физической сущности рассматриваемой случайной величины подбирается соответствующий закон распределения на основе сравнительного анализа графиков плотностей известных законов распределения (см. рис. 2.2). Следует отметить, что это не единственный путь выбора закона распределения. При соответствующем опыте или наличии априорной информации нет необходимости в построении гистограмм (многоугольников), однако при отсутствии оных без гистограмм и многоугольников не обойтись.

3. В выражение плотности выбранного закона распределения под­ставляют вычисленные ранее статистические оценки (среднее арифметическое, среднее квадратическое отклонение или выборочная дисперсия) параметров (математического ожидания, дисперсии) выборки.

4. Подстановкой значений границ интервалов х i-1 и хi в качестве пре­делов интегралов от выражения плотности выбранного закона распределе­ния либо используя таблицы, вспомогательные функции (функция Лапласа для нормального распределения) [29], вычисляют теоретические вероятности pi попадания случайной величины х в соответствующий i -й интервал. Для дискретной случайной величины при вычислении рi текущие значения xi подставляют непосредственно в выражение плотности выбранного зако­на распределения. Для сопоставимости теоретической кривой с экспериментальной на гистограммах частостей и частот (многоугольниках для дискретной случайной величины) строят, соответственно, кривую плотности в вероятностях (посредством откладывания вычисленных значений рi на оси ординат для i -х интервалов непрерывной случайной величины или для i -х значений вариантов дискретной случайной величины) и в теоретических частотах, которые определяются из выражения n '= пр i, и откладываются на оси ординат гистограммы частот для i -х интервалов непрерывной случайной величины или для i -x вариантов дискретной случайной величины.

5. Проводят проверку согласия эмпирического распределения с выбранным теоретическим, где в качестве меры расхождения между теоретическим и эмпирическим распределениями может быть выбран один из следующих критериев: Колмогорова, Пирсона 2 (хи-квадрат) и ω 2 (омега-квадрат).

Сущность перечисленных критериев согласия заключается в том, что они определяют допустимую случайную меру расхождения между теоретическим и эмпирическим распределениями.

Если найдены закон и параметры случайной величины, то она перестает быть неизвестной. Для анализа статистическое (эмпирическое) рас­пределение необходимо заменить теоретическим. Теоретическое распределение свободно от тех случайных колебаний, которые наблюдаются в статистических распределениях вследствие ограниченного числа наблюдений и других погрешностей. Однако как бы хорошо ни была подобрана теоретическая кривая распределения, между нею и статистическим распределением неизбежны некоторые расхождения. Возникает вопрос: объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений в статистическом ряду, или расхождения являются существенными и связаны с неправильным выбором теоретического закона распределения?

Процедура оценки расхождения напоминает ситуацию, когда покупатель взяв костюм при его предполагаемой покупке, находится в стадии его примерки и принятия решения относительно покупки. При проведении проверки на согласие необходимо соблюдение ряда условий: исследуемая выборочная совокупность должна быть однородна, то есть наблюдения случайной величины должны проводиться в одинаковых условиях; для критериев Колмогорова и Пирсона объем выборки должен быть не менее 100, для ω 2 не менее 50; приборы и инструменты, фиксирующие наблю­даемую случайную величину, должны иметь цену деления не более 0, 2 предполагаемой величины среднего квадратического отклонения иссле­дуемого распределения. Схема применения критерия А.Н. Колмогорова следующая: строятся статистическая и предполагаемая теоретическая функции распределения случайной величины, и определяется максимум модуля разности между ними R. Далее определяется максимальное значе­ние модуля разности (рис. 2.4, а) между эмпирической функцией распреде­ления Fэ(x) и теоретической Fm(x):

R =max | F э (х) - Fm (х)| (2.32)

и величина l0= . (2.33)

Далее по табл. 2.1 определяют вероятность р (l0)

Таблица 2.1

Вероятность р (l0)

l0 р (l0) l0 р (l0) l0 р (l0) l0 р (l0)
0, 0   0, 5 0, 964 1, 0 0, 27 1, 5 0, 022
0, 1   0, 6 0, 864 1, 1 0, 178 1, 6 0, 012
0, 2   0, 7 0, 711 1, 2 0, 112 1, 7 0, 004
0, 3   0, 8 0, 544 1, 3 0, 068 1, 8 0, 003
0, 4 0, 997 0, 9 0, 393 1, 4 0, 040 1, 9 0, 002

 

Это есть вероятность того, что если случайная величина действительно распределяется по предполагаемому закону, то за счет чисто слу­чайных причин максимальное расхождение между теоретической и стати­стической функциями будет не меньше фактически полученного. Если вероятность р (l0) весьма мала, гипотезу следует отвергнуть как неправдо­подобную; при сравнительно больших р (l0) ее можно считать совместимой с опытными данными. Минимальное значение р (l0) принимается равным 0, 01. Однако, если точность выбора закона распределения может в после­дующих расчетах повлиять на надежность работы особо ответственных систем, связанных, например, с безопасностью работы людей, минималь­ное значение р (l0) должно быть заведомо выше.

Этот критерий применяется в случаях, когда распределение обрабатываемой случайной величины известно из априорной информации, то есть предварительно известны вид и статистики (оценки параметров) Функции распределения. Более подробно о методике применения данного критерия можно ознакомиться в [29, 30].

 

Рис. 2.4. Графическая интерпретация критериев: а - Колмогорова; б- Пирсона

В тех случаях, когда предварительно не известны ни вид распределений, ни статистики - оценки математического ожидания и дисперсии, - используется более мощный критерий согласия - критерий Пирсона (хи- квадрат):

 

 

х2= t\h-mtlm\ или= с2-34)

> =1L J i=i Ji

где и, - (F,) - количество элементов выборки, попавших в г'-й интервал для непрерывной случайной величины (частота г'-го интервала) или количество элементов i-го варианта для дискретной слу­чайной величины (частота 1-го варианта); п - объем выборки;

к - количество интервалов или вариантов;

Pi - теоретическая вероятность для г'-го варианта или интервала (вычисляется для каждого интервала или варианта по форму­ле плотности принятого закона распределения); fi = пр— значения частоты теоретического распределения.

Графическая интерпретация критерия представлена на рис. 2.4, 6.

Проверка согласия выбранного закона распределения с эмпириче­ским проводится в следующей последовательности:

а) определяется х2-критерий по выражению (2.34);

б) определяется число степеней свободы г = к-с - 1, где с - количе­ство параметров (оценки математического ожидания, дисперсии), вычис­ленных на основе эмпирического распределения и подставленных в выра­жение плотности выбранного закона распределения;

в) задается уровень значимости а (обычно в отрасли а принимают рав­ным 0, 05) и с помощью таблиц для ^-распределения [29, 31] определяется табличная величина xVm характеризующая предельную величину расхож­дения для данного числа степеней свободы г и уровня значимости а.

г) если х2 ^ Х2крит, то гипотеза о согласии выбранного закона распре­деления принимается, в противном случае отвергается, и в дальнейшем необходимо рассматривать какой-либо другой закон распределения с той же самой процедурой проверки его согласия.

2.4.2. УСТАНОВЛЕНИЕ ЗАВИСИМОСТЕЙ

Одна из основных задач обработки экспериментальных данных за­ключается в установлении зависимости между значением параметра у и воздействующими на него факторами хь Хг... В общем виде такая зависи­мость записывается как

y = f(x„x2,...., xm), (2.35)

где m - общее количество воздействующих факторов. При однофакторном эксперименте имеем у -fix).

II. iiiiifuM информация для моделирования

Установление зависимости между эмпирическими значениями пара- iri|'" У и воздействующим фактором х выполняется на основе корреля­ции но анализа. Две случайные величины х и у называются корреляци-

i вязанными, если математическое ожидание одной из них меняется

при и 1менении другой. Теснота связи между этими величинами характери- цен " коэффициентом корреляции Если = 0, то говорят, что величи­ны I и V ие коррелируют. Если rxy= 1, то между ними имеется прямолиней­ная функциональная зависимость.

(уществует и другой метод оценки тесноты связи между опытными

> то построение доверительной зоны для выявленной эмпириче-

• I nil шиисимости [29, 32]. Коэффициент корреляции между величинами х hi I н фгделяется по формуле

и-1

Z х'У>

\

ху

г*> =

(2.36)

Ст.о,

| и п количество опытов;

> и г, значения величин в г'-м опыте;

in г средние значения (математические ожидания) величиях и у\

I. нн просматривается взаимосвязь между величинами, то следую­щим 11ином становится выявление уравнения, описывающего эту взаимо- ни н Ни уравнение называют эмпирической зависимостью, или уравне-

и in Общепринятым при решении подобных задач является метод

наименьших квадратов, при котором требования наилучшего согласования ф. нкI(Ни (кривой в общем случае) у = j{x) и экспериментальных точек сво-

юму, чтобы сумма квадратов отклонений экспериментальных то-

|-|.и 1Мнирической зависимости обращалась в минимум.

Дня линейной зависимости вида у = а + Ьх необходимо составить • уравнений

na + bYjyi = J у,;

; =i 1=1 п п л

>

(2.37)

| 'мириI ичнойу = а + Ьх + сх2 - систему вида

Раздел 2

п п п

 

п п п п

(2.38)

 

и п п п

где a, b к с - коэффициенты эмпирической зависимости, определяемые в результате решения системы данных уравнений.

Для выявления зависимости рекомендуется расположить в таблице значения у в порядке возрастания значений аргументов х или изобразить значения в координатной сетке. Далее необходимо выбрать тип уравнения связи между функцией и аргументом. В качестве такого уравнения связи принимают прямую линию, параболу, гиперболу, степенную функцию или многочлен. Выбор той или иной теоретической зависимости производят, учитывая физическую сущность явления, диапазон и характер изменения величин. Например, следует выбрать уравнение связи для зависимости времени перемещения автопогрузчика t от расстояния его перемещения 1 на площадке лесного склада.

Экспериментальные данные будут, естественно, показывать возрас­тание времени t с увеличением расстояния I. Если подходить чисто математически, то теоретическим уравнением могут быть прямая линия t = а + Ы, парабола типа t = а + Ы + cl2 и др. Здесь и далее a, b и с - коэф­фициенты, которые после выбора уравнения связи рассчитываются мето­дом наименьших квадратов. Однако оценка этих зависимостей показывает, что они далеко не отвечают реальному процессу: при / = 0 t = а, хотя в этом случае время должно быть, разумеется, равным нулю. При малых значениях I средняя скорость перемещения автопогрузчика будет меньше, чем при больших расстояниях. Это связано с тем, что при большом рас­стоянии снижается относительное влияние времени на разгон и замедление хода автопогрузчика. Поэтому уравнение прямой линии не подходит и по этой причине.

Достовернее будет отражать реальный процесс - зависимость t = alb: при 1 = 0 t = 0, а с ростом / время t возрастает по кривой линии; естествен­но, что а> 0 и Ь> 0.

После выбора теоретического уравнения связи необходимо определить значения входящих в него коэффициентов. Их значения, как отмечалось, рас­считывают методом наименьших квадратов. Суть этого метода заключается в том, чтобы выявить такие значения коэффициентов, при которых сумма квад-

It hum информация для моделирования

I отклонений фактических значений функции от устанавливаемой эмпири-

> 11 зависимости - уравнение связи с численными значениями коэффициен-

была бы минимальной. В математической статистике приводятся много-

IMI и иные примеры расчета этих коэффициентов для различных типов урав- м(ми11 связи. В настоящее время такие расчеты выполняют, как правило, на 'ИМ, идя чего разработаны стандартные программы.

('недует оговорить некоторые особенности определения эмпирических

имостей. В ряде случаев для последующего упрощения расчетов ис-

1уют уравнения связи типа прямой линии или разделяют всю зону зави-

■ MMiiciH w f{x) на отдельные характерные участки, рассматривая зависимо-

и них как прямолинейные. Так поступают, если предполагают при по-

и г, минем моделировании процесса применить линейное программирова- шп п имеется уверенность, что отход от физической сущности взаимосвязи

мгельно скажется на точности конечных результатов.

I iни физическую сущность явления установить трудно, то принимают in 11 •■ ним> типов уравнений связи и методом наименьших квадратов выби- г ".и ю, которое дает минимальное значение суммы квадратов отклонений. им > ммирическая зависимость действительна при конкретных ограниче­нии. определять значения исследуемого параметра по ней можно только в

и'М г ир! ументов, в которой проводились экспериментальные измерения.

Ili.i • " I in ни зоны (экстраполяция эмпирической зависимости) имеет возрас-

риск неточности результата с увеличением удаления от границ ус-

| in иной экспериментом зоны.

Пример определения коэффициента корреляции и корреляционной швт н мости. На лесосеке были проведены наблюдения за работой валоч-

нмчирующей машины. При этом определялись следующие пары вели-

iiiii и)и, ем спиливаемого дерева qw и время цикла валки-пакетирования tu

и о дерева. Результаты наблюдений сведены в табл. 2.2.

Исчисления по ранее приведенным формулам дают следующее: средние значения

Чх" 21 h

=(0, 29 + 0, 43 +... + 0, 71)^- = 0, 527 м3;

и in Персия

72 Раздел 2

средние квадратические отклонения

о, => /0, 019194 = 0, 1385 м3; о, 8, 25 =9, 91с.

Таблица 2.2

Результаты наблюдений

Номер наблю­дений 9хл, м3 tn, с Номер наблю­дений <? хл. м3 'ц, с Номер наблю­дений <? хл. И3 'ц, с
  0, 29     0, 44     0, 53  
  0, 43     0, 36     0, 66  
  0, 55     0, 52     0, 64  
  0, 58     0, 33     0, 29  
  0, 64     0, 41     0, 61  
  0, 74     0, 61     0, 71  
  0, 53     0, 49     0, 71  

Коэффициент корреляции по формуле (2.36) равен гя, = 0, 8485.

Его значение свидетельствует о достаточно тесной связи между объ­емом хлыста и временем цикла.

Таблица 2.3

Результаты вычислений

п 9хл А Яхп 'ц п < 7хл я1
  0, 29 0, 0841   5, 22   0, 41 0, 1681   15, 58
  0, 43 0.1849   10, 32   0, 61 0, 3721   25, 62
  0, 55 0, 3025   14, 85   0, 49 0, 2401   15, 19
  0, 58 0, 3364   22, 04   0, 53 0, 2809   18, 02
  0, 64 0, 4096   28, 80   0, 66 0, 4356   36, 30
  0, 74 0, 5476   34, 04   0, 64 0, 4096   24, 32
  0, 53 0, 2809   21, 73   0, 29 0, 0841   7.25
  0, 44 0, 1936   13, 64   0, 61 0, 3721   29, 89
  0, 36 0, 1296   9, 36   0, 71 0.5041   28, 40
  0, 52 0, 2704   19, 24   0, 71 0, 5041   34, 08
  0, 33 0, 1089   7, 26 I 11, 07 6, 2193   421, 15

На примере экспериментальных данных, приведенных в табл. 2.2,

применим метод наименьших квадратов для выявления линейной зависи-

II. iiiiifuM информация для моделирования

мости вида tu = а + bqxn. Для этого производим ряд вычислений, и i.i к в табл. 2.3.

В соответствии с формулой (2.37) имеем

f21a+l 1, 076 = 755;

1, 07а + 6, 216 = 421, 15.

Решив эту систему уравнений, получаем: а = 4, 14; 6 = 60, 3.

Таким образом, искомое уравнение имеет вид tn= 4, 15+60, З^хл-

Построив график уравнения (3.40), можно убедиться, что проходит через поле точек, разделяя его примерно пополам.

Дня углубленной проработки рекомендуем [19, 32].

2.4.3. ОБРАБОТКА СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ В КОМПЬЮТЕРНЫХ ПРОГРАММНЫХ СРЕДАХ

Изложенные выше теоретические положения и методики обработки

и гической информации, полученной в ходе различных эксперимен-

| ■ 'и, реализуются в различных математических программных средах. К ним

и • н гея Excel, Mathcad, Maple [33-35] и другие. Однако перечисленные

| ррлы лишь частично используют методики статистических процедур об- 1»иГи. | к и случайной величины и определения статистических зависимостей. I»! •, например, в них не предусмотрена возможность сравнения теоретиче-

in распределения с эмпирическим и, соответственно, выбор или под-

«и наиболее подходящего распределения к реальным данным и пр.

11олностью отвечают требованиям ГОСТа по обработке статистиче- imih минных лишь специализированные программные среды, например, I A KiRAPHICS или STATISTICA [36]. Наибольшее распространение в |'

|,

Ке статистических результатов получила последняя из названных I |if I Поэтому далее приводится пример компьютерной обработки и кмПпри шкона распределения в среде STATISTICA. П результате наблюдений за работой ВПМ ЛП-19 получена выборка»Hrt'n 11IIIt ирсмени цикла объемом п, равным 192. Наблюдения проводи- н|| I при запасе на гектар, равном 275 м3, и среднем объеме хлыста, рав- 'I м'. Последовательность обработки наблюдений в математической .•I hi рммммой среде STATISTICA представлена на рис. 2.5-2.8. Анормаль­на р. i\ IIм аты исключаются лицом, принимающим решение (ЛПР), по- i и I ним сравнения рассчитанного им же критерия Греббса и его таблич- н нии, при программном пересчете статистических оценок. сведен- (3.39) (3.40) прямая Раздел 2 средние квадратические отклонения а? = >, 019194 =0, 1385 м3; 25= 9, 91с. Таблица 2.2 Результаты наблюдений Номер наблю­дений 9хл, м3 '№ с Номер наблю­дений ? хл, м3 1№ с Номер наблю­дений Я™, м3 с 0, 29 0, 44 0, 53 0, 43 0, 36 0, 66 0, 55 0, 52 0, 64 0, 58 0, 33 0, 29 0, 64 0, 41 0, 61 0, 74 0, 61 0, 71 0, 53 0, 49 0, 71 Коэффициент корреляции по формуле (2.36) равен rql = 0, 8485. Его значение свидетельствует о достаточно тесной связи между объ­емом хлыста и временем цикла. Таблица 2.3 Результаты вычислений п 9хл А 'ц Яхя 'и п ? хл А 'в ? хл'ц 0, 29 0, 0841 5, 22 0, 41 0, 1681 15, 58 0, 43 0, 1849 10, 32 0, 61 0, 3721 25, 62 0, 55 0, 3025 14, 85 0, 49 0, 2401 15, 19 0, 58 0, 3364 22, 04 0, 53 0, 2809 18, 02 0, 64 0, 4096 28, 80 0, 66 0, 4356 36, 30 0, 74 0, 5476 34, 04 0, 64 0, 4096 24, 32 0, 53 0, 2809 21, 73 0, 29 0, 0841 7.25 0, 44 0, 1936 13, 64 0, 61 0, 3721 29, 89 0, 36 0, 1296 9, 36 0, 71 0.5041 28, 40 0, 52 0, 2704 19, 24 0, 71 0, 5041 34, 08 0, 33 0, 1089 7, 26 I 11, 07 6, 2193 421, 15 На примере экспериментальных данных, приведенных в табл. 2.2, применим метод наименьших квадратов для выявления линейной зависи- II. iiiiifuM информация для моделирования мости вида tu = а + bqxn. Для этого производим ряд вычислений, сведен­ных в табл. 2.3. В соответствии с формулой (2.37) имеем f21a+l 1, 076 = 755; 1, 07а +6, 216 = 421, 15. (3.39) Решив эту систему уравнений, получаем: а = 4, 14; 6 = 60, 3. Таким образом, искомое уравнение имеет вид V=4, 15+60, 3q„. (3.40) Построив график уравнения (3.40), можно убедиться, что прямая приходит через поле точек, разделяя его примерно пополам. Для углубленной проработки рекомендуем [19, 32]. 2.4.3. ОБРАБОТКА СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ В КОМПЬЮТЕРНЫХ ПРОГРАММНЫХ СРЕДАХ Изложенные выше теоретические положения и методики обработки it" чи гической информации, полученной в ходе различных эксперимен- , ревизуются в различных математических программных средах. К ним и шея Excel, Mathcad, Maple [33-35] и другие. Однако перечисленные • ремы лишь частично используют методики статистических процедур об- mi случайной величины и определения статистических зависимостей. I ак, например, в них не предусмотрена возможность сравнения теоретиче- miMi распределения с эмпирическим и, соответственно, выбор или под- I наиболее подходящего распределения к реальным данным и пр. 11олностью отвечают требованиям ГОСТа по обработке статистиче- |п. минных лишь специализированные программные среды, например, I \ KIRAPHICS или STATISTICA [36]. Наибольшее распространение в • -i.p.имккс статистических результатов получила последняя из названных I pr I Поэтому далее приводится пример компьютерной обработки и йыП| ipa шкона распределения в среде STATISTICA. И результате наблюдений за работой ВПМ ЛП-19 получена выборка жим! null ирсмени цикла объемом п, равным 192. Наблюдения проводн­иц I при запасе на гектар, равном 275 м3, и среднем объеме хлыста, рав- ним (I ' I м'. Последовательность обработки наблюдений в математической ч риммной среде STATISTICA представлена на рис. 2.5-2.8. Анормаль- р. iv иматы исключаются лицом, принимающим решение (ЛПР), по- i I | ним сравнения рассчитанного им же критерия Греббса и его таблич- н ния, при программном пересчете статистических оценок. Раздел 2 TEXT VALU Рис. 2.5. Фрагменты выборки значений времени цикла ВПМ: слева - неупорядоченная; справа - после исключения анормальных результатов и упорядоченная После исключения анормальных результатов объем выборки для рассмат­риваемого примера составил 187 значе­ний. Исключению подверглись пять по­следних значений упорядоченного ряда. Окончательные статистические оценки представлены на рис. 2.6. Здесь даны доверительный интервал [19, 15, 21, 46] для среднего, равного 20, 3, минимальное (3) и максимальное (47) времени цикла в выборке, а также СКО, равное 8, 02. На рис. 2.7 представлены разбивка на восемь интервалов, заданная ЛПР (STATISTICA может также выполнять разбивку на интервалы без вмешательст­ва ЛПР) и частоты соответствующих интервалов (по каждому и накопленные) в абсолютном и процентном выражении. Процентное выражение частот, деленное на сто, является частостью. |S IATISTJCA: Basic Statistics and Tables [Descriptive Statistics |1ц_чп sta)]   £ te £ < ft Йая fripht Options tfnda* Help Continue. Kini»u* Valid N 19.14848 21.46115 3.000000 47.00000 8.015317.586138 jOiiptirOFF |S«iOff |W«0*CHT Г Рис. 2.6. Значения статистических оценок выборки Процедура этапов построения гистограммы, таблиц вычисления зна­чений теоретических и эмпирических частот для расчета критерия Пирсо­на, гистограммы и кривой плотности наиболее подходящего закона рас­пределения, окна задания количества интервалов (категорий) и их границ II. iiiiifuM информация для моделирования представлена на рис. 2.8. На рис. 2.8 английский текст преобразован с ав- шрекой редакцией в русский. НКЕЗ MATISTICA Basic Stalistics and Tables [ВР_ЦИК11А (tu„sn sta)] In £ •» E< * yew fenafcros firapht Qptiont tfndow ЦФ Границы иниерВал 9 4.81283422 I 4, 8128342 ! 39 16.04278075 20.8556150 109 37.43315508 58.2887701 153 23.52941176 81.8181818 173 10.69518717 92.5133690 180 3.74331551 96.2566845 185 2, 67379679 98.9304813 187: 1.06951872 100.0000000 187 0, 00000000 100.0000000 ').00000< -x< 15, 0000 iS.0000< -»< 21.QP00 21, 0000< -x< 27.0000; 7.0000<»ж< 33.0000 J 3.0000< *x< 39, 0000 l i, 0000< -x< 45.0000 4l., 0000< -»< 51, 0n00 И Using ISetOFF |W«j*itOFF [ I'm, 2.7. Таблица границ интервалов и частот в абсолютном и процентном выражениях По результатам компьютерной подгонки теоретического распределе­нии к > мпирическому определено: выбранный закон - нормальный, критерий ия (хи-квадрат) - равен 15, 626 при уровне значимости а = 0, 001 (среда го а выводит обозначение р) и числе степеней свободы сс = 5. Далее точно сравнить полученное значения хи-квадрат критерия при • • - 0, 001 с табличным [29], равным 18, 5, и принять гипотезу о приемлемо- | I и нормального распределения. Более эффективно сравнивать, на предмет iiintOopa, несколько распределений между собой. Эта возможность весьма т." фо реализуется в среде STATISTICA. УПРАЖНЕНИЯ К разделу 2.3 11роведите подготовку к наблюдению любой случайной величины, не тре- шачительных временных затрат для обработки. В качестве случайной «. пинии можно выбрать: при нахождении на производственной или учебной н,..и тис объем хлыста, диаметр сортимента, время цикла лесозаготовительной iHHiiiiii.i, интервалы времени между прибытиями автопоездов; при нахождении в пуча или дома - времена циклов лабораторных установок, другие техноло- щи факторы лабораторных установок и процесса их функционирования. Раздел 2 МЫИ1М.|р|х| jfSEte ЕЛ бпг^гё fiwphi Options tfndon tt*> jjiljsl JiJx| '/ALU Рис. 2.5. Фрагменты выборки значений времени цикла ВПМ: слева - неупорядоченная; справа - после исключения анормальных результатов и упорядоченная После исключения анормальных результатов объем выборки для рассмат­риваемого примера составил 187 значе­ний. Исключению подверглись пять по­следних значений упорядоченного ряда. Окончательные статистические оценки представлены на рис. 2.6. Здесь даны доверительный интервал [19, 15, 21, 46] для среднего, равного 20, 3, минимальное (3) и максимальное (47) времени цикла в выборке, а также СКО, равное 8, 02. На рис. 2.7 представлены разбивка на восемь интервалов, заданная ЛПР (STATISTICA может также выполнять разбивку на интервалы без вмешательст­ва ЛПР) и частоты соответствующих интервалов (по каждому и накопленные) в абсолютном и процентном выражении. Процентное выражение частот, деленное на сто, является частостью. SIATISTICA: Basic Statistics and Tables - (Descnptive Statistics |tu_yn, sta)] £ te Ed* уам finifcm fitwm Options tfndow Help 1 Continue... | Valid H BF_UilKJU ^Jil   1 Ке„> Confid. -95.ООО* 19.14848 Conf id. +95, 000% 21.46115 Kin lmua Max1»и»! 1 Std.Dev. Standard Error идти 3.01 10000 47, 00000 8.015317.586138 " |Oulput: OFF (SetOfF |Wcitf<: OFP f~ Рис. 2.6. Значения статистических оценок выборки Процедура этапов построения гистограммы, таблиц вычисления зна­чений теоретических и эмпирических частот для расчета критерия Пирсо­на, гистограммы и кривой плотности наиболее подходящего закона рас­пределения, окна задания количества интервалов (категорий) и их границ 11. \одная информация для моделирования представлена на рис. 2.8. На рис. 2.8 английский текст преобразован с ав- трской редакцией в русский. III/03422459893 4.6128342 IS tATISl 1СА Basic Statistics and Tahlns [BPJIMKIIA (1ц an stall Г! I to EtS y«w Дп*ш Graphs Qptiont Window t№ Границ интервал Частота   4, 81283422 9.00000< -х< 15.0000 16, 04278075 15. 0000< *ж< 21. 0000 37.43315508 Л.0000< -х< 27, 0000 23.52941176 17.0000< вх< 33, 0000 10.69518717 П, 0000< -х< 39-, 0000 3.74331551 |), 0000< -х< 45.0000 2, 67379679 4S.0000< =х< 51, 0000 2: 1, 06951872 Kissing 187 } 0.00000000 Hi 20.8556150 58.2887701 81.8181818 92.5133690 96.2566845 98.9304813 ЮО.ООООООО ЮО.ООООООО " |0utpUt0FF |S«tOFF |W«s*tQFF f I'm. 2.7. Таблица границ интервалов и частот в абсолютном и процентном выражениях По результатам компьютерной подгонки теоретического распределе­нии I. > мпирическому определено: выбранный закон - нормальный, критерий теня (хи-квадрат) - равен 15, 626 при уровне значимости а = 0, 001 (среда и» h i го а выводит обозначение р) и числе степеней свободы сс = 5. Далее ни ни очно сравнить полученное значения хи-квадрат критерия при н ■ 0, 001 с табличным [29], равным 18, 5, и принять гипотезу о приемлемо- | I н нормального распределения. Более эффективно сравнивать, на предмет нпцПора, несколько распределений между собой. Эта возможность весьма hi н ipo реализуется в среде STATISTICA. УПРАЖНЕНИЯ К ра зделу 2.3 I (роведите подготовку к наблюдению любой случайной величины, не тре- ell шачительных временных затрат для обработки. В качестве случайной можно выбрать: при нахождении на производственной или учебной ч н пни' объем хлыста, диаметр сортимента, время цикла лесозаготовительной • шиши интервалы времени между прибытиями автопоездов; при нахождении в пут или дома - времена циклов лабораторных установок, другие техноло- к иг факторы лабораторных установок и процесса их функционирования. II. iiiiifuM информация для моделирования К разделу 2.4.1 * Определите частоты, частости и вид случайной величины - дискретная или мощи рывная - для примера к разделу 2.3. * 11ро ведите упорядочивание и представьте ряд распределения для этого же примера. * 11роведите проверку результатов наблюдений - для случайной величины и их, полученных в упражнении к разделу 2.2, - на анормальность. * Нычислите среднее арифметическое, выборочную дисперсию и среднее | ни чрншчсское отклонение на основе выражений (2.11), (2.12), (2.13) для данных исключения анормальных результатов. * 11остройте гистограмму или многоугольник на основе данных, полученных и предыдущих упражнениях. * 11а основе гистограммы (многоугольника) и графиков плотности (см. рис. '! I подберите наиболее приемлемый закон распределения. * 11роведите проверку согласия выбранного закона распределения по наибо- находящему критерию (Пирсона, Колмогорова) К разделу 2.4.2 * Определите наличие зависимости, вычислив коэффициент корреляции ме- + и пшметром и объемом хлыста. ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ I Какие способы могут быть использованы для обработки эксперименталь­на шиш, IX лесопромышленного комплекса? ! С какой целью проводится упорядочивание результатов наблюдений? I В чем заключается сущность проверки результатов наблюдений на анор- Ми н.пость? 4. Как рассчитываются статистики выборки - среднее арифметическое, вы- гшрн'ниш дисперсия, среднее квадратическое отклонение? " | Какова последовательность выбора закона распределения? 6. Каким образом проводится построение гистограмм и многоугольников для нмнпрпческих распределений? /.В чем заключается сущность критериев согласия (раскройте, используя ■ рифичсскую интерпретацию критериев на рис. 2.4)? К Каким образом определяются вероятности и теоретические частоты вы- иго шконараспределения? Ч, С какой целью - применительно к лесопромышленным объектам - прово- рудоемкая процедура выбора закона распределения? IО В чем сущность метода наименьших квадратов и что является мерой рас- и I н пня в этом методе?






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.