Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Статистические и вероятностные методы исследований






6.1. Статистическая совокупность

 

Явления жизни, как и вообще все явления материального мира, имеют две неразрывно связанные стороны: качественную, воспринимаемую непосредственно органами чувств, и количественную, выражаемую числами при помощи счета и меры.

При исследовании различных явлений природы применяют одновременно и качественные и количественные показатели. Несомненно, что только в единстве качественной и количественной сторон наиболее полно раскрывается сущность изучаемых явлений. Однако в действительности приходится пользоваться либо теми, либо другими показателями.

Несомненно, что количественные методы как более объективные и точные имеют преимущество перед качественной характеристикой предметов.

Сами по себе результаты измерений, хотя и имеют известное значение, еще недостаточны для того, чтобы сделать из них необходимые выводы. Цифровые данные, собранные в процессе массовых испытаний – это всего лишь сырой фактический материал, который нуждается в соответствующей математической обработке. Без обработки – упорядочения и систематизации цифровых данных не удается извлечь заключенную в них информацию, оценить надежность отдельных суммарных показателей, убедиться в достоверности наблюдаемых между ними различий. Эта работа требует от специалистов определенных знаний, умения правильно обобщать и анализировать собранные в опыте данные. Система этих знаний и составляет содержание статистики – науки, занимающейся главным образом вопросами анализа результатов исследований в теоретической и прикладной областях науки.

Следует иметь ввиду, что математическая статистика и теория вероятностей являются науками сугубо теоретическими, абстрактными; они изучают статистические совокупности безотносительно к специфике входящих в их состав элементов. Методы математической статистики и лежащей в ее основе теории вероятностей приложимы к самым различным областям знания, включая и гуманитарные науки.

Изучение явлений проводятся не по отдельным наблюдениям, которые могут оказаться случайными, нетипичными, неполно выражающими сущность данного явления, а на множестве однородных наблюдений, что дает более полную информацию об изучаемом объекте. Некоторое множество относительно однородных предметов, объединяемых по тому или иному признаку для совместного изучения, называют статистической

 

совокупностью. Совокупность объединяет какое-то число однородных наблюдений или регистраций.

Элементы, входящие в состав совокупности, называются ее членами, или вариантами. Варианты – это отдельные наблюдения или числовые значения признака. Так, если обозначить признак через Х (большое), то его значения или варианты будут обозначаться через х (малое), т.е. х1, х2, и т.д.

Общее число вариантов, входящих в состав данной совокупности называется ее объемом и обозначается буквой n (малое).

Когда обследованию подвергается вся совокупность однородных объектов в целом, ее называют общей, генеральной, совокупностью Примером такого рода сплошного описания совокупности могут служить общегосударственные переписи населения, поголовный статистический учет животных в стране. Разумеется, полное обследование генеральной совокупности дает наиболее полноценную информацию о ее состоянии и свойствах. Поэтому естественно стремление исследователей к тому, чтобы в в совокупность объединялось как можно большее число наблюдений.

Однако в действительности редко приходится прибегать к обследованию всех членов генеральной совокупности. Во-первых, потому, что эта работа требует большой затраты времени и труда, а во-вторых, она не всегда осуществима по целому ряду причин и различных обстоятельств. Так что вместо сплошного обследования генеральной совокупности изучению подвергается обычно какая-то ее часть, получившая название выборочной совокупности, или выборки. Она представляет собой тот образец, по которому судят о всей генеральной совокупности в целом. Например, чтобы узнать средний рост призывного населения некоторой области или района, вовсе не обязательно измерять всех призывников, проживающих в данной местности, а достаточно измерить какую-то часть их.

1. Выборка должна быть вполне представительной, или типичной, т.е. чтобы в ее состав входили преимущественно те варианты, которые наиболее полно отражают генеральную совокупность. Поэтому, чтобы приступить к обработке выборочных данных, их внимательно просматривают и удаляют явно нетипичные варианты. Например, при анализе стоимости продукции, выпускаемой предприятием, должна быть исключена стоимость в те периоды, когда предприятие не было в полной мере обеспечено комплектующими или сырьем.

2. Выборка должна быть объективной. При образовании выборки нельзя поступать по произволу, включать в ее состав только те варианты, которые кажутся типичными, а все остальные браковать. Доброкачественная выборка производится без предвзятых мнений, по методу жеребьевки или лотерии, когда ни один из вариантов генеральной совокупности не имеет никаких преимуществ перед остальными – попасть или не попасть в состав выборочной совокупности. Иными словами, выборка должна производиться по принципу случайного отбора, без влияний на ее состав.

3. Выборка должна быть качественно однородной. Нельзя включать в состав одной и той же выборки данные, полученные в разных условиях, например, стоимость изделий, полученных при разной численности работников.

 

6.2. Группировка результатов наблюдений

Обычно результаты опытов и наблюдений заносятся в виде цифр в учетные карточки или журнал, а иногда просто на листы бумаги – получается ведомость или реестр. Такие первоначальные документы, как правило содержат сведения не об одном, а о нескольких признаках, по которым проводились наблюдения. Эти документы служат основным источником образования выборочной совокупности. Делается это обычно так: на отдельный лист бумаги из первичного документа, т.е. картотеки, журнала или ведомости, выписываются числовые значения того признака, по которому образуется совокупность. Варианты в такой совокупности представлены обычно в виде беспорядочной массы цифр. Поэтому первым шагом на пути обработки такого материала является упорядочение, систематизация его – группировка вариант в статистические таблицы или ряды.

Одной из наиболее распространенных форм группировок выборочных данных служат статистические таблицы. Они имеют иллюстративное значение, показывая какие-то общие итоги, положение отдельных элементов в общей серии наблюдений.

К другой форме первичной группировки выборочных данных относится способ ранжирования, т.е. расположение вариант в определенном порядке – по возрастающими или убывающим значениям признака. В результате получается так называемый ранжированный ряд, который показывает в каких пределах и каким образом варьирует данный признак. Например, имеется выборка следующего состава:

 

5, 2, 1, 5, 7, 9, 3, 5, 4, 10, 4, 5, 7, 3, 5, 9, 4, 12, 7, 7

 

. Видно, что признак изменяется от 1 до 12 каких-то единиц. Располагаем варианты в возрастающем порядке:

 

1, 2, 3, 3, 4, 4, 4, 5, 5, 5, 5, 7, 7, 7, 7, 9, 9, 10, 12.,

 

В результате получился ранжированный ряд значений варьирующего признака.

Совершенно очевидно, что способ ранжирования в том виде, как он здесь показан, применим лишь к выборкам малого объема. При большом числе наблюдений ранжирование затрудняется, т.к. ряд получается настолько длинным, что теряет свое значение.

При большом числе наблюдений ранжировать выборочную совокупность принято в виде двойного ряда, т.е. с указанием частоты или повторяемости отдельных вариант ранжированного ряда. Такой двойной ряд ранжированных значений признака называется вариационным рядом или рядом распределения. Простейшим примером вариационного ряда могут служить ранжированные выше данные, если их расположить следующим образом:

 

Значения признака

(варианты) 1 2 3 4 5 7 9 10 12

повторяемость

(вариант) частоты 1 1 2 3 5 4 2 1 1

 

Вариационный ряд показывает, с какой частотой отдельные варианты встречаются в данной совокупности, как они распределяются, что имеет большое значение, позволяя судить о закономерности варьирования и диапазоне вариации количественных признаков. Построение вариационных рядов облегчает вычисление суммарных показателей – средней арифметической и дисперсии или рассеивания вариант около их среднего значения – показателей, которыми характеризуется любая статистическая совокупность.

Вариационные ряды бывают двух видов: прерывистые и непрерывные. Прерывистый вариационный ряд получается при распределении дискретных величин, к которым относятся счетные признаки. Если же признак варьирует непрерывно, т.е. может принимать любые значения в пределах от минимальной до максимальной вариант совокупности, то последняя распределяется в непрерывный вариационный ряд.

Для построения вариационного ряда дискретно варьирующего признака достаточно всю совокупность наблюдений расположить в виде ранжированного ряда, указав частоты отдельных вариантов. В качестве примера приводим данные, показывающие распределение по размеру 267 деталей (табл.5.4)

 

Таблица 6.1. Распределение деталей по размеру.

 

Варианты х (размер деталей, мм)                      
Частота у (число деталей, шт)                      

 

Чтобы построить вариационный ряд непрерывно варьирующих признаков, нужно всю вариацию от минимального до максимального варианта разбить на отдельные группы или промежутки (от-до), называемые классами, а затем распределить все варианты совокупности по этим классам. В результате получится двойной вариационный ряд, в котором частоты относятся уже не к отдельным конкретным вариантам, а ко всему интервалу, т.е. оказываются частотами не вариант, а классов.

Разбивка общей вариации на классы производится в масштабе классового интервала, который должен быть одинаковым для всех классов вариационного ряда. Величина классового интервала обозначается через i (от слова intervalum – промежуток, расстояние); она определяется по следующей формуле

, (6.1)

где: i – классовый интервал, который берется целым числом;

- максимальная и минимальная варианты выборки;

lg.n – логарифм числа классов, на которые разбивается выборочная совокупность.

Число классов устанавливается произвольно, но с учетом того обстоятельства, что число классов находится в некоторой зависимости от объема выборки: чем больший объем имеет выборочная совокупность, тем больше должно быть классов, и наоборот – при меньших объемах выборки следует брать и меньшее число классов. Опыт показал, что и на малых выборках, когда приходится группировать варианты в виде вариационного ряда, не следует устанавливать меньше 5-6 классов. При наличии же 100-150 вариант число классов можно довести до 12-15. Если же совокупность состоит из 200-300 вариант, то ее разбивают на 15-18 классов и т.д. Разумеется, эти рекомендации весьма условны и их нельзя принимать как установленное правило.

При разбивке на классы в каждом конкретном случаев приходится считаться с целым рядом различных обстоятельств, добиваясь того, чтобы обработка статистического материала давала наиболее точные результаты.

После того, как установлен классовый интервал и выборочная совокупность разбита на классы, производится разноска вариант по классам и определяются число вариаций (частоты) каждого класса. В результате получается вариационный ряд, в котором частоты относятся не к отдельным вариантам, а к определенным классам. Сумма всех частот вариационного ряда должна равняться объему выборки, то есть

(6.2)

где: - знак суммирования;

р – частота.

n – объем выборки.

 

Если такого равенства не оказалось, значит при разноске вариант по классам допущена ошибка, которую необходимо устранить.

Обычно для разноски вариант по классам составляется вспомогательная таблица, в которой имеются четыре графы: 1) классы по данному признаку (от – до); 2) – среднее значение классов, 3) разноски вариант по классам, 4) частоты классов (см. табл. 6.2.)

Разноска вариант по классам требует большого внимания. Нельзя допускать, чтобы одна и та же варианта была отмечена дважды или одинаковые варианты попадали в разные классы. Чтобы избежать ошибок при распределении вариант по классам, рекомендуется не искать одинаковые варианты и в совокупности, а разносить их по классам, что не одно и то же. Игнорирование этого правила, что бывает в работе неопытных исследователей, отнимает много времени при разноске вариант, а главное, приводит к ошибкам.

 


Таблица 6.2. Разноска вариант по классам

Границы классов Средние значения классов (х) Частоты классов (р), %
абсолютные относительные
8-10      
10-12      
12-14      
14-16      
16-18      
18-20      
20-22      
22-24      
24-26      
26-28      
28-30      
30-32      
32-34      
ИТОГО      


.Закончив разноску вариант и подсчитав их число для каждого класса, получаем непрерывный вариационный ряд. Его надо превратить в прерывистый вариационный ряд. Для этого, как уже отмечалось, берем полусуммы крайних значений классов. Так, например, срединное значение первого класса, равное 8, 8 получено следующим образом:

(8, 6+9, 0): 2=8, 8.

Второе значение (9, 3) этой графы вычислено аналогичным способом:

(9, 01+9, 59): 2=9, 3 и т.д.

В результате получается прерывистый вариационный ряд, показывающий распределение по изучаемому признаку (табл.6.3.)

 

Таблица 6.3. Вариационный ряд

 

Среднее значение клас сов (х)   9, 3 9, 8 10, 3 10, 8 11, 3 11, 8
Частоты классов              

 

Группировка выборочных данных в виде вариационного ряда имеет двоякое назначение: во-первых, как вспомогательная операция она необходима при вычислении суммарных показателей, а во-вторых, ряды распределения показывают закономерность варьирования признаков, что очень важно. Чтобы выразить эту закономерность более наглядно, принято изображать вариационные ряды графически в виде гистрограммы (рис.6.1.)

 


 

 
 

 
 


Рис.6.1.Распределение предприятий по числу работников

Гистограмма изображает распределение вариант при непрерывном варьировании признака. Прямоугольники соответствуют классам, а их высота – количеству вариант, заключенных в каждом классе. Если из срединных точек вершин прямоугольников гистограммы опустить перпендикуляры на ось абцисс, а затем эти точки соединить между собой, получится график непрерывного варьирования, называемый полигоном или плотностью распределения.

 

6.3. Средние величины и способы их вычисления

Любые признаки, если они выражаются при помощи счета или меры, приобретают значение математических величин. Чтобы получить более или менее точную и объективную характеристику варьирующей величины, прибегают наряду с построением статистических таблиц, графиков и диаграмм к различного рода суммарным числовым показателям. Наиболее часто и широко как и в практической деятельности человека, так и в научных исследованиях используется средняя величина. Она дает суммарную характеристику любого признака, указывая на то типичное и устойчивое в явлении, что наиболее полно выражает его содержание. Так, например, принято говорить о средней производительности, о средней зарплате, о средней численности работников.

Существует несколько видов средних, которые используются в статистике: средняя арифметическая, средняя гармоническая, средняя квадратическая, средняя кубическая, средняя геометрическая, а также вспомогательные средние показатели: мода и медиана.

Значение средней арифметической, которую принято обозначать через (икс малое с черточкой наверху) есть не что иное, как частное от деления суммы всех вариант совокупности на их число, т.е.

 

(6.3.)

где: обозначают варианты, входящие в состав данной совокупности;

- знак суммирования;

n – общее число вариант, или объем выборочной совокупности.

Средняя арифметическая выражается теми же единицами меры или счета, что и характеризуемый ею признак. Возьмем пример:

 

= (8+10+7+9+10+11+13+9+12+11): 10=10.

 

Анализируя данный пример замечаем, что отдельные варианты повторяются.

Нетрудно понять, что при повторяемости отдельных вариант среднюю арифметическую можно представить как сумму произведений отдельных вариант на их частоты, отнесенную к общему числу всех вариант данной совокупности, т.е. как

(6.4.)

Так, для указанного примера средняя арифметическая определяется следующим образом.

Расчет значений х-р приведен в таблице 6.4

 

Таблица 6.4 Расчет значений произведений х-р.

 

Среднее значение классов (х)              
Частота (р)              
х-р              

 

Значение средней арифметической, вычисляемое по формуле (6.3), называется взвешенной средней на том основании, что отдельные варианты с разной частотой встречающиеся в совокупности по разному определяют значение средней величины.

Иногда признаки, с которыми приходится иметь дело, выражаются либо мерами объема, либо мерой площади. Например, средний объем загрязненного воздуха, выбрасываемого предприятием в атмосферу за определенный промежуток времени, или средняя площадь загрязнения вокруг предприятия в следствии вредных выбросов.

Средняя площадь загрязнения рассчитывается по величине средней квадратической.

Средняя квадратическая равна:

(6.5.)

Эта характеристика применяется при определении среднего размера какой-либо поверхности. Например, вблизи предприятия замечено отложение вредных веществ пятнами различного диаметра (в метрах) (табл.6.5)

 

Таблица 6.5 Число пятен загрязнения поверхности.

 

Размер пятна (х), м2            
Число случаев(р)            

 

Нужно определить средний размер этих пятен.

Средняя квадратическая пятен равна:

= =13, 9 м

 

 

Средняя кубическая равна

(6.6.)

Средняя кубическая используется при определении средних объемов различных величин. Например, для определения сорта куриных яиц были проведены измерения средних диаметров 18 куриных яиц. Полученные результаты приведены в таблице 6.6.

 

Таблица 6.6.Число яиц разного диаметра

 

Диаметр яиц (см) 4, 7 4, 8 5, 0 5, 4 5, 6 6, 0
Число случаев (р)            

 


Нужно определить средний размер яиц по их диаметру. Вычисляем среднюю кубическую этих данных:

 

Если вычислить среднюю арифметическую этого признака, она оказывается несколько меньшей по сравнению со средней кубической:

В вариационных рядах средние величины характеризуются медианой и модой.

Медиана- показатель описательного характера – не зависит от параметрических характеристик ряда. Она служит серединой вариационного ряда, по обе стороны одинаковое число вариант. Например, для следующего распределения:

 

х:                      
р:                      

 

Медиана равна 10: в обе стороны от этой величины расположено по четыре варианты. Значение 10 занимает центральное положение в этом ряду, является его медианой.

Модой называется наиболее часто встречающая величина. В непрерывных вариационных рядах мода находится обычно в том классе, который имеет наибольшее число вариант. Этот класс называется модальным классом. Например, в распределении, показанном на рисунке 6.1. мода равна 16.5 и находится в классе 12. Мода, как и медиана, - величина довольно близкая к средней арифметической и совпадает с ней при полной симметрии распределения вариант по классам вариационного ряда.

 

 

6.4.Дисперсия, среднее квадратичное отклонение

и коэффициент вариации

 

Средняя арифметическая служит одной из важнейших характеристик вариационного ряда. Но она ничего не говорит о величине вариации характеризуемого признака. Не содержат такой информации и другие рассмотренные средние показатели. А без учета диапазона изменчивости, размаха вариации нельзя дать полную характеристику изучаемого признака.

Рассмотрим пример распределения различных величин, средняя этих величин, рассчитанная по формуле (6.3) равна 10 (табл.6.7), в то же время вариации у них различные.


Таблица 6.7 Средняя величина при разном распределении.

 

Значение(хi)              
частота набл.1              
  набл.2              
  набл.3              

 

Чтобы преодолеть недостатки рассмотренного показателя, принято отклонения вариант от средней арифметической возводить в квадрат и сумму квадратов отклонений относить к общему числу наблюдений, т.е. к объему выборки. Этот показатель характеризует дисперсию и выражается следующей формулой:

(6.7.)

При возведении отклонений вариант от средней арифметической в квадрат их сумма не превращается в нуль. Кроме того, большие отклонения от средней будучи возведены в квадрат получают и больший удельный вес, оказывая большее влияние на величину показателя вариации.

Однако, возводя отклонения вариант в квадрат от средней арифметической, мы искусственно увеличиваем и сам показатель вариации. Чтобы преодолеть это берется корень квадратный из указанного отношения. Полученный таким образом показатель называется средним квадратичным отклонением.

(6.8.)

 

Знаки плюс и минус (+, -), поставленные перед радикалом указывают на то, что данный показатель в равной мере характеризует отклонения вариант от средней арифметической как в сторону больших (+), так и в сторону меньших (-) значений. В дальнейшем эти знаки опущены, подразумевая, что они стоят перед радикалом.

 

Выборка, в которой рассеяние вариант около средней арифметической больше, характеризуется и большей величиной среднего квадратического отклонения и наоборот.

Из теоретической статистики известно, что вариация генеральной совокупности больше вариации выборки, взятой из данной генеральной совокупности, в среднем в раз. На этом основании в формулу (6.7)следует внести поправку, взяв в качестве множителя подкоренного выражения величину . В результате формула (6.7.) преобразуется следующим образом:

(6.9)

 

Величина (n-1) называется числом степеней свободы. Она показывает, что в ограниченной совокупности все варианты свободны принимать любые значения, кроме одной, значение которой определяется разностью между суммой всех остальных вариант и объемом выборки. В таких случаях говорят, что одна варианта не имеет степени свободы. Например, если три какие-то значения варьируют неограниченно, то их число степеней свободы

3 - 0=3.

 

Когда же вариация новых значений ограничена каким-нибудь объемом, например числом равным 50, то две варианты могут принимать любые значения, скажем 20 и 15, а третья варианта будет иметь одно значение

50 - (20+15)=15

то есть она не имеет степени свободы. В этом случае остается только две степени свободы:

3-1=2

В любой эмпирической совокупности всегда имеется один член, не имеющий свободы вариации. Поэтому число степеней свободы для любой выборки равно (n-1). В больших совокупностях разница между n и (n-1) неощутима, она не сказывается на величине среднего квадратического отклонения. На выборках же малого объема эта разница сказывается на величине указанных показателей. Поэтому при вычислении среднего квадратического отклонения на малых выборках рекомендуется пользоваться формулой (6.9). Среднее квадратическое отклонение служит основным показателем вариации признаков. Там, где вариация больше, большим оказывается и среднее квадратическое отклонение, и наоборот. Ценность этого показателя заключается в том, что он не зависит от числа наблюдений и служит надежным мерилом сравнительной оценки однородных и независимо варьирующих величин.

Но так как среднее квадратическое отклонение зависит от абсолютной величины самих вариант и является величиной именованной, его нельзя использовать для сравнительной оценки показателей, выраженных разными единицами меры. Например, два предприятия выпускают одинаковую продукцию, но на одном предприятии выпуск продукции выражается в стоимости, на другом в объеме выпуска продукции, в этом случае сравнение в изменении выпуска продукции затруднительно.

Указанный недостаток среднего квадратического отклонения, как мерила изменчивости признаков устраняется, если выразить этот показатель в процентах от величины средней арифметической данного распределения, Полученный таким образом показатель называется коэффициентом вариации и обозначается буквой С:

(6.10)

Преимущество этого показателя заключается в том, что он – число относительное, а это позволяет использовать его для самых широких сравнений варьирующих величин.

В теоретической и прикладной статистике большое значение имеет нормирование, позволяющее использовать среднее квадратическое отклонение для оценки отдельных вариант по отношению к их средней величине данной совокупности. Такого рода оценка производится по разности между вариантой и средней арифметической, отнесенной к величине среднего квадратического отклонения, т.е.

(6.11.)

Здесь t – называется нормированным отклонением. Этот показатель (значение которого все больше будет раскрываться по мере дальнейшего изложения материала) удобен и прост как при оценке единичных вариант, так и при относительной характеристике сравниваемых друг с другом индивидов.

6.5.Вероятность события

 

В эмпирических распределениях бросается в глаза одна важная особенность - преимущественное накапливание вариант в центральных классах и постепенное убывание их числа по мере удаления от средней арифметической вариационного ряда.(см.рис.6.1) Эта особенность, составляющая одну из характерных черт варьирования различных признаков имеет широкое распространение в природе. Известно, что среди населения чаще встречаются люди среднего роста, а индивиды очень большого или очень малого роста встречаются довольно редко.

Впервые на это явление обратил внимание бельгийский статистик А.Кетле (1835), исследовавший распределение нескольких тысяч солдат американской армии по росту «…Человеческий рост, - писал он, - изменяющийся, по-видимому, самым случайным образом, тем не менее подчиняется самым точным законам, и эта особенность свойственна не только росту; она проявляется также и в весе.

 

Таблица 6.8.Частота изменения размеров стержня.

 

Длина стержня в мм (варианты) Сколько раз эта длина встретилась в опыте (частоты)
999, 6  
999, 7  
999, 8  
999, 9  
1000, 0  
1000, 1  
1000, 2  
1000, 3  
1000, 4  
Всего испытаний  

 

Из этой таблицы видно, что погрешности, допущенные при 80-кратном измерении одного и того же предмета, распределяются строго закономерно, образуя правильный, симметричный ряд. Конечно, не во всяком случае при измерении тех или иных предметов получаются столь отчетливые результаты. Но для нас главное не в этом, а в том, что в разных случаях наблюдений обнаруживается одна и та же общая закономерность. Однако, прежде, чем перейти к детальному рассмотрению этой закономерности, полезно ознакомиться с некоторыми понятиями теории вероятностей.

Из жизненного опыта возникли представления о случайных и неслучайных явлениях, которые на языке теории вероятностей принято называть событиями. Событие называется достоверным, если при заданных условиях оно обязательно наступит. В противном случае, когда событие заведомо не осуществится, оно называется недостоверным. Если же в заданных условиях событие может и наступить и не наступить, оно называется возможным, или случайным событием.

Понятие случайности относится к такому событию, которое с полной необходимостью не вытекает из данных конкретных условий, а определяется по закону случая, т.е. в зависимости от целого ряда непредвиденных и не учитываемых обстоятельств. Так, например, если в урну поместить белые и черные шары и затем наугад вынуть один шар, то заранее нельзя сказать какой это будет шар – белый или черный. В таких случаях обычно говорят о вероятности появления одного или другого из возможных событий.

Для того, чтобы иметь точную количественную меру ожидаемого события, позволяющую исследовать свойства массовых случайных явлений, водится математическое выражение вероятности как отношение числа случаев (m), «благоприятствующих» появлению ожидаемого события (А), к общему числу (n) всех возможных и несовместных испытаний (т.е. опытов, проб, тиражей, наблюдений):

(6.12.)

 

Символ Р(А) обозначает вероятность события А. «Благоприятствующими» называются такие возможности, которые приводят к осуществлению ожидаемого события. Например, при подбрасывании игрального кубика, на шести сторонах которого имеются цифры 1, 2, 3, 4, 5, 5, 6 появлению нечетных чисел «благоприятствуют» только три возможных случая 1, 3 и 5.

Вероятность – это количественная мера уверенности, с какой можно ожидать наступления данного события. Например, в урне имеется 5 белых и 10 черных шаров. Вынимается наугад один шар. Какова вероятность того, что вынутый шар окажется белым. Так как из общего числа 15 шаров в урне имеется 5 белых, то из 15 возможных исходов всего лишь 5 «благоприятствуют» ожидаемому событию, т.е. появлению белого шара. Откуда искомая вероятность

(6.13)

Это значит, что из каждых трех вынутых из урны шаров один может оказаться белым. В то же время вероятность появления черного шара при однократном опыте будет:

Очевидно, что: 1) вероятность любого события есть число, заключенное между нулем и единицей, т.е. она всегда выражается в долях единицы, хотя может быть выражена и в процентах; 2) вероятность достоверного события равна единице; 3) вероятность недостоверного события равна нулю; 4) вероятность противоположного события дополняет вероятность прямого события (А) до единицы, т.е.

 

(6.14)

 

Для удобства вероятность прямого события принято обозначать через р, а вероятность противоположного события – через q:

 

и

т.к

. р+q=1, (6.15.)

 

. то

р = 1-q (6.16.)

 

6.6. Распределение случайной величины

 

Все, что может быть измерено или исчислено в природе, называют величиной постоянной или переменной. В зависимости от обстоятельств эти величины могут принимать разные значения. Переменную величину считают определенной, если заранее, до опыта можно указать ее значение. Если же в одних и тех же условиях переменная величина может принимать разные значения, которые заранее указать нельзя, она называется случайной величиной.

Случайная величина не хаотична, а вполне закономерна: варианты распределяются по классам вариационного ряда не как попало, а в зависимости от их величины.(см.рис.6.1.) Чем ближе варианты к средней арифметической, тем чаще она встречается, и наоборот, тем больше уклоняются варианты от средней арифметической, тем реже они встречаются в генеральной совокупности. Иными словами, частота отклонения отдельных вариант от средней арифметической данной совокупности есть функция их величины. Вероятность частоты той или иной варианты в генеральной совокупности и определяется этой функцией.

Графически закономерность распределения случайных величин идеально выражается симметричной и плавной кривой, называемой кривой нормального распределения, или просто нормальной кривой (рис. 6.2) и описывается уравнением следующего вида

 

 

(6.17)

Рх – плотность вероятности распределения

е - основание натуральных логорифмов

- среднеквадратичные отклонения

π =3, 14526:

хì; х - исследуемая величина,

ì i - тое и среднее значение

Px

 
 

 

 


 

 

 
 


-x 0 +x

 

Рис.6.2. Плотность вероятности нормального распределения

 

Плотность вероятности распределения, это расположение ртрезков кривой на любом расстоянии от оси 0р, где х=0, от оси 0р, х принимает положительные значения, влево – отрицательные. характеризует амплитуду колебания отдельных значений случайной величины около средней арифметической; () – отклонение варианты от средней арифметической; выражение - максимальная ордината, соответствующая точке ; по мере удаления от этой точки, т.е. центра распределения плотность значений случайной величины падает и кривая асимптотически приближается к оси абцисс, величина =, есть ни что иное, как нормированное отклонение(см. формулу 6.11.)

Приведенная на рисунке кривая носит название Гауссовского распределения или нормального закона. Нормальному закону распределения подчиняется большинство закономерностей.

Нормальное распределение характеризуется своими параметрами, значения которых рассчитываются по следующим зависимостям:

Среднее значение

. (6.18)

среднеквадратическое отклонение

(6.19)

Параметры нормального распределения идентичны со значениями средней арифметической и средне квадратичным отклонением (формулы 3.3. и 6.7.). Следовательно, среднее арифметическое и и среднее квадратическое отклонение определены для случая подчинения распределения вероятности исследуемой величины нормальному закону распределения.

Нормальному закону распределения подчиняется большинство технических, экономических и демографических процессов.

Кроме нормального распределения случайных величин известны еще 16 законов распределения: логарифмически-нормальный, экспотенциальный и др.(см. приложение 1)

Логарифмически-нормальный закон распределения случайной величины возникает под действием большого количества факторов. По логарифмически-нормальному закону подчиняется заработная плата работников предприятия, среднегодовой доход семей административной единицы, долговечность изделия. Плотность распределения рассчитывается по формуле:

(6.20)

Параметры распределения

а=хmod (6.21)

 

(6.22)






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.