Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Первичная обработка материалов массовых наблюдений.






Исходным пунктом исследования, проводимого с использованием статистических методов, является массовое наблюдение, то есть сбор информации о признаках исследуемых объектов

Материалы массовых наблюдений первоначально представляют собой довольно беспорядочную массу различных сведений. Первым этапом проведения первичной обработки является сводка.

Сводка - это подсчет числа единиц наблюдаемой совокупности.

Пример 10. Пусть имеются данные о возрасте 100 рецидивистов, осужденных за грабеж и разбой:

18, 20, 32, 23, 20, 24, 22, 18, 29, 23, 19, 21, 18, 23, 18, 24, 27, 31, 19, 25, 27, 21, 28, 25, 16, 17, 27, 21, 19, 20, 19, 25, 18, 27, 22, 23, 19, 31, 32, 27, 19, 22, 30, 17, 22, 19, 18, 24, 20, 22, 17, 29, 21, 27, 17, 31, 25, 20, 24, 19, 26, 28, 21, 18, 26, 21, 20, 23, 26, 23, 19, 25, 21, 20, 18, 25, 33, 18, 33, 19, 33, 28, 31, 22, 30, 19, 26, 18, 29, 20, 29, 19, 23, 32, 17, 20, 33, 21, 33, 19.

После упорядочивания этих данных в порядке возрастания получим следующий ряд:

16, 17, 17, 17, 17, 17, 18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 21, 21, 21, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 28, 28, 28, 29, 29, 29, 29, 30, 30, 31, 31, 31, 31, 32, 32, 32, 33, 33, 33, 33, 33.

Операция упорядочивания ряда числовых данных по возрастанию (убыванию) называется его ранжированием. После сводки материалы наблюдения принимают следующий вид, для большего удобства записываемый в виде таблицы.

таблица 1

Возраст                                    
Число лиц                                    

 

Наблюдаемые значения возраста (х1=16, х2=17,..., х18=33) называются вариантами, а последовательность вариант, записанная в возрастающем порядке, - вариационным рядом или рядом распределения.

Числа наблюдений в начале примера - это числа лиц n1, n2,..., n18 называются частотами. Относительной частотой называется отношение числа наблюдений данной варианты (ni) к общему числу наблюдений (n).

Отметим, что сумма относительных частот равна единице:

Накопленной частотой называется сумма частот всех вариант от левой границы вариационного ряда до данной варианты. Для последней варианты накопленная частота всегда равняется единице.

Найдем частоты каждого из возрастов:

таблица 2

Возраст                                    
Отн. част. 0, 01 0, 05 0, 10 0, 13 0, 09 0, 08 0, 06 0, 07 0, 04 0, 06 0, 04 0, 06 0, 03 0, 04 0, 02 0, 04 0, 03 0, 05
накопл част. 0, 01 0, 06 0, 16 0, 29 0, 38 0, 46 0, 52 0, 59 0, 63 0, 69 0, 73 0, 79 0, 82 0, 86 0, 88 0, 92 0, 95  

 

Теперь можно, например, подсчитать сколько в России преступников, совершивших преступление в возрасте 18 лет. Доля 18-летних преступников 0, 1. Умножив общее число лиц, нарушивших уголовный закон, на 0, 1 получим искомое число.

Перечень вариант и соответствующих им частот называют статистическим распределением выборки. При соблюдении всех правил проведения выборочного исследования статистическое распределение выборки является экспериментальным отражением соответствующего закона распределения случайной величины и может служить основанием для анализа действующих факторов и закономерностей.

Выборки большого объема разбивают на интервалы. Количество интервалов зависит от объема выборки.

Рекомендуемое число интервалов для выборок разного объема:

таблица 3

Объем выборки 10-20 30-50 60-90 100-200 300-400
Число интервалов (k)   6-7      

 

Группировка по возрасту 100 рецидивистов, осужденных за грабеж и разбой:

таблица 4

Возраст 16-17 18-19 20-21 22-23 24-25 26-27 28-29 30-31 32-33
Частота возраста 0, 06 0, 23 0, 17 0, 13 0, 10 0, 10 0, 07 0, 06 0, 08
Накопленная частота 0, 06 0, 29 0, 46 0, 59 0, 69 0, 79 0, 86 0, 92  

 

Здесь статистическое распределение задано в виде последовательности интервалов и соответствующих им частот. В качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал.

Вариационные ряды бывают дискретные и интервальные (непрерывные). Вариационный ряд называется дискретным, если в нем указаны конкретные значения варьируемого признака. Вариационный ряд называется интервальным (непрерывным), если предполагается, что варианты могут принимать любое значение в рамках указанных интервалов.

При построении интервального ряда необходимо выбрать оптимальное число групп. Малое число групп снижает разнообразие значений признака, а большое число групп может исказить форму распределения случайными колебаниями частот. Длина интервала должна быть постоянной для всех групп.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.