Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Генеральная совокупность и выборка






Математическая статистика

Основными понятиями математической статистики являются генеральная совокупность и выборка.

Генеральная совокупность – это совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений определенной случайной величины.

Генеральная совокупность может быть конечной или бесконечной в зависимости от того, конечна или бесконечна совокупность составляющих ее объектов.

Выборкой (выборочной совокупностью) называется совокупность случайно отобранных объектов из генеральной совокупности.

Выборка должна быть репрезентативной (представительной), то есть ее объекты должны достаточно хорошо отражать свойства генеральной совокупности.

Выборка может быть повторной, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность, и бесповторной, при которой отобранный объект не возвращается в генеральную совокупность.

Число N объектов генеральной совокупности и число n объектов выборки называют объемами генеральной и выборочной совокупностей соответственно.

 

Дискретный и интервальный вариационные ряды (статистические распределения)

Полученные различными способами отбора данные образуют выборку, обычно это множество чисел, расположенных в беспорядке. По такой выборке трудно выявить какую-либо закономерность их изменения (варьирования).

Для обработки данных используют операцию ранжирования, которая заключается в том, что результаты наблюдений над случайной величиной, то есть наблюдаемые значения случайной величины располагают в порядке возрастания.

После проведения операции ранжирования значения случайной величины объединяют в группы, то есть группируют так, что в каждой отдельной группе значения случайной величины одинаковы. Каждое такое значение называется вариантой. Варианты обозначаются строчными буквами латинского алфавита с индексами, соответствующими порядковому номеру группы.

Последовательность вариантов, записанных в возрастающем порядке, называется вариационным рядом.

Число, которое показывает, сколько раз встречаются соответствующие значения вариантов в ряде наблюдений, называется частотой и обозначается ni, где i — номер варианты.

Отношение частоты данного варианта к общей сумме частот называется относительной частотой и обозначается или , где m — число вариант.

Дискретным статистическим рядом называется ранжированная совокупность вариант с соответствующими им частотами или относительными частотами .

Характеристики дискретного статистического ряда:

1. Размах варьирования .

2. Мода Mo — варианта, имеющий наибольшую частоту

3. Медиана Me — значение случайной величины, приходящееся на середину ряда.

Пусть n — объем выборки. Если n=2k, то есть ряд имеет четное число членов, то . Если n=2k+1, то есть ряд имеет нечетное число членов, то .

Если число значений изучаемой величины является велико, то составляют интервальный статистический ряд.

Сначала определяют число интервалов m, приближенно равном корню квадратному из объема выборки. Затем определяют длину h частичного интервала: .

Более точно количество m интервалов можно рассчитать с помощью формулы Стерджеса: .

Если шаг окажется дробным, то за длину интервала берут ближайшее целое число или ближайшую простую дробь (обычно берут интервалы одинаковые по длине, но могут быть интервалы и разной длины).

За начало первого интервала рекомендуется брать величину , а конец последнего должен удовлетворять условию . Промежуточные интервалы получают, прибавляя к концу предыдущего интервала шаг h.

Просматривая результаты наблюдений, определяют сколько значений случайной величины попало в каждый конкретный интервал. При этом в интервал включают значения, большие или равные нижней границе интервала, и меньшие – верхней границы.

В первую строку таблицы статистического распределения вписывают частичные промежутки . Во вторeю строку статистического ряда вписывают количество наблюдений (где ) попавших в каждый интервал; то есть частоты соответствующих интервалов.

При вычислении интервальных относительных частот округление результатов следует производить таким образом, чтобы сумма относительных частот была равна 1.

Иногда интервальный статистический ряд, для простоты исследований, условно заменяют дискретным. В этом случае серединное значение i-го интервала принимают за варианту , а соответствующую интервальную частоту — за частоту этой варианты.

Статистическим распределением выборки называют перечень вариант или интервалов и соответствующих им частот или относительных частот (частостей).

В математической статистике под распределением количественного признака X понимают соответствие между наблюдаемыми вариантами (табл. 5) или интервалами и их частотами , или относительными частотами .

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.