Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Простейшие описательные статистики






Для описания случайных величин используются описательные статистики: минимум, максимум, среднее, дисперсия, стандартное отклонение, медиана, мода и т.д. Статистики дают общее представление о значениях, которые принимают случайные величины.

Минимум и максимум (min, max) – это минимальное и максимальное значения переменной.

Среднее арифметическое (xs) – сумма значений переменной, делённая на n (объем выборки):

. (1.1)

Дисперсия (s2, variance, термин ввёл Фишер в 1918 году) – меняется от 0 до µ. Это наиболее часто используемая мера изменчивости случайной величины. Вычисляется по формуле:

. (1.2)

Значение 0 означает отсутствие изменчивости, т.е. переменная постоянна.

Стандартное отклонение (s, standard deviation) –корень квадратный из дисперсии. Более удобная характеристика, так как измерена в тех же единицах, что и исходная величина.

Чем выше дисперсия и стандартное отклонение, тем сильнее разбросаны значения случайной величины относительно среднего.

Медиана (термин ввёл Гальтон, 1882) – значение, которое разбивает упорядоченную по возрастанию выборку на две равные по численности части. Половина наблюдений лежит выше медианы, и половина – ниже. В некоторых случаях, например, при описании доходов населения медиана более удобна, чем среднее.

Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр. Сумма абсолютных расстояний между точками выборки и медианой минимальна. Медиана вычисляется следующим образом. Выборка упорядочивается в порядке возрастания. Как уже указывалось, получаемая последовательность , где n = 1, …., 2m+1 называется вариационным рядом или порядковыми статистиками. Если число наблюдений нечетно, то медиана выборки для дискретного ряда оценивается как Me= . Если число наблюдений четно, то медиана для дискретного ряда оценивается как Me= .

Квантиль (Кендалл, 1940) – число xp, ниже которого находится p -я часть (доля) выборки. Например, квантиль 0.20 – это такое значение xp, ниже которого находится 20% значений переменной.

Процентиль –значение квантили в процентах. Например, 25-я процентиль переменной – это значение, ниже которого располагается 25% значений переменной.

Нижняя и верхняя квартиль (лат. quarta – четверть, Гальтон, 1882) равны соответственно 25-й и 75-й процентилям.

3 точки – нижняя квартиль, медиана и верхняя квартиль – делят выборку на 4 равные части.

Квартильный размах (Гальтон, 1882) – разность значений 75-й и 25-й процентили. То есть это интервал, содержащий медиану, в который попадает 50% наблюдений.

Мода (Пирсон, 1894) – наиболее часто встречающееся (самое модное) значение переменной. Например, модный цвет платья или песня на радио, т.е. это варианта имеющая наибольшую частоту.

Если распределение имеет несколько мод, то оно называется мультимодальным. Например, в социологических опросах это означает, что существует несколько определённо различных мнений. Также это может служить индикатором того, что выборка не является однородной и наблюдения, возможно, порождены двумя или более наложенными распределениями.

Асимметрия, или коэффициент асимметрии (Пирсон, 1895) – это мера несимметричности распределения. Если коэффициент значительно отличается от 0, распределение является асимметричным.

, (1.3)

где ; s3 – стандартное отклонение (сигма) в третьей степени; xs – среднее значение; n – объем выборки.

Эксцесс, или коэффициент эксцесса (Пирсон, 1905) – острота пика распределения.

, (1.4)

где ; s4 – стандартное отклонение, возведённое в 4-ю степень.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.