Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Тема 5 Ряды распределения. Показатели формы распределения






Основные понятия и определения

 

Ряд распределения – это упорядоченное распределение единиц статистической совокупности на группы по определенному признаку. Атрибутивные ряды распределения строятся по атрибутивным признакам. Вариационные ряды распределения строятся по количественным признакам.

Ряд распределения состоит из двух элементов: вариант ов и частот. Вариантом называется значение признака отличное от других значений. Частоты показывают, как часто встречается тот или иной вариант в ряду распределения. Частостями называются частоты, выраженные в долях или в процентах к итогу.

Вариационные ряды распределения могут быть дискретными (прерывными) и интервальными (непрерывными). Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему, как правило, целочисленные значения. Интервальный вариационный ряд строится по непрерывному признаку, то есть признаку, который может принимать любые значения, либо по дискретному признаку, если дискретная вариация проявляется в достаточно широких пределах (например, численность населения региона или страны в целом).

Для получения приблизительного представления о форме распределения единиц совокупности строят графики распределения (полигон и гистограмму).

Для выражения особенностей формы распределения применяются следующие показатели: ранговые характеристики, показатели дифференциации, асимметрии и эксцесса, кривые распределения.

Ранговые характеристики – варианты, занимающие в ранжированном ряду определенное место. К ним относятся квартили, децили, перцентили.

Децили – значения признака, которые делят ранжированный ряд на десять равных по численности частей.

Перцентили – значения признака, делящие ранжированный ряд на сто равных частей.

Рассмотрим расчет ранговых характеристик на примере децилей. В интервальном ряду сначала необходимо определить интервал, в котором находится дециль, затем найти его значение по формуле:

нижний дециль d = x + i ; (5.1)

верхний дециль d = x + i , (5.2)

где x , x - нижние границы интервалов, содержащих соответственно нижний и верхний децили (интервалы определяют по накопленной частоте, первой превышающей 10% численности совокупности для нижнего дециля и 90% - для верхнего дециля);

i – величина интервала, содержащего соответствующий дециль;

- накопленная частота до интервала, содержащего нижний дециль;

- накопленная частота до интервала, содержащего верхний дециль;

, - частоты интервалов, содержащих нижний и верхний децили соответственно.

Для сравнительного анализа степени асимметрии рассчитывается относительный показатель коэффициент асимметрии:

= , (5.3)

 

где - центральный момент третьего порядка:

= , (5.4)

где - групповые средние;

- общая средняя;

- частота k -ой группы.

Для сравнительного анализа степени асимметрии нескольких распределений коэффициент асимметрии может быть рассчитан следующим образом: = = .

Положительная величина коэффициента асимметрии говорит о наличии правосторонней асимметрии, отрицательная - о наличии левосторонней асимметрии. Чем больше абсолютная величина данного коэффициента, тем больше степень скошенности. Принято считать, что если коэффициент меньше 0, 25, асимметрия является незначительной; если свыше 0, 5 - асимметрия значительная.

Оценка степени существенности коэффициента асимметрии определяется с помощью средней квадратической ошибки, рассчитываемой по формуле:

(5.5)

где n - число наблюдений.

Если , асимметрия существенна, а значит, распределение признака в совокупности не является симметричным.

Если , асимметрия несущественна, а значит, ее наличие объясняется влиянием случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности распределения):

(5.6)

 

где - центральный момент четвертого порядка, рассчитываемый по формуле:

= . (5.7)

У островершинных распределений показатель эксцесса имеет положительное значение, у плосковершинных – отрицательное. Предельным значением отрицательного эксцесса является значение E = -2; величина положительного эксцесса бесконечна. В нормальном распределении (, следовательно, E = 0.

Средняя квадратическая ошибка эксцесса определяется по формуле:

 

(5.8)

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.