Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Тема 1. Средние величины и показатели вариации






 

По имеющимся в следующей таблице данным по группе из 20 студентов заочного отделения необходимо:

1) построить интервальный ряд распределения признака и его график;

2) рассчитать модальное, медианное и среднее значение, установить его типичность с помощью коэффициентов вариации;

 

№ п/п    
   
Соотношение Рост/вес.  
  3, 533  
  2, 623  
  2, 875  
  3, 375  
  3, 000  
  2, 828  
  3, 255  
  2, 726  
  2, 429  
  2, 361  
  2, 342  
  2, 672  
  2, 356  
  2, 559  
  2, 173  
  2, 095  
  2, 342  
  2, 011  
  2, 619  
  2, 021  

Решение. Для построения интервального ряда из дискретного используется формула Стерджесса, с помощью которой определяется оптимальное количество интервалов (n):

n = 1 +3, 322 lg N, (1)

где N – число величин в дискретном ряде.

В нашей задаче n = 1 + 3, 322 lg 20 = 1 + 3, 322*1, 3= 5, 32. Так как число интервалов не может быть дробным, то округлим его до ближайшего целого числа, т.е. до 5.

После определения оптимального количества интервалов определяем размах интервала по формуле:

h = H / n, (2)

где H – размах вариации, определяемый по формуле (3).



H = Хмах –Хmin, (3)

где Xмax и Xmin — максимальное и минимальное значения в совокупности.

В нашей задаче h = (3, 533-2, 011)/5 =1, 522/5=0, 304

 

Интервальная группировка данных приведена в первом столбце таблицы 1, которая содержит также алгоритм и промежуточные расчеты.

 

Таблица 1. Вспомогательные расчеты для решения задачи

 

Xi, fi Xi Xi*fi Xi-X (Xi-X)fi (Xi-X)2 (Xi-X)2fi (Xi-X)3fi (Xi-X)4fi
до 2, 315   2, 163 8, 652 - 0, 502 -2, 008 0, 252 1, 008 -0, 506 0, 254
2, 315-2, 619   2, 467 14, 802 -0, 198 -1, 188 0, 039 0, 234 -0, 046 0, 009
2, 619-2, 923   2, 771 16, 626 0, 106 0, 636 0, 011 0, 066 0, 007 0, 001
2, 923-3, 227   3, 075 3, 075 0, 41 0, 41 0, 168 0, 168 0, 069 0, 028
3, 227 и более   3, 379 10, 137 0, 714 2, 142 0, 510 1, 53 1, 092 0, 780
Итого   - 53, 292 - 39, 2 - 3, 006 0, 616 1, 072

 

Мода () – это наиболее часто повторяющееся значение признака. Для интервального ряда с равными интервалами величина моды определяется по формуле (4):

Формула для вычисления:

, (4)

где – нижняя граница модального интервала; – величина модального интервала; – частоты в модальном, предыдущем и следующем за модальным интервалом соответственно.

Модальный интервал определяется по наибольшей частоте.

Используя формулу (4), определяем точное значение модального возраста:

Мо=2, 315+0, 304 * = 2, 6

 

Медиана – варианта, которая находится в середине вариационного ряда.

Делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значением признака больше медианы.

Вычисляется медиана по формуле:

(5)

где – нижняя граница медианного интервала;

– медианный интервал;

– половина от общего числа наблюдений;

– сумма наблюдений, накопленная до начала медианного интервала;

fMe – число наблюдений или объем взвешивающего признака в медианном интервале.

Используя формулу, определяем точное значение медианного возраста:

Ме 2, 315+0, 304* (10-4)/6 = 2, 6

Средняя величина – это обобщающий показатель совокупности, характеризующий уровень изучаемого явления или процесса. Средние величины могут быть простыми и взвешенными. Простая средняя рассчитывается при наличии двух и более статистических величин, расположенных в произвольном (несгруппированном) порядке, по общей формуле (5). Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием общей формулы (6).

= ; (5) = . (6)

При этом обозначено: Xi – значения отдельных статистических величин или середин группировочных интервалов; m - показатель степени, от значения которого зависят виды средних величин. Используя формулы (5) и (6) при разных показателях степени m, получаем частные формулы каждого вида (см. таблицу 2).

Таблица 2. Виды степенных средних и их применение

m Название средней Формула расчета средней Когда применяется
простая взвешенная
  Арифметическая = (7) = (8) Чаще всего, кроме тех случаев, когда должны применяться другие виды средних
–1 Гармоническая ГМ = (9) ГМ = (10) Для осреднения величин с дробной размерностью при наличии дополнительных данных по числителю дробной размерности
  Геометрическая (11) (12) Для осреднения цепных индексов динамики
  Квадратическая = (13) = (14) Для осреднения вариации признака (расчет средних отклонений)
  Кубическая = (15) = (16) Для расчета индексов нищеты населения
  Хронологическая (17) (18) Для осреднения моментных статистических величин

 

Выбор вида формулы средней величины зависит от содержания осредняемого признака и конкретных данных, по которым ее приходится вычислять. Показатель степени m в общей формуле средней величины оказывает существенное влияние на значение средней величины: по мере увеличения степени возрастает и средняя величина (правило мажорантности средних величин), то есть < < < < . Так, если , то , а если , то .

В нашей задаче, применяя формулу (8) и подставляя вместо середины интервалов веса ХИ, определяем среднее соотношение роста к весу студентов: = 53, 292/20 = 2, 665. Теперь осталось определить типичность или нетипичность найденной средней величины. Это осуществляется с помощью расчета показателей вариации. Чем ближе они к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности. При этом критериальным значением коэффициента вариации служит 1/3.

Коэффициенты вариации рассчитываются как отношение среднего отклонения к средней величине. Поскольку среднее отклонение может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации.

Среднее линейное отклонение определяется по формулам (19) и (20):

–простое; (19) – взвешенное. (20)

Среднее квадратическое отклонение определяется как корень квадратный из дисперсии, то есть по формуле (21):

. (21)

Дисперсия определяется по формулам (22) или взвешенная.(23):

–простая; (22) –взвешенная.(23)

В нашей задаче, применяя формулу, определим ее числитель и внесем в расчетную таблицу. В итоге получим среднее линейное отклонение: Л = 0, 008/20 = 0, 0004 (шт). Разделив это значение на средний возраст, получим линейный коэффициент вариации: =0, 0004/2, 665=0, 00015 По значению этого коэффициента для рассмотренной группы студентов делаем вывод о типичности среднего возраста, т.к. расчетное значение коэффициента вариации не превышает критериального (0, 160 < 0, 333).

Применяя формулу взвешенная (23), получим в итоге дисперсию: Д = 3, 006/20 = 0, 150. Извлечем из этого числа корень и получим в результате среднее квадратическое отклонение: = =0, 388.Разделив это значение на средний возраст, получим квадратический коэффициент вариации:

= 0, 388/2, 665 = 0, 146. По значению этого коэффициента для рассмотренной группы студентов можно сделать вывод о типичности среднего соотношения веса к росту, т.к. расчетное значение коэффициента вариации не превышает критериального (0, 146 < 0, 333).

Т.к. V=0, 146< 1/3 (0, 146 < 0, 333), то делаем вывод о типичности среднего соотношения веса к росту.

В качестве показателей асимметрии используются: коэффициент асимметрии – нормированный момент третьего порядка:

 

= = 0, 616/20 = 0, 031

 

=0, 0313=0, 058

 

= 0, 031/0, 058 = 0, 534> 0 (коэффициент асимметрии)

Значит соотношение с правосторонней асимметрией.

 

Для характеристики крутизны (заостренности) распределения используется центральный момент 4-го порядка:

 

=

 

Для образования безразмерной характеристики определяется нормированный момент 4-го порядка, который и характеризует крутизну (заостренность) графика распределения. При измерении асимметрии эталоном служит нормальное (симметричное) распределение. Поэтому для оценки крутизны данного распределения в сравнении с нормальным, вычисляется эксцесс распределения:

= 1, 072 / 0, 3884 – 3= 44, 301

Ex> 0, распределение - высоковершинное.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.