Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Тема 1. Средние величины и показатели вариацииСтр 1 из 2Следующая ⇒
По имеющимся в следующей таблице данным по группе из 20 студентов заочного отделения необходимо: 1) построить интервальный ряд распределения признака и его график; 2) рассчитать модальное, медианное и среднее значение, установить его типичность с помощью коэффициентов вариации;
Решение. Для построения интервального ряда из дискретного используется формула Стерджесса, с помощью которой определяется оптимальное количество интервалов (n): n = 1 +3, 322 lg N, (1) где N – число величин в дискретном ряде. В нашей задаче n = 1 + 3, 322 lg 20 = 1 + 3, 322*1, 3= 5, 32. Так как число интервалов не может быть дробным, то округлим его до ближайшего целого числа, т.е. до 5. После определения оптимального количества интервалов определяем размах интервала по формуле: h = H / n, (2) где H – размах вариации, определяемый по формуле (3). H = Хмах –Хmin, (3) где Xмax и Xmin — максимальное и минимальное значения в совокупности. В нашей задаче h = (3, 533-2, 011)/5 =1, 522/5=0, 304
Интервальная группировка данных приведена в первом столбце таблицы 1, которая содержит также алгоритм и промежуточные расчеты.
Таблица 1. Вспомогательные расчеты для решения задачи
Мода () – это наиболее часто повторяющееся значение признака. Для интервального ряда с равными интервалами величина моды определяется по формуле (4): Формула для вычисления: , (4) где – нижняя граница модального интервала; – величина модального интервала; – частоты в модальном, предыдущем и следующем за модальным интервалом соответственно. Модальный интервал определяется по наибольшей частоте. Используя формулу (4), определяем точное значение модального возраста: Мо=2, 315+0, 304 * = 2, 6
Медиана – варианта, которая находится в середине вариационного ряда. Делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значением признака больше медианы. Вычисляется медиана по формуле: (5) где – нижняя граница медианного интервала; – медианный интервал; – половина от общего числа наблюдений; – сумма наблюдений, накопленная до начала медианного интервала; fMe – число наблюдений или объем взвешивающего признака в медианном интервале. Используя формулу, определяем точное значение медианного возраста: Ме 2, 315+0, 304* (10-4)/6 = 2, 6 Средняя величина – это обобщающий показатель совокупности, характеризующий уровень изучаемого явления или процесса. Средние величины могут быть простыми и взвешенными. Простая средняя рассчитывается при наличии двух и более статистических величин, расположенных в произвольном (несгруппированном) порядке, по общей формуле (5). Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием общей формулы (6). = ; (5) = . (6) При этом обозначено: Xi – значения отдельных статистических величин или середин группировочных интервалов; m - показатель степени, от значения которого зависят виды средних величин. Используя формулы (5) и (6) при разных показателях степени m, получаем частные формулы каждого вида (см. таблицу 2). Таблица 2. Виды степенных средних и их применение
Выбор вида формулы средней величины зависит от содержания осредняемого признака и конкретных данных, по которым ее приходится вычислять. Показатель степени m в общей формуле средней величины оказывает существенное влияние на значение средней величины: по мере увеличения степени возрастает и средняя величина (правило мажорантности средних величин), то есть < < < < . Так, если , то , а если , то . В нашей задаче, применяя формулу (8) и подставляя вместо середины интервалов веса ХИ, определяем среднее соотношение роста к весу студентов: = 53, 292/20 = 2, 665. Теперь осталось определить типичность или нетипичность найденной средней величины. Это осуществляется с помощью расчета показателей вариации. Чем ближе они к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности. При этом критериальным значением коэффициента вариации служит 1/3. Коэффициенты вариации рассчитываются как отношение среднего отклонения к средней величине. Поскольку среднее отклонение может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации. Среднее линейное отклонение определяется по формулам (19) и (20): –простое; (19) – взвешенное. (20) Среднее квадратическое отклонение определяется как корень квадратный из дисперсии, то есть по формуле (21): . (21) Дисперсия определяется по формулам (22) или взвешенная.(23): –простая; (22) –взвешенная.(23) В нашей задаче, применяя формулу, определим ее числитель и внесем в расчетную таблицу. В итоге получим среднее линейное отклонение: Л = 0, 008/20 = 0, 0004 (шт). Разделив это значение на средний возраст, получим линейный коэффициент вариации: =0, 0004/2, 665=0, 00015 По значению этого коэффициента для рассмотренной группы студентов делаем вывод о типичности среднего возраста, т.к. расчетное значение коэффициента вариации не превышает критериального (0, 160 < 0, 333). Применяя формулу взвешенная (23), получим в итоге дисперсию: Д = 3, 006/20 = 0, 150. Извлечем из этого числа корень и получим в результате среднее квадратическое отклонение: = =0, 388.Разделив это значение на средний возраст, получим квадратический коэффициент вариации: = 0, 388/2, 665 = 0, 146. По значению этого коэффициента для рассмотренной группы студентов можно сделать вывод о типичности среднего соотношения веса к росту, т.к. расчетное значение коэффициента вариации не превышает критериального (0, 146 < 0, 333). Т.к. V=0, 146< 1/3 (0, 146 < 0, 333), то делаем вывод о типичности среднего соотношения веса к росту. В качестве показателей асимметрии используются: коэффициент асимметрии – нормированный момент третьего порядка:
= = 0, 616/20 = 0, 031
=0, 0313=0, 058
= 0, 031/0, 058 = 0, 534> 0 (коэффициент асимметрии) Значит соотношение с правосторонней асимметрией.
Для характеристики крутизны (заостренности) распределения используется центральный момент 4-го порядка:
=
Для образования безразмерной характеристики определяется нормированный момент 4-го порядка, который и характеризует крутизну (заостренность) графика распределения. При измерении асимметрии эталоном служит нормальное (симметричное) распределение. Поэтому для оценки крутизны данного распределения в сравнении с нормальным, вычисляется эксцесс распределения: = 1, 072 / 0, 3884 – 3= 44, 301 Ex> 0, распределение - высоковершинное.
|