![]() Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Вопрос 12.Оценка средних параметров. Меры разброса.
То, какие величины можно применять для оценки средних параметров, а какие нельзя, зависит от типа шкалы. В самом деле, среднее арифметическое значение пола вряд ли будет иметь смысл. Тем не менее, оценить средние параметры имеет смысл для любой шкалы. Оценку средних параметров еще называют измерением центральной тенденции. Эта задача, наряду с оценкой разброса значений, входит в раздел описательной статистики и является одним из первых шагов при обработке социологического опроса.
При номинальной шкале измерения мы можем лишь указать наиболее популярный ответ. Наиболее популярный ответ называется модой. Моду можно вычислить и при любой шкале. Однако это будет иметь смысл делать только тогда, когда число опрошенных значительно больше, чем число вариантов ответов. Действительно, если например, измерять рост в миллиметрах, то у всех 100-200 опрошенных окажутся разные значения роста. Модами тогда окажутся все эти варианты (они же будут максимально популярными!).
Имейте в виду, что мода – это вариант ответа, а не число человек, которые выбрали этот вариант. Также имейте в виду, что мод может быть несколько (как в предыдущем примере).
Если шкала порядковая, то помимо моды можно вычислить также медиану. Поясним смысл медианы. При порядковой шкале все варианты ответов можно расположить в порядке возрастания некоторого признака. Если это сделать, то какой-то ответ окажется в середине этого списка. Этот ответ и будет медианой. Другими словами, медиана – это ответ, стоящий в середине упорядоченной выборки. Медиана – это вариант ответа, а не то, сколько раз этот ответ встречается в выборке. Медиану можно вычислить и при интервальных шкалах, поскольку эти шкалы также позволяют расположить ответы в порядке возрастания. Для номинальной шкалы вычислить медиану нельзя! О способах вычисления медианы будет более подробно рассказано ниже на примерах. Забиваем Сайты В ТОП КУВАЛДОЙ - Уникальные возможности от SeoHammer
Каждая ссылка анализируется по трем пакетам оценки: SEO, Трафик и SMM.
SeoHammer делает продвижение сайта прозрачным и простым занятием.
Ссылки, вечные ссылки, статьи, упоминания, пресс-релизы - используйте по максимуму потенциал SeoHammer для продвижения вашего сайта.
Что умеет делать SeoHammer
— Продвижение в один клик, интеллектуальный подбор запросов, покупка самых лучших ссылок с высокой степенью качества у лучших бирж ссылок. — Регулярная проверка качества ссылок по более чем 100 показателям и ежедневный пересчет показателей качества проекта. — Все известные форматы ссылок: арендные ссылки, вечные ссылки, публикации (упоминания, мнения, отзывы, статьи, пресс-релизы). — SeoHammer покажет, где рост или падение, а также запросы, на которые нужно обратить внимание. SeoHammer еще предоставляет технологию Буст, она ускоряет продвижение в десятки раз, а первые результаты появляются уже в течение первых 7 дней. Зарегистрироваться и Начать продвижение
Для интервальных (метрических) шкал оценкой средних параметров является среднее арифметическое значение. Оно равно сумме всех значений, деленной на число этих значений: Среднее арифметическое более точно отражает средние параметры выборки, чем медиана, поскольку медиана не учитывает величины отклонений отдельных измерений от средних показателей. Ни для порядковой шкалы, ни для номинальной шкалы среднее арифметическое значение вычислить нельзя. Ведь сумма значений для этих шкал не имеет смысла, даже если ее можно формально вычислить, просуммировав коды ответов.
Для дихотомической шкалы в качестве меры средней тенденции возможно использовать только моду – какой из ответов более популярен.
Объединим рассказанное выше в таблицу:
Другими оценками средних значений для интервальных шкал для выборки из n значений могут служить: среднее геометрическое с реднее гармоническое среднее квадратичное Взвешенное среднее
При вычислении взвешенного среднего предполагается, что каждому значению xi придается некоторый весовой коэффициент pi, больший или меньший единицы. Если бы все респонденты входили с равным весом, у всех xi были бы коэффициенты pi=1, а взвешенное среднее было бы равно среднему арифметическому значению. Часто взвешенным средним называют среднее арифметическое значение, вычисляемое по данным, сгруппированным в виде частотной таблицы – тогда веса pi равны числу человек, выбравших i-й вариант ответа. Это будет показано и далее, на примерах вычисления среднего значения.
Все указанные выше четыре типа средних значений встречаются гораздо реже, чем среднее арифметическое. Как правило, при обработке обычных социологических опросов их не требуется вычислять. Такая необходимость может возникнуть, если распределение величины X отличается от нормального (см. далее), при неодинаковом отношении к отдельным респондентам или группам респондентов и т.д.
Помимо оценки средних показателей выборки необходимо оценить, насколько сильно могут отличаться данные отдельных респондентов от этих средних показателей. Например, мы получили среднее значение роста респондентов 170 см. Однако, это значение могло быть получено для группы, в которой все имеют одинаковый рост 169-171 см, а могло быть получено там, где есть и 150-сантиметровые карлики, и двухметровые гиганты. Во второй выборке разброс явно выше. Из данного примера видно, что среднее значение без мер разброса недостаточно хорошо описывает свойства выборки и популяции. И речь идет не только об измерениях по интервальной шкале. Одна группа может проголосовать «за» практически единогласно, а другая – на 51% (остальные – «против»), а мода в обоих случаях будет одна и та же («за»). Сервис онлайн-записи на собственном Telegram-боте
Попробуйте сервис онлайн-записи VisitTime на основе вашего собственного Telegram-бота:— Разгрузит мастера, специалиста или компанию; — Позволит гибко управлять расписанием и загрузкой; — Разошлет оповещения о новых услугах или акциях; — Позволит принять оплату на карту/кошелек/счет; — Позволит записываться на групповые и персональные посещения; — Поможет получить от клиента отзывы о визите к вам; — Включает в себя сервис чаевых. Для новых пользователей первый месяц бесплатно. Зарегистрироваться в сервисе
Простейшей оценкой разброса данных по номинальной шкале может служить разность количества ответов в наиболее и наименее популярных вариантах. Пусть, например, в опросе были получены данные: «зимой» – 10 ответов, «весной» – 50 ответов, «летом» – 20 ответов, «осенью» - 20 ответов. Наиболее популярным является ответ «весной», наименее популярным – «зимой». Разность количества ответов будет равна 50-10=40. Для того, чтобы этот коэффициент был более наглядным, часто его выражают как отношение
Пусть шкала дихотомическая и возможно только два варианта ответа, которым соответствуют числа респондентов N1 и N2 из общего числа N=N1+N2. Произведение Теперь обобщим смысл коэффициента качественной вариации на общий случай номинальной шкалы (k вариантов ответа). Сверху в коэффициенте μ будет располагаться сумма всевозможных произведений вида Ni*Nj, то есть
Вычислим коэффициент качественной вариации для предыдущего пример а. У нас 4 варианта ответа (зима, весна, лето, осень), поэтому k=4. Было опрошено N=10+50+20+20=100 человек. Подставляем в формулу:
Коэффициент качественной вариации имеет смысл вычислять тогда, когда число вариантов ответа не слишком велико. Шкала при этом, как правило, номинальная. Диапазон изменения коэффициента – от 0 (выбирали только один из ответов) до 1 (всех ответов выбрано поровну).
Для порядковой шкалы мерой разброса может служить квартильный размах. Для начала введем понятие квартилей. Медиана – это значение (вариант ответа), которое делит упорядоченную (!) выборку на две равные части. А при делении выборки не на две, а на 4 равные части можно найти три значения (для 25%, 50% и 75%), имеющие сходный смысл. Они и называются квартилями. Одним из квартилей (для 50%) является медиана. Два другие квартиля (25% и 75%) ищутся методами, аналогичными медиане. То есть, если данные представляют собой список значений, то его надо сначала переписать в порядке возрастания признака, а затем определить, какие значения находятся на 25% и 75% этого списка. Если данные сгруппированы в частотную таблицу, то квартили ищутся также аналогично медиане, но вместо 50% надо использовать уровни 25% и 75%. Разность квартилей 75% и 25% называется квартильным размахом.
Вычислим квартильный размах для примера, разобранного нами при изучении медианы. Список данных 7, 10, 12, 5, 6, 6, 3, 15, 12, 11, 14, 8, 9 (всего 13 значений) сначала переписываем в порядке возрастания: 3, 5, 6, 6, 7, 8, 9, 10, 11, 12, 12, 14, 15.
На уровне 25% (3 числа от начала) лежит число 6, на уровне 75% - число 12. Значит, квартили для 25% и 75% равны соответственно 6 и 12. Квартильный размах равен 12 – 6 = 6.
Мерами разброса для интервальной шкалы служат дисперсия и стандартное отклонение. Смысл данных мер разброса поясним на числовой прямой. Разброс характеризуется отклонениями экспериментальных значений xi от среднего значения. Например, если среднее значение равно 15, а xi=17, то отклонение =17-15=2.
Сумма всех отклонений всегда равна 0, поэтому средняя величина отклонения не может быть взята за меру разброса. Используют средний квадрат отклонения, который называют дисперсией. Дисперсия вычисляется по формуле:
Неудобством использования дисперсии является то, что если, например, рост измеряется в сантиметрах, среднее значение роста – в сантиметрах, то дисперсия по росту будет иметь размерность квадратных сантиметров. Поэтому для оценки разброса значений чаще используют не дисперсию, а квадратный корень из дисперсии, называемый стандартным отклонением, или среднеквадратичным отклонением.
В некоторых учебных пособиях стандартное отклонение обозначается буквой σ, а дисперсия σ 2. В некоторых учебниках буквой σ обозначается дисперсия. Во избежание путаницы я призываю запоминать формулы по смыслу. Подытожим в таблице, какими мерами разброса можно пользоваться для каких шкал:
|