Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Порядок выполнения лабораторной работы с помощью надстройки AtteStat табличного редактора Microsoft Excel
Продемонстрируем алгоритм работы с табличным редактором Excel на примере анализа взаимосвязи признаков «Возраст» и «Среднемесячный доход». Для анализа таблицы сопряженности c помощью надстройки AtteStat пакета Excel необходимо ввести исходные данные в виде выборочной двухфакторной таблицы сопряженности, затем выбрать пункт основного меню «AtteStat», подпункты «Модуль XTAB – Кросстабуляция», «Кросстабуляция». Вид экрана представлен на рисунке 3.85.
Рисунок 3.85 – Выбор пунктов меню в табличном редакторе Excel для анализа таблицы сопряженности
Далее необходимо заполнить появившуюся на экране форму «Кросстабуляция». В поле «Интервал таблицы» указываются ячейки с наблюдаемыми частотами таблицы сопряженности; в поле «Интервал вывода» указывается ячейка, с которой начнется вывод результатов; «галочками» отмечаются статистики для расчета. Вид заполненной формы представлен на рисунке 3.86.
Рисунок 3.86 – Образец заполнения формы «Кросстабуляция»
С помощью кнопки «Выполнить расчет» появятся результаты, представленные на рисунке 3.87.
Рисунок 3.87 – Результаты анализа таблицы сопряженности c помощью надстройки AtteStat пакета Excel
Отчет, полученный в пакете Excel, включает результаты проверки гипотезы о независимости признаков с помощью критериев Пирсона и информационного критерия (критерия отношения правдоподобия); выборочные значения коэффициентов Кендалла, Пирсона, Крамера и Сомерса.
Вопросы к защите лабораторной работы
1. Сформулируйте постановку задачи лабораторной работы 2. К какому типу случайных величин относятся рассматриваемые в лабораторной работе признаки? 3. Сколько всего было опрошено респондентов? Каким образом распределились ответы респондентов на рассматриваемые в лабораторной работе вопросы анкеты? 4. С помощью каких критериев проверялась гипотеза о независимости двух дихотомических признаков? 5. Какие критерии использовались для проверки независимости признаков на основе выборочной таблицы сопряженности ? 6. Был ли реализован в лабораторной работе критерий Мак-Нимара? 7. Когда гипотеза о независимости признаков, проверяемая с помощью статистических пакетов, принимается? Нужно ли в этом случае рассчитывать коэффициенты связи? 8. Как интерпретировать силу связи номинальных признаков? 9. С помощью каких коэффициентов можно интерпретировать направление связи номинальных признаков? 10. Рассчитывались ли в лабораторной работе порядковые меры связи?
4 Методы многомерной классификации 4.1 Кластерный анализ Для большинства социально-экономических явлений и процессов типична ситуация, связанная с разбросом значений показателей, их характеризующих, и, таким образом, с неоднородностью объектов (стран, муниципальных образований, предприятий, семей и т.д.). Выработка рекомендации по исправлению диспропорции в уровне развития требует предварительного разбиения (классификации) объектов на однородные, т.е. схожие по значениям показателей, группы. Решение подобной задачи при небольшом наборе признаков традиционно осуществляется методами комбинационной группировки, в противном случае (при наличии большого набора показателей) требуется использование специальных методов многомерной классификации и статистических пакетов, их реализующих. Под классификацией в кластерном анализе понимается разделение рассматриваемой совокупности объектов или явлений на однородные, в определенном смысле, группы (классы) [12]. Таким образом, постановка задачи кластерного анализа состоит в следующем: необходимо разбить совокупность объектов на сравнительно небольшое число однородных групп. Исходная информация о классифицируемых объектах , каждый из которых характеризуется признаками , может быть представлена в виде матрицы типа «объект-свойство»
,
где – наблюдаемое значение признака j -го признака для i -го объекта выборочной совокупности, , ; или в виде матрицы парных сравнений объектов
,
где – соотношение (например, расстояние) между объектами и . Для осуществления процедуры разбиения вводится величина, характеризующая либо различие между объектами и – расстояние [2], либо сходство объектов и – мера близости [3]. Объекты, характеризующиеся минимальным значением расстояния или максимальным значением меры близости , считаются однородными, принадлежащими одному классу. Функции, определяющие расстояние между объектами и меру близости объектов, должны удовлетворять следующим требованиям: 1. симметричность: , ; 2. максимальное сходство объекта с самим собой: , ; 3. монотонное убывание меры близости по расстоянию: если , то . Интерпретация и оценка расстояний между объектами в значительной степени зависят от абсолютных значений отдельных признаков, их среднего и дисперсии. Если исходные признаки, по которым производится классификация объектов, имеют разные единицы измерения, то необходимо перейти к стандартизованным переменным одним из следующих способов [16]:
; ; ; ; ; ,
где – исходное значение j -го признака на i -ом объекте наблюдения; – нормированное значение j -го признака на i -ом объекте наблюдения; – среднее значение j -го признака; – выборочное среднеквадратическое отклонение j -го признака; – максимальное значение j -го признака; – минимальное значение j -го признака.
|