Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Порядок выполнения лабораторной работы с помощью надстройки AtteStat табличного редактора Microsoft Excel






 

Продемонстрируем алгоритм работы с табличным редактором Excel на примере анализа взаимосвязи признаков «Возраст» и «Среднемесячный доход». Для анализа таблицы сопряженности c помощью надстройки AtteStat пакета Excel необходимо ввести исходные данные в виде выборочной двухфакторной таблицы сопряженности, затем выбрать пункт основного меню «AtteStat», подпункты «Модуль XTAB – Кросстабуляция», «Кросстабуляция». Вид экрана представлен на рисунке 3.85.

 

Рисунок 3.85 – Выбор пунктов меню в табличном редакторе Excel для анализа таблицы сопряженности

 

Далее необходимо заполнить появившуюся на экране форму «Кросстабуляция». В поле «Интервал таблицы» указываются ячейки с наблюдаемыми частотами таблицы сопряженности; в поле «Интервал вывода» указывается ячейка, с которой начнется вывод результатов; «галочками» отмечаются статистики для расчета. Вид заполненной формы представлен на рисунке 3.86.

 

Рисунок 3.86 – Образец заполнения формы «Кросстабуляция»

 

С помощью кнопки «Выполнить расчет» появятся результаты, представленные на рисунке 3.87.

 

Рисунок 3.87 – Результаты анализа таблицы сопряженности c помощью надстройки AtteStat пакета Excel

 

Отчет, полученный в пакете Excel, включает результаты проверки гипотезы о независимости признаков с помощью критериев Пирсона и информационного критерия (критерия отношения правдоподобия); выборочные значения коэффициентов Кендалла, Пирсона, Крамера и Сомерса.

 

Вопросы к защите лабораторной работы

 

1. Сформулируйте постановку задачи лабораторной работы

2. К какому типу случайных величин относятся рассматриваемые в лабораторной работе признаки?

3. Сколько всего было опрошено респондентов? Каким образом распределились ответы респондентов на рассматриваемые в лабораторной работе вопросы анкеты?

4. С помощью каких критериев проверялась гипотеза о независимости двух дихотомических признаков?

5. Какие критерии использовались для проверки независимости признаков на основе выборочной таблицы сопряженности ?

6. Был ли реализован в лабораторной работе критерий Мак-Нимара?

7. Когда гипотеза о независимости признаков, проверяемая с помощью статистических пакетов, принимается? Нужно ли в этом случае рассчитывать коэффициенты связи?

8. Как интерпретировать силу связи номинальных признаков?

9. С помощью каких коэффициентов можно интерпретировать направление связи номинальных признаков?

10. Рассчитывались ли в лабораторной работе порядковые меры связи?

 

 

4 Методы многомерной классификации

4.1 Кластерный анализ

Для большинства социально-экономических явлений и процессов типична ситуация, связанная с разбросом значений показателей, их характеризующих, и, таким образом, с неоднородностью объектов (стран, муниципальных образований, предприятий, семей и т.д.). Выработка рекомендации по исправлению диспропорции в уровне развития требует предварительного разбиения (классификации) объектов на однородные, т.е. схожие по значениям показателей, группы. Решение подобной задачи при небольшом наборе признаков традиционно осуществляется методами комбинационной группировки, в противном случае (при наличии большого набора показателей) требуется использование специальных методов многомерной классификации и статистических пакетов, их реализующих.

Под классификацией в кластерном анализе понимается разделение рассматриваемой совокупности объектов или явлений на однородные, в определенном смысле, группы (классы) [12]. Таким образом, постановка задачи кластерного анализа состоит в следующем: необходимо разбить совокупность объектов на сравнительно небольшое число однородных групп. Исходная информация о классифицируемых объектах , каждый из которых характеризуется признаками , может быть представлена в виде матрицы типа «объект-свойство»

 

,

 

где – наблюдаемое значение признака j -го признака для i -го объекта выборочной совокупности, , ;

или в виде матрицы парных сравнений объектов

 

,

 

где – соотношение (например, расстояние) между объектами и .

Для осуществления процедуры разбиения вводится величина, характеризующая либо различие между объектами и – расстояние [2], либо сходство объектов и – мера близости [3]. Объекты, характеризующиеся минимальным значением расстояния или максимальным значением меры близости , считаются однородными, принадлежащими одному классу.

Функции, определяющие расстояние между объектами и меру близости объектов, должны удовлетворять следующим требованиям:

1. симметричность: , ;

2. максимальное сходство объекта с самим собой: , ;

3. монотонное убывание меры близости по расстоянию: если , то .

Интерпретация и оценка расстояний между объектами в значительной степени зависят от абсолютных значений отдельных признаков, их среднего и дисперсии. Если исходные признаки, по которым производится классификация объектов, имеют разные единицы измерения, то необходимо перейти к стандартизованным переменным одним из следующих способов [16]:

 

; ; ; ; ; ,

 

где – исходное значение j -го признака на i -ом объекте наблюдения;

– нормированное значение j -го признака на i -ом объекте наблюдения;

– среднее значение j -го признака;

– выборочное среднеквадратическое отклонение j -го признака;

– максимальное значение j -го признака;

– минимальное значение j -го признака.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.