Разделы сайта

Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Порядок выполнения лабораторной работы с помощью надстройки AtteStat табличного редактора Microsoft Excel

⇐ ПредыдущаяСтр 21 из 59Следующая ⇒

Продемонстрируем алгоритм работы с табличным редактором Excel на примере анализа взаимосвязи признаков «Возраст» и «Среднемесячный доход». Для анализа таблицы сопряженности c помощью надстройки AtteStat пакета Excel необходимо ввести исходные данные в виде выборочной двухфакторной таблицы сопряженности, затем выбрать пункт основного меню «AtteStat», подпункты «Модуль XTAB – Кросстабуляция», «Кросстабуляция». Вид экрана представлен на рисунке 3.85.

Рисунок 3.85 – Выбор пунктов меню в табличном редакторе Excel для анализа таблицы сопряженности

Далее необходимо заполнить появившуюся на экране форму «Кросстабуляция». В поле «Интервал таблицы» указываются ячейки с наблюдаемыми частотами таблицы сопряженности; в поле «Интервал вывода» указывается ячейка, с которой начнется вывод результатов; «галочками» отмечаются статистики для расчета. Вид заполненной формы представлен на рисунке 3.86.

Рисунок 3.86 – Образец заполнения формы «Кросстабуляция»

С помощью кнопки «Выполнить расчет» появятся результаты, представленные на рисунке 3.87.

Рисунок 3.87 – Результаты анализа таблицы сопряженности c помощью надстройки AtteStat пакета Excel

Отчет, полученный в пакете Excel, включает результаты проверки гипотезы о независимости признаков с помощью критериев Пирсона и информационного критерия (критерия отношения правдоподобия); выборочные значения коэффициентов Кендалла, Пирсона, Крамера и Сомерса.

Вопросы к защите лабораторной работы

1. Сформулируйте постановку задачи лабораторной работы

2. К какому типу случайных величин относятся рассматриваемые в лабораторной работе признаки?

3. Сколько всего было опрошено респондентов? Каким образом распределились ответы респондентов на рассматриваемые в лабораторной работе вопросы анкеты?

4. С помощью каких критериев проверялась гипотеза о независимости двух дихотомических признаков?

5. Какие критерии использовались для проверки независимости признаков на основе выборочной таблицы сопряженности ?

6. Был ли реализован в лабораторной работе критерий Мак-Нимара?

7. Когда гипотеза о независимости признаков, проверяемая с помощью статистических пакетов, принимается? Нужно ли в этом случае рассчитывать коэффициенты связи?

8. Как интерпретировать силу связи номинальных признаков?

9. С помощью каких коэффициентов можно интерпретировать направление связи номинальных признаков?

10. Рассчитывались ли в лабораторной работе порядковые меры связи?

4 Методы многомерной классификации

4.1 Кластерный анализ

Для большинства социально-экономических явлений и процессов типична ситуация, связанная с разбросом значений показателей, их характеризующих, и, таким образом, с неоднородностью объектов (стран, муниципальных образований, предприятий, семей и т.д.). Выработка рекомендации по исправлению диспропорции в уровне развития требует предварительного разбиения (классификации) объектов на однородные, т.е. схожие по значениям показателей, группы. Решение подобной задачи при небольшом наборе признаков традиционно осуществляется методами комбинационной группировки, в противном случае (при наличии большого набора показателей) требуется использование специальных методов многомерной классификации и статистических пакетов, их реализующих.

Под классификацией в кластерном анализе понимается разделение рассматриваемой совокупности объектов или явлений на однородные, в определенном смысле, группы (классы) [12]. Таким образом, постановка задачи кластерного анализа состоит в следующем: необходимо разбить совокупность объектов на сравнительно небольшое число однородных групп. Исходная информация о классифицируемых объектах , каждый из которых характеризуется признаками , может быть представлена в виде матрицы типа «объект-свойство»

где – наблюдаемое значение признака j -го признака для i -го объекта выборочной совокупности, , ;

или в виде матрицы парных сравнений объектов

где – соотношение (например, расстояние) между объектами и .

Для осуществления процедуры разбиения вводится величина, характеризующая либо различие между объектами и – расстояние [2], либо сходство объектов и – мера близости [3]. Объекты, характеризующиеся минимальным значением расстояния или максимальным значением меры близости , считаются однородными, принадлежащими одному классу.

Функции, определяющие расстояние между объектами и меру близости объектов, должны удовлетворять следующим требованиям:

1. симметричность: , ;

2. максимальное сходство объекта с самим собой: , ;

3. монотонное убывание меры близости по расстоянию: если , то .

Интерпретация и оценка расстояний между объектами в значительной степени зависят от абсолютных значений отдельных признаков, их среднего и дисперсии. Если исходные признаки, по которым производится классификация объектов, имеют разные единицы измерения, то необходимо перейти к стандартизованным переменным одним из следующих способов [16]:

; ; ; ; ; ,

где – исходное значение j -го признака на i -ом объекте наблюдения;

– нормированное значение j -го признака на i -ом объекте наблюдения;

– среднее значение j -го признака;

– выборочное среднеквадратическое отклонение j -го признака;

– максимальное значение j -го признака;

– минимальное значение j -го признака.

⇐ Предыдущая 16 17 18 19 202122 23 24 25 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.