Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Порядок выполнения лабораторной работы в пакете Statistica. Порядок выполнения лабораторной работы рассмотрен на основании данных нулевого варианта, включающего следующие показатели для анализа:






 

Порядок выполнения лабораторной работы рассмотрен на основании данных нулевого варианта, включающего следующие показатели для анализа:

– инвестиции, направленные в жилищное хозяйство, на душу населения, рублей;

– ввод в действие жилых домов на 1000 человек населения, кв.м;

– ввод в действие жилых домов, построенных населением за свой счет и с помощью кредитов, кв.м;

– обеспеченность населения собственными легковыми автомобилями в расчете на 1000 населения, штук;

– среднемесячная начисленная заработная плата работников, рублей.

Так как имеются обучающие выборки и известен вид закона распределения классов, то классификацию районов можно провести с помощью параметрического дискриминантного анализа. При этом необходимо проверить, чтобы число объектов в каждой обучающей выборке было хотя бы на 2 единицы больше чем число признаков.

Вид таблицы с исходными данными для анализа в пакете Statistica 8.0 представлен на рисунке 4.76. В первом столбце для удобства введены названия районов, в следующих пяти столбцах введены значения социально-экономических показателей для соответствующих районов, в седьмом столбце – значения признака, указывающего на принадлежность к классу. Так для районов, относящихся по условию к первой обучающей выборке, в седьмом столбце введена цифра 1, для районов, относящихся ко второй обучающей выборке – цифра 2. Для районов, подлежащих классификации, значение признака Класс не указывается.

 

Рисунок 4.76 – Исходные данные для анализа

 

Запуск модуля дискриминантного анализа осуществляется с помощью пункта меню Statistics (Статистика), подпунктов Multivariate Exploratory Techniques (Многомерные исследовательские методы), Discriminant Function Analysis (Дискриминантный анализ). Вид экрана представлен на рисунке 4.77.

Рисунок 4.77 – Выбор пунктов меню

 

После запуска модуля дискриминантного анализа на экране появится форма, представленная на рисунке 4.78.

 

Рисунок 4.78 – Форма «Discriminant Function Analysis»

 

С помощью кнопки Variables необходимо выбрать признаки для анализа. Вид формы представлен на рисунке 4.79. В левом окне необходимо выбрать столбец матрицы исходных данных, в котором содержится номер класса (7 - Класс), в правом окне – столбцы, содержащие значения признаков, участвующих в анализе (Х4, Х6, Х7, Х9, Х12).

 

Рисунок 4.79 – Форма выбора признаков для дискриминантного анализа

 

С помощью кнопки Codes for grouping variable задаются коды классов (возможные значения признака Класс). Форма кодирования классов представлена на рисунке 4.80. Нажав на кнопку All, в поле будут автоматически введены значения 1-2.

Рисунок 4.80 – Кодирование классов

 

Выбор опции Advanced options (stepwise analysis) на форме «Discriminant Function Analysis» позволит расширить возможности модуля, сделает доступным пошаговый отбор признаков для анализа. Вид формы представлен на рисунке 4.81. После нажатия на кнопку OK на экране появится форма выбора метода отбора признаков для анализа, представленная на рисунке 4.82.

 

Рисунок 4.81 – Заполненная форма «Discriminant Function Analysis»

Рисунок 4.82 – Выбор метода отбора признаков для анализа

 

Метод Standard проводит классификацию по всем выбранным признакам. Методы Forward и Backward stepwise реализуют соответственно процедуры пошагового включения и пошагового исключения признаков, которые позволяют отобрать наиболее значимые при классификации признаки. В первом случае среди всех признаков находится тот, который вносит наибольший вклад в различие между классами. Этот признак включается в модель на первом шаге. На следующих шагах алгоритма такая процедура повторяется для оставшихся признаков. Во втором случае на первом шаге все признаки включаются в модель, а затем на каждом шаге устраняется по одному признаку, вносящему наименьший вклад в различие между классами. Пошаговые процедуры при отборе признаков «руководствуются» значениями F -статистики: для включения – F to enter и для исключения – F to remove, которые задаются в диалоговом окне. Будем проводить классификацию по всем пяти признакам.

Для оценки параметров распределения в классах предназначена кнопка Review descriptive statistics на странице Descriptives формы Model Definition. Вид формы Model Definition на странице Descriptives представлен на рисунке 4.83.

 

Рисунок 4.83 – Страница «Descriptives»

 

После нажатия кнопки Review descriptive statistics на экране появится форма, представленная на рисунке 4.84.

 

Рисунок 4.84 – Форма для оценок параметров распределения

 

Кнопка Pooled within-groups covariances & correlations предназначена для расчета оценок общих для двух классов ковариационной и корреляционной матриц. С помощью кнопок Means & number of cases и Within-groups standard deviations рассчитываются оценки математических ожиданий и средних квадратических отклонений признаков в классах. Средние арифметические значения признаков, рассчитанные по обучающим выборкам, представлены на рисунке 4.85. По полученным результатам можно дать интерпретацию классам.

Рисунок 4.85 – Оценки математических ожиданий признаков в классах

 

Все средние значения показателей, рассчитанные по первой обучающей выборке, меньше соответствующих средних значений показателей, рассчитанных по второй обучающей выборке. Это позволяет сделать вывод, что по рассматриваемым показателям социально-экономическое положение районов второго класса лучше, чем первого.

Остальные кнопки на странице Within формы Review Descriptive Statistics предназначены для построения различных графиков.

После нажатия кнопки OK на форме Model Definition на экране появится форма результатов дискриминантного анализа, представленная на рисунке 4.86.

 

Рисунок 4.86 – Результаты дискриминантного анализа (страница Quick)

 

В информационной части формы представлены наблюдаемое значение статистики Уилкса, приближенное значение F -критерия и значимость нулевой гипотезы об отсутствии различий в групповых средних значениях всех признаков. На основе полученных результатов можно сделать вывод, что гипотеза об отсутствии различий в математических ожиданиях признаков в двух классах отвергается. Проверка такой гипотезы по каждому отдельному признаку проводится с помощью кнопки Summary: Variables in model.

Вид формы результатов дискриминантного анализа на странице Classification представлен на рисунке 4.87. В группе радио-кнопок A priori classification probabilities предложены три варианта задания априорных вероятностей:

1. пропорционально объемам обучающих выборок;

2. равные для всех классов;

3. в результате диалога с пользователем.

С помощью кнопки Classification functions рассчитываются коэффициенты линейных дискриминантных функций Фишера. Результаты представлены на рисунке 4.88.

 

Рисунок 4.87 – Результаты дискриминантного анализа (страница Classification)

 

Рисунок 4.88 – Коэффициенты линейных дискриминантных функций Фишера

 

В названии столбцов таблицы, представленной на рисунке 4.88, приведены оценки априорных вероятностей, рассчитанные по первому варианту: , . Линейные дискриминантные функции Фишера имеют вид:

 

(4.11)

 

(4.12)

 

Следует отметить, что малые значения коэффициентов в дискриминантных функциях (4.11), (4.12) связаны с большим масштабом измерения рассматриваемых показателей.

На основе функций (4.11), (4.12) повторная классификация объектов обучающих выборок. Чтобы увидеть результаты этой процедуры, необходимо выбрать кнопку Classification matrix. На экране появится таблица, представленная на рисунке 4.89.

 

Рисунок 4.89 – Результаты классификации объектов обучающих выборок

 

Как видно из рисунка 4.89, изменений в первоначальном составе классов не произошло: к первому классу относятся те же 15 районов, ко второму – те же 10 районов. Качество распознавания составило 100%. Это свидетельствует о хорошей дискриминации объектов обучающих выборок на основе функций (4.11), (4.12).

Для представления результатов классификации с помощью дискриминантных функций Фишера предназначены кнопки Classification of cases, Squared Mahalanobis distances и Posterior probabilities. Если объект, априори относившийся к одному классу, после реализации процедуры классификации отнесен к другому, то соответствующая этому объекту строка помечается «звездочкой» (в рассматриваемом примере такие объекты не встречаются).

Наиболее удобны для интерпретации результаты классификации, выводимые на экран с помощью кнопок Squared Mahalanobis distances и Posterior probabilities. В первом случае рассчитываются квадраты расстояния Махаланобиса от объектов до центров каждого из классов. Результаты представлены на рисунке 4.90. Объект следует отнести к тому классу, расстояние до которого наименьшее. Так, например, первый район (Абдулинский) следует отнести ко второму классу, поскольку расстояние от этого объекта до центра второго класса меньше, чем до центра первого класса (23, 9204< 25, 8157).

 

Рисунок 4.90 – Расстояния до центров классов

 

Апостериорные вероятности классификации рассчитываются с помощью кнопки Posterior probabilities. Результаты представлены на рисунке 4.91. Объект следует отнести к тому классу, апостериорная вероятность для которого наибольшая. Так, например, пятый район (Асекеевский) следует отнести ко второму классу (0, 161359< 0, 838641).

 

Рисунок 4.91 – Апостериорные вероятности классификации

 

На основании таблиц, представленных на рисунках 4.90, 4.91, районы, не вошедшие в обучающие выборки, можно классифицировать следующим образом: районы Бугурусланский, Грачевский, Илекский, Курманаевский, Северный относятся к первому классу, т.е. социально-экономическое положение в этих районах хуже, чем в районах Абдулинский, Асекеевский, Октябрьский, Оренбургский, Первомайский, которые относятся ко второму классу.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.