Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Третий способ решения задачи






Проведём классификацию предприятия с помощью линейных дискриминантных функций Фишера. Рассчитаем коэффициенты дискриминантных функций, соответствующих первому и второму классам:

 

, ;

, .

 

Таким образом, дискриминантные функции имеют вид:

 

;

.

 

Рассчитаем значения дискриминантных функций для объекта классификации:

 

;

.

 

Так как (), то предприятие следует отнести к первом классу.

Необходимые расчеты в пакете Mathcad для реализации третьего способа решения задачи приведены на рисунке 4.11.

 

Рисунок 4.11 – Расчеты в пакете Mathcad для реализации третьего способа решения задачи классификации

 

4.3 Вопросы и задания к практическим занятиям

 

Вопросы и задания к практическим занятиям на тему «Кластерный анализ»

1. В чем состоит принципиальное отличие методов многомерной классификации от комбинационных группировок?

2. Что понимается под классификацией?

3. Что понимается под термином «классификация без обучения»?

4. Что понимается под термином «непараметрический случай»?

5. В чем заключается постановка задачи непараметрического кластерного анализа?

6. Что понимается под однородностью объектов в кластерном анализе?

7. Каким требованиям должны удовлетворять расстояние и мера близости?

8. Приведите расстояния между объектами и дайте рекомендации по их применению

9. Из каких соображений выбираются весовые коэффициенты для взвешенного евклидова расстояния, какими свойствами они должны обладать?

10. Какие характеристики могут выступать в качестве меры близости объектов или признаков?

11. Приведите расстояния между классами объектов

12. В чем состоит основной принцип работы иерархических кластер-процедур?

13. В чем отличие агломеративных и дивизимных кластер-процедур?

14. Какие методы относятся к итерационным кластер-процедурам?

15. Охарактеризуйте принцип работы метода к-средних?

16. Представьте графически процесс последовательного объединения объектов в классы

17. Представьте графически процесс последовательного разделения объектов в классы

18. Как оценивается качество полученного разбиения совокупности на классы?

19. Из каких соображений дается содержательная интерпретация результатов классификации?

20. Как проводится классификация объектов, если характеризующие их признаки имеют разные единицы измерения?

21. С помощью каких метрик можно измерить различие (сходство) между объектами, если характеризующие их признаки измерены в порядковой шкале?

22. С помощью каких метрик можно измерить различие (сходство) между объектами, если характеризующие их признаки измерены в номинальной шкале?

23. Проиллюстрируйте метод медианной связи для измерения расстояния между классами и ?

24. К какому расстоянию сводится обобщенное расстояние Колмогорова, если , , ?

25. О каком расстоянии между классами объектов идет речь, если заданы следующие числовые коэффициенты обобщенной формулы ?

26. О каком расстоянии между классами объектов идет речь, если заданы следующие числовые коэффициенты обобщенной формулы ?

27. О каком расстоянии между классами объектов идет речь, если заданы следующие числовые коэффициенты обобщенной формулы ?

28. О каком расстоянии между классами объектов идет речь, если заданы следующие числовые коэффициенты обобщенной формулы ?

29. В чем суть методов полной, одиночной и средней связи?

30. В чем особенность и преимущество метода Уорда?

31. Приведите алгоритм иерархических агломеративных кластер-процедур

32. Охарактеризуйте итерационный метод поиска сгущений

33. Охарактеризуйте итерационный метод взаимного поглощения

34. Приведите алгоритм итерационных кластер-процедур (на примере метода k -средних)

35. Обоснуйте выбор метрики и рассчитайте расстояние между объектами и , характеризующимися показателями - рентабельность () и - производительность труда ().

36. Рассчитайте расстояние между объектами и , характеризующимися показателями - расходы на питание () и - расходы на развлечения () по взвешенной евклидовой метрике, выбрав весовые коэффициенты пропорционально степени важности признака в задачи классификации.

37. Обоснуйте выбор метрики для расчета расстояния между объектами, характеризующимися показателями - наличие квартиры и - наличие автомобиля.

38. Обоснуйте выбор метрики для расчета расстояния между объектами, характеризующимися показателями - успеваемость по дисциплине I; - успеваемость по дисциплине II.

39. На основе матрицы расстояний проиллюстрируйте работу дивизимного метода классификации объектов.

40. В кластер входят четыре объекта (), расстояние от которых до объекта составляет соотвественно: 2, 5, 6, 7. Определите расстояние от объекта до кластера , используя принципы «ближайшего соседа», «дальнего соседа», «средней связи».

Тестовые задания для самоконтроля по теме «Кластерный анализ»

 

1 Выберите матрицу, которая может выступать в качестве матрицы расстояний между объектами:

а) б) в) г)

2 В матрице расстояний D оказались пропущенными 2 элемента. Укажите возможные значения а и b. Матрица расстояний имеет вид:

а) a =2, b =2 б) a =-4, b =-4 в) a =4, b =4 г) a =1, b =4

3 Выборочные данные о потреблении и накоплении 6 домохозяйств представлены матрицей объект-свойство:

.

Евклидово расстояние между домохозяйством №1 и №3 равно

а) 2 б) 2, 7 в) 3 г) 6

4 Данные о четырех фирмах, деятельность которых характеризуется показателями и , представлены в таблице:

№ фирмы        
       
       

Евклидово расстояние между третьей и четвертой фирмами равно

а) б) в) г)

5 Выборочные данные о потреблении и накоплении 6 домохозяйств представлены матрицей объект-свойство:

.

Расстояние Чебышева между домохозяйством №1 и №5 равно

а) 1 б) 2 в) 5 г) 6

6 Выборочные данные о потреблении и накоплении 6 домохозяйств представлены матрицей объект-свойство:

.

Считая, что различия в потреблении в 3 раза важнее различий в накоплении, а сумма весовых коэффициентов равна 1, взвешенное евклидово расстояние между домохозяйством №1 и №2 равно

а) б) в) г)

7 В кластер S1 входят 4 объекта, расстояние от которых до объекта О5 составляет соответственно 7, 3, 4, 10. Расстояние от объекта О5 до кластера S1 по принципу «средней связи» составляет

а) 3 б) 8 в) 6 г) 10

8 В кластер S1 входят 5 объекта, расстояние от которых до объекта О6 составляет соответственно 7, 3, 3, 10, 7. Расстояние от объекта О6 до кластера S1 по принципу «средней связи» составляет

а) 3 б) 5 в) 6 г) 10

9 На рисунке представлена дендрограмма агломеративного алгоритма классификации 6 предприятий. Укажите состав классов, если согласно мнению эксперта, предприятия №2 и №3 существенно различаются и не могут входить в один класс.

а) , ,

б) ,

в) ,

г) , , ,

10 На рисунке представлена дендрограмма агломеративного алгоритма классификации 6 предприятий. Укажите классификацию, получаемую при пороговом значении расстояния равном 15.

а) , ,

б) ,

в) ,

г) ,

11 На рисунке представлена дендрограмма агломеративного алгоритма классификации 20 стран.

Укажите величину порогового значения расстояния, при котором страны следует разбить на 4 класса.

а) 20 б) 30 в) 40 г) 60

12 Для классификации 5 предприятий на 2 класса используется метод k-средних. На первой итерации в качестве эталона 1 класса используется объект №1, в качестве эталона 2 класса – объект №2. Известна матрица евклидовых расстояний между объектами:

.

Учитывая, что модификация эталонов проводится только после разнесения всех объектов по классам, укажите состав 1 класса после завершения первой итерации алгоритма.

а) б) в) г)

 

13 Известна матрица евклидовых расстояний между объектами:

.

После первого шага агломеративного алгоритма классификации объекты №1 и №2 объединяются в один класс . Тогда расстояние от объекта №5 до , измеренное по принципу ближнего соседа, равно

а) 11, 05 б) 9, 22 в) 9, 86 г) 4, 24

14 Расстояние между 4 объектами задано матрицей евклидовых расстояний:

D=   01 02 03 04
01   2, 1 3, 1 5, 0
02 2, 1   1, 4 4, 8
03 3, 1 1, 4   6, 4
04 5, 0 4, 8 6, 4  

Используя алгомеративную иерархическую кластер-процедуру, указать разбиение множества объектов на два кластера, исходя из того, что расстояние между кластерами измеряется по принципу дальнего соседа.

а) ; б) ;

в) ; г) ;

15 Расстояние между 4 объектами задано матрицей евклидовых расстояний:

D=   01 02 03 04
01       2, 5
02     1, 3 2, 4
03   1, 3   3, 2
04 2, 5 2, 4 3, 2  

Используя алгомеративную иерархическую кластер-процедуру указать разбиение множества объектов на два кластера, исходя из того, что расстояние между кластерами измеряется по принципу ближайшего соседа.

а) ; б) ;

в) ; г) ;

 

16 Расстояние между 4 объектами задано матрицей евклидовых расстояний:

D=   01 02 03 04
01   4, 5 2, 2 3, 2
02 4, 5   3, 3 2, 0
03 2, 2 3, 3   2, 8
04 3, 2 2, 0 2, 8  

Используя дивизимную иерархическую кластер-процедуру, указать разбиение множества объектов на два кластера.

а) ; б) ;

в) ; г) ;

 

17 Расстояние между 4 объектами задано матрицей евклидовых расстояний:

D=   01 02 03 04
01       2, 5
02     2, 3 4, 2
03   2, 3   6, 0
04 2, 5 4, 2 6, 0  

Используя дивизимную иерархическую кластер-процедуру, указать разбиение множества объектов на два кластера.

а) ; б) ;

в) ; г) ;

 

18 Дана матрица расстояний между объектами. Укажите разбиение, оптимальное с точки зрения минимизации суммы внутриклассовых расстояний.

D=   01 02 03 04
01   2, 1 3, 1 5, 0
02 2, 1   1, 4 4, 8
03 3, 1 1, 4   6, 4
04 5, 0 4, 8 6, 4  

а) , ; б) , ;

в) , ; г) , .

 

 

Вопросы и задания к практическим занятиям на тему «Дискриминантный анализ»

 

41. Что понимается под классификацией в дискриминантном анализе?

42. Что называется обучающей выборкой?

43. Сформулируйте постановку задачи классификации в дискриминантном анализе

44. Что понимается под классом в дискриминантном анализе?

45. В чем отличие параметрического и непараметрического дискриминантного анализа?

46. Сформулируйте основной принцип вероятностных методов классификации и проиллюстрируйте его на графике

47. Как определить условную вероятность отнесения объекта i -го класса к классу с номером j?

48. Выведите формулу для определения средних удельных потерь от неправильной классификации

49. Докажите, что задача минимизации средних удельных потерь эквивалентна задаче максимизации вероятности правильной классификации

50. Что называется процедурой классификации?

51. Какая процедура классификации называется оптимальной (байесовской)?

52. Сформулируйте и докажите теорему, позволяющую построить оптимальную процедуру классификации

53. Сформулируйте правило классификации объектов в случае постоянных потерь от неправильной классификации. Как пользоваться этим правилом на практике?

54. Используя формулу полной вероятности, выведите плотность распределения смеси p классов

55. Как определяются апостериорные вероятности отнесения объекта к тому или иному классу и ожидаемые потери при классификации объекта в j -ый класс?

56. Сформулируйте оптимальное правило классификации через апостериорные вероятности

57. Постройте правило классификации объектов в случае нормального закона распределения классов с равными ковариационными матрицами

58. Запишите правило классификации (4.8) на следующие случаи:

1. объект относится к первому классу;

2. объект относится ко второму классу, количество классов ;

3. удельные веса классов одинаковые;

4. количество признаков , количество классов , .

59. Как на практике реализовать правило классификации (4.8)? Запишите формулы для расчета оценок и – параметров нормально распределенного i -го класса

60. Сформулируйте правило классификации (4.9) через линейные дискриминантные функции

61. Дайте геометрическую интерпретацию дискриминантного анализа в случае нормального закона распределения классов

62. Каким образом классифицировать объект , лежащий на дискриминантной прямой?

63. Запишите уравнение дискриминантной прямой в случае двух признаков, двух нормально распределенных классов с единичными ковариационными матрицами и одинаковыми удельными весами классов

64. Запишите правило классификации (4.10) через дискриминантную функцию и константу дискриминации С

65. Каким образом зависит константа дискриминации C от удельных весов классов и как изменится положение дискриминантной прямой на рисунке 4.7, если , ?

66. Обобщите результаты, полученные в заданиях 23-25, на k -мерный случай, отказываясь от условий и

67. Линейные дискриминантные функции Фишера имеют вид:

, , .

К какому классу относится объект ?

68. Имеются две группы машиностроительных предприятий с высоким (1 класс) и низким (2 класс) уровнем организации управления производством. Деятельность предприятий характеризуется показателем рентабельности (%), распределенным нормально в каждой группе. По обучающим выборкам одинакового объема найдены оценки параметров распределения классов: , , , . С помощью параметрического дискриминантного анализа классифицировать три предприятия, значения рентабельности которых приведены в таблице:

№ предприятия      
Рентабельность, % 9, 9 14, 2 12, 9

69. Экспертным путем сформированы две группы регионов: с высоким (1 класс) и низким (2 класс) уровнем медицинского обслуживания населения. Регионы характеризуются показателем х – число врачей на 10 тыс. жителей, распределенным нормально в каждой группе регионов. По обучающим выборкам одинакового объема найдены оценки параметров распределения классов: , , , . С помощью параметрического дискриминантного анализа классифицировать три региона по показателю Х, значения которого приведены в таблице:

№ региона      
Число врачей на 10 тыс. жителей 25, 5   32, 5

70. Рассматриваются два нормально распределенных класса: , . Удельные веса классов одинаковые. Укажите множество значений первого и второго классов.

71. Рассматриваются два нормально распределенных класса: , . Удельные веса классов одинаковые. Чему равна вероятность неправильной классификации объекта первого класса во второй ?

72. Рассматриваются два нормально распределенных класса: , . Удельные веса классов одинаковые. В каком соотношении находятся вероятности неправильной классификации объекта первого класса во второй и второго класса в первый ?

73. Имеются две обучающие выборки объемами 40 и 50 единиц соответственно. Необходимо классифицировать 10 объектов. Рассчитайте оценку удельного веса объектов второго класса.

74. Объем первой обучающей выборки в 1, 5 раза больше объема второй обучающей выборки. Рассчитайте оценку удельного веса объектов второго класса.

75. Уравнение дискриминантной прямой, разделяющей два нормально распределенных класса с равными ковариационными матрицами, имеет вид: . При этом значения дискриминантной функции для центров первого и второго классов равны соответственно , . В каком соотношении находятся удельные веса классов и ? К каким классам относятся объекты и ?

76. Дискриминантная функция, разделяющая два нормально распределенных класса с равными ковариационными матрицами, имеет вид: . Центры первого и второго классов характеризуются координатами (1; 1) и (2; 2) соответственно. Чему равна константа дискриминации, если удельные веса первого и второго классов составляют 0, 3 и 0, 7 соответственно?

77. Дискриминантная функция, разделяющая два нормально распределенных класса с равными ковариационными матрицами, имеет вид: . Центры первого и второго классов характеризуются координатами (1; 1; 1) и (10; 10; 10) соответственно. К каким классам относятся объекты и , если удельные веса классов одинаковые?

 

4.4 Задание, порядок выполнения и вопросы к защите лабораторной работы на тему «Кластерный анализ»






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.