Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Метрика в признаковом пространстве: расстояния между объектами






 

Рассмотрим наиболее часто используемые расстояния между объектами [12, 25].

1. Обычное евклидово расстояние: .

Данная мера различия объектов используется в трех случаях:

1. выборка извлечена из нормально распределенной генеральной совокупности с ковариационной матрицей вида (признаки некоррелированы и имеют одинаковую дисперсию);

2. признаки однородны по физическому смыслу и одинаково важны при классификации;

3. признаковое пространство совпадает с геометрическим пространством.

2. Взвешенное евклидово расстояние: .

Данная мера различия объектов применяется в случаях, когда каждому l -му признаку удается приписать некоторый «вес» , пропорциональный степени важности признака при классификации, .

3. Обобщенное расстояние Махаланобиса:

 

,

 

где – векторы значений признаков, характеризующих объекты и ;

Σ – ковариационная матрица генеральной совокупности, из которой извлечена выборка;

Δ – некоторая симметричная неотрицательно-определенная матрица весовых коэффициентов признаков.

Данную метрику рекомендуется использовать в случае гетероскедастичности и коррелированности исходных признаков.

4. Расстояние Минковского: , . Интересны несколько частных случаев, соответствующих различным значениям p: при метрика сводится к обычному евклидову расстоянию, при получают расстояние Чебышева, при – Хеммингово расстояние (манхэттенская метрика, расстояние city-block, метрика города) [26].

5. Хеммингово расстояние часто применяется как мера различия объектов, задаваемых дихотомическими признаками: .

6. Расстояние Чебышева: .

7. Корреляционное расстояние: ,

где – выборочный коэффициент корреляции между объектами и .

8. Расстояние Канберра: .

Если кластерный анализ применяется для решения задачи классификации признаков, то для измерения сходства i -го и j -го признаков используется мера близости , в качестве которой могут выступать различные коэффициенты связи: коэффициент корреляции, корреляционное отношение, ранговые коэффициенты корреляции и др.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.