Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Меры различия профилей для количественных переменных






Профиль — это набор оценок (количественных признаков) объекта. Если объекты — это испытуемые, то профилем могут быть их оценки по каким-либо тестам. Сравниваемыми объектами могут быть и сами признаки, и объек­ты, оцениваемые испытуемыми, например, по степени предпочтения. Тогда профилем будет совокупность индивидуальных значений соответственно для признака или оцениваемого объекта. Таким образом, меры различия профи­лей могут применяться к наиболее типичным психологическим данным — типа «объект-признак».

Меры взаимосвязи — самые распространенные и очевидные показатели различия в социальных науках, в том числе в психологии. Иногда, например, в программе STATISTICA, в качестве меры различия используется величина

1 - r (где r — коэффициент корреляции Пирсона). Чем более сходна форма профилей оценок для двух объектов или чем более согласованы изменения индивидуальных оценок для двух признаков, тем более они похожи (выше коэффициент корреляции), а указанная мера различия — ближе к нулю. Сле­дует отметить важную особенность использования коэффициента корреля­ции в качестве меры различия. Если существует сильная взаимосвязь двух признаков, но она отрицательна (отрицательный коэффициент корреляции), то при анализе эти признаки будут трактоваться как сильно различающиеся. Но если поменять знак одной из переменных, они станут очень близки. Та­ким образом, коэффициенты корреляции могут являться адекватной мерой различия (близости) только в том случае, если все они положительны (или взяты по абсолютной величине — без учета знака).

Меры расстояния — наиболее специфичные показатели различия именно для профилей, то есть множества Р признаков, измеренных для каждого объек­та. Различие между двумя объектами, выраженное мерой расстояния, пока­зывает, насколько в среднем различаются совокупности оценок для двух объек­тов, или насколько в среднем удалены друг от друга профили оценок. Другая трактовка меры расстояния — геометрическая. Это расстояние между двумя точками (объектами) в пространстве, размерность которого равна числу при­знаков. Значения признаков для объекта трактуются как координаты, задаю­щие его положение в этом пространстве.

Есть два способа задания расстояний, и выбор способа зависит от задачи исследования. Обычно исследователь имеет таблицу (матрицу) данных N x P, где N — строки (испытуемые, объекты), Р — столбцы (признаки, оценивае­мые объекты). Если исследователя интересуют различия между объектами или испытуемыми (с точки зрения, например, их классификации), то ему необ­ходимо задавать меры различия (расстояния) между строками. Если же ему важны основания классификации признаков, то выбираются меры различия (расстояния) между столбцами.

Существует множество мер расстояния, но наиболее часто используются две: евклидово (или его квадрат) и «метрика города».

Евклидово расстояние легко представить себе как кратчайшее расстояние (по прямой) между двумя точками (объектами) в пространстве двух, трех и более координат — в соответствии с числом признаков. Наиболее подходит эта метрика для метрических данных (в шкале интервалов или отношений). Если число признаков Р, то евклидово расстояние между объектами с номе­рами и у выражается формулой:

,

где xip и xJp значения признака р для объектов с номерами i и y соответствен­но. В пространственном представлении эти значения трактуются как коорди­наты объектов i и y по оси р.

«Метрика города» (синонимы — «Манхаттан», «городских кварталов» или city-black) — получила свое название по аналогии с длиной пути пешехода, движущегося от одного объекта к другому в городе. Пешеход вынужден обходить кварталы домов по ломаной линии. Каждый «квартал» при этом — это абсолютная раз­ность между значениями двух объектов по одному из признаков. «Метрика города» больше подходит для неметрических дан­ных (порядковых и, отчасти, бинарных) и вычисляется по формуле:

Важное замечание относительно мер расстояния касается разного масш­таба оценок (переменных). Если переменные представлены в разных шкалах, имеют разный масштаб (средние и стандартные отклонения а), то на рассто­яние больше будут влиять переменные, имеющие больший разброс (диспер­сию). Чтобы уравнять влияние переменных на расстояние между объектами, целесообразно до вычисления расстояний нормировать переменные (делить на стандартное отклонение) или преобразовать их в г-оценки.

Заключая обзор мер различия, следует отметить одно обстоятельство. Наи­более частый вид данных в психологии — это множество признаков, измерен­ных у множества испытуемых. И наиболее вероятно, что исследователь пред­почтет, выбирая многомерное шкалирование или кластерный анализ, опираться на меры различия профилей. В этой ситуации исследователь должен отдавать себе отчет в том, что получаемые показатели различия между объектами не не­сут никакой иной информации, кроме констатации того, что субъект А по из­меренным признакам более похож на субъекта В, чем на субъекта С. А инфор­мация о том, по каким признакам различия больше, а по каким — меньше, утрачивается при вычислении расстояний. Таким образом, одни и те оке значе­ния различий между парами объектов могут быть обусловлены разницей в значе­ниях по разным признакам. Это обстоятельство сильно затрудняет интерпрета­цию мер расстояния. Иначе дело обстоит, если меры различия профилей используются в отношении данных о субъективных предпочтениях, когда вы­числяются меры различия между объектами предпочтения по множеству субъек­тивных оценок (между столбцами — оцениваемыми объектами). Здесь интер­претация достаточно очевидна: объекты будут тем ближе, чем ближе в среднем |их располагают субъекты при упорядочивании по степени предпочтения. Во­обще говоря, если у исследователя есть выбор при планировании инструмента­рия, для классификации объектов следует предпочесть непосредственные оцен­ки различия, данные о предпочтениях или условные и совместные вероятности.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.