Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Глава 6. Коэффициенты корреляции. Воспользуемся данными из примера 6. 1 с показателями вербального и невербаль­ного интеллекта, измеренного у 20 учащихся 8-го класса (г = 0,517)






ПРИМЕР 6.8

Воспользуемся данными из примера 6.1 с показателями вербального и невербаль­ного интеллекта, измеренного у 20 учащихся 8-го класса (г = 0, 517). Добавим еще одно наблюдение: Хц = 3, y2i = 16 (см. рис. 6.5), Новое значение ^Пирсона для всех N - 21 теперь будет равно г = -0, 124.


Вербальный IQ


Рис. 6.5. Демонстрация влияния экстремальных значений признаков («выброса») на коэффициент корреляции Пирсона

Пример 6.8 демонстрирует, что даже одно наблюдение с экстремально боль­шими или малыми значениями переменных может изменить знак корреля­ции на противоположный.Точно так же немногочисленные выбросы могут обусловить и появление корреляции.

Существенно меньшему влиянию выбросов подвержены ранговые корре­ляции. Поэтому один из способов борьбы с выбросами — переход к рангам и применение ранговых коэффициентов корреляции.

Для примера 6.8 ранговые коэффициенты корреляции (Спирмена и Кендалла) для первых 20 испытуемых (без выброса) составляют, соответственно: г, = 0, 505; т = 0, 390. При добавлении выбросов: г, = 0, 294; т = 0, 239. Значения корреляций уменьшилось, но не столь существенно, как г-Пирсона.

Другой подход к выбросам подразумевает «чистку» данных. Можно для каждой переменной установить определенное ограничение на диапазон ее изменчивости. Например, исключать те наблюдения, которые выходят за пре­делы диапазона М ± 2о (или даже М ± 1, 5а).

ЧАСТЬ I. ОСНОВЫ ИЗМЕРЕНИЯ И КОЛИЧЕСТВЕННОГО ОПИСАНИЯ ДАННЫХ

Часто такая «чистка» совершенно необходима. Например, при исследовании вре­мени реакции, когда основная масса наблюдений находится в диапазоне 250-700 мс, исключение нескольких «странных» значений меньше SO мс и больше 1000 мс мо­жет существенно изменить общую картину.

По сути, наличие выбросов означает отклонение распределений одной или обеих переменных от нормального вида. В общем случае, если распределения переменных сильно скошены (асимметричны), это может существенно сни­жать значение корреляции даже при сильной связи между соответствующими свойствами или, наоборот, обусловить появление «ложной» корреляции. Осо­бенно сильно асимметричность распределений влияет на /--Пирсона. Поэто­му при существенном отклонении формы распределения хотя бы одной пере­менной от нормального вида желательно перейти к рангам и воспользоваться ранговым коэффициентом корреляции.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.