Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Расчет и интерпретация коэффициентов связи признаков






Так как таблица сопряженности признаков «Занимаетесь ли Вы спортом?» и «Есть ли у Вас хронические заболевания?» имеет размерность , то рассчитаем две группы коэффициентов связи: меры связи, основанные на статистике , и меры связи, основанные на отношении преобладаний (шансов).

Расчет мер связи, основанных на статистике

1. Выборочное значение Фи-коэффициент (коэффициента Чупрова-Крамера) составляет (восьмая строка (Phi for 2x2 tables) таблицы, представленной на рисунке 3.61).

2. Выборочное значение коэффициента сопряженности Пирсона составляет (десятая строка (Contingency coefficient) таблицы, представленной на рисунке 3.61).

3. Выборочное значение коэффициента контингенции Крамера рассчитаем по формуле (3.17): .

4. Выборочное значение - коэффициента Гудмена и Краскала рассчитаем по формуле (3.18): .

Расчет мер связи, основанных на отношении преобладаний (шансов)

1. Выборочное значение коэффициента ассоциации Юла рассчитаем по формуле (3.19): . С вероятностью построим доверительный интервал для коэффициента ассоциации Юла: .

2. Выборочное значение коэффициента коллигации Юла рассчитаем по формуле (3.20): . С вероятностью построим доверительный интервал для коэффициента коллигации Юла: .

3. Выборочное отношение преобладаний (шансов) рассчитаем по формуле (3.21): > 1.

По большинству значений коэффициентов, силу связи между признаками «Занимаетесь ли Вы спортом?» и «Есть ли у Вас хронические заболевания?» можно охарактеризовать как умеренную. Так как коэффициенты контингенции, ассоциации и коллигации принимают положительные значения, а выборочное отношение преобладаний больше 1, то направление связи рассматриваемых признаков «положительное», т.е. если опрашиваемый занимается спортом, то, вероятнее всего, у него нет хронических заболеваний, а если опрашиваемый не занимается спортом, то, вероятнее всего, есть. Таким образом, доказано, что занятия спортом способствуют укреплению здоровья. Однако полученные результаты можно интерпретировать и иначе: наличие хронических заболеваний препятствуют занятиям спортом.

 

Анализ взаимосвязи признаков «Возраст» и «Среднемесячный доход»

 

Аналогично предыдущему случае построим выборочную таблицу сопряженности признаков «Возраст» (Х: – до 30 лет; – от 30 до 50 лет; – 50 лет и старше) и «Среднемесячный доход» (Y: – до 20 тыс. р.; – от 20 до 30 тыс. р.; – 30 тыс. р. и более). Результат представлен на рисунке 3.62.

 

Рисунок 3.62 – Результат построения выборочной таблицы сопряженности признаков «Возраст» и «Среднемесячный доход»

Из 150 опрошенных 54 человека (или 36%) имеют возраст до 30 лет, 61 человек (41%) имеют возраст от 30 до 50 лет и 35 человек (23%) имеют возраст от 50 лет и старше. Большая часть респондентов (91 человек или 61%) имеют среднемесячный доход до 20 тыс. р., 35 человек (23%) имеют среднемесячный доход от 20 до 30 тыс. р. и 24 человека (16%) имеют среднемесячный доход 30 тыс. р. и более. Большая часть респондентов (87%) из возрастной группы до 30 лет имеют доход до 20 тыс. р. в месяц. Для второй возрастной группы этот процент составляет 44, а для третьей – 49. Среди респондентов с доходом от 30 до 50 тыс. р. в месяц 86% имеют возраст старше 30 лет. Этот процент еще выше (92%) для респондентов со среднемесячным доходом 30 тыс. р. и более.

Результаты проверки гипотезы о независимости признаков «Возраст» и «Среднемесячный доход» представлены на рисунке 3.63.

 

Рисунок 3.63 – Результаты проверки гипотезы о независимости признаков «Возраст» и «Среднемесячный доход»

 

Наблюдаемое значение статистики Пирсона (3.11) составляет ; наблюдаемое значение статистики (3.12) составляет . В обоих случаях наблюдаемый уровень значимости p меньше , следовательно, можно сделать вывод о том, что нулевая гипотеза о независимости признаков X и Y отвергается. Таким образом, существует значимая связь между признаками «Возраст» и «Среднемесячный доход».

Так как таблица сопряженности признаков «Возраст» и «Среднемесячный доход» имеет размерность , то рассчитаем меры связи, основанные на статистике , и коэффициенты связи Гудмена и Краскала , , .

Расчет мер связи, основанных на статистике

1. Выборочное значение Фи-коэффициент (коэффициента Чупрова-Крамера) составляет (третья строка (Phi) таблицы, представленной на рисунке 3.63).

2. Выборочное значение коэффициента сопряженности Пирсона составляет (четвертая строка (Contingency coefficient) таблицы, представленной на рисунке 3.63).

3. Выборочное значение коэффициента Чупрова рассчитаем по формуле (3.22): .

4. Выборочное значение коэффициента Крамера составляет (пятая строка (Cramer’s V) таблицы, представленной на рисунке 3.63).

С вероятностью построим доверительные интервалы для коэффициентов Пирсона, Чупрова и Крамера:

; ; .

По рассчитанным значениям коэффициентов можно сделать вывод, что между признаками «Возраст» и «Среднемесячный доход» существует умеренная связь. Выборочное значение коэффициента сопряженности Пирсона означает, что на 16% изменение значения признака Y («Среднемесячный доход») зависит от изменения значения признака X («Возраст»). По выборочным значениям коэффициентов Чупрова и Крамера доля дисперсии признака Y, обусловленная изменением признака Х, чуть меньше и составляет около 10%.

Расчет коэффициентов связи Гудмена и Краскала ,

Для интерпретации зависимости среднемесячного дохода (Y) от возраста (X) рассчитаем коэффициенты связи Гудмена и Краскала , по формулам (3.24) и (3.27) соответственно. Выборочное значение коэффициента составляет , т.к. максимальные частоты для каждой строки принадлежат одному столбцу. Выборочное значение коэффициента составляет (смотри второй коэффициент в последней строке (Uncertainty coefficient) таблицы, представленной на рисунке 3.63), т.е. ошибка предсказания категории признака Y при условном пропорциональном прогнозировании по сравнению с безусловным пропорциональным прогнозированием уменьшится на 10%.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.