Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Меры связи для таблиц сопряженности порядковых признаков






 

Если признаки X и Y являются порядковыми и их значения и упорядочены по убыванию рангов, то дополнительно к ранее рассмотренным мерам связи можно рассчитать ранговые коэффициенты корреляции (порядковые меры связи) [15, 16, 42].

Рассмотрим две комбинации возможных значений признаков X и Y: , . Введем следующие обозначения:

S – количество наблюдений, для которых одновременно либо и , либо и , ;

D – количество наблюдений, для которых либо и , либо и , ;

– количество наблюдений, для которых , ;

– количество наблюдений, для которых , .

Тогда если между признаками X и Y сильная связь, то число S велико, а число D мало. Поэтому порядковые меры связи основаны на вычислении разности , а отличаются между собой способом нормирования этой разности.

1. -мера Гудмена и Краскала

Выборочное значение коэффициента рассчитывается по формуле [15, 42]:

 

, . (3.30)

 

Коэффициент интерпретируется как разность вероятностей правильного и неправильного порядка для двух объектов, случайно извлеченных из совокупности при условии, что совпадающих рангов нет.

2. -мера Кендалла

Выборочное значение коэффициента рассчитывается по формуле [15, 42]:

 

, . (3.31)

 

Это известный ранговый коэффициент корреляции Кендалла, рассчитываемый в случае наличия множества одинаковых рангов.

3. -мера Стьюарта

Выборочное значение коэффициента рассчитывается по формуле [16]:

 

, где , . (3.32)

 

4. d -мера Сомерса

Используется в случае, когда один из признаков является результативный, а другой – факторным [15, 42]. Если признак Y – результативный, то рассчитывается коэффициент . Если признак Х – результативный, то рассчитывается коэффициент .

 

 

3.4 Вопросы и задания к практическим занятиям

 

Вопросы и задания к практическим занятиям на тему «Корреляционный анализ количественных признаков»

 

1. Каковы условия применения и задачи корреляционного анализа количественных признаков?

2. Сформулируйте постановку задачи и перечислите основные этапы многомерного корреляционного анализа

3. Как рассчитать апостериорную оценку корреляционной матрицы?

4. Запишите формулы для расчета апостериорных оценок частного коэффициента корреляции в трехмерном и k -мерном случаях

5. Опишите алгоритм проверки значимости коэффициента корреляции

6. Опишите алгоритм проверки значимости частного коэффициента корреляции

7. Опишите алгоритм построения доверительного интервала для значимого коэффициента корреляции

8. Опишите алгоритм построения доверительного интервала для значимого частного коэффициента корреляции

9. Запишите формулы для расчета апостериорной оценки частного коэффициента корреляции в трехмерном и k -мерном случаях

10. Запишите формулы для расчета апостериорных оценок коэффициентов детерминации и множественных коэффициентов корреляции

11. Опишите алгоритм проверки значимости коэффициента детерминации

12. Запишите оценку уравнения регрессии для j -го признака

13.Каким образом в корреляционном анализе проверяется значимость уравнения регрессии и значимость коэффициентов уравнения регрессии?

14.Оценка ковариационной матрицы имеет вид: . Рассчитайте оценку корреляционной матрицы и выборочное значение частного коэффициента корреляции .

15.Выборочные значение коэффициента корреляции и частного коэффициентов корреляции составляют: , . Охарактеризуйте влияние на связь случайных величин и .

16.Известны оценки остаточной и общей дисперсий: =15, 2; = 76. Рассчитайте выборочное значение коэффициента детерминации . Какова для (в %) дисперсии случайной величины , объясняемая влиянием случайных величин ?

17.По выборке объема n =20 из трехмерной нормально распределенной генеральной совокупности вычислено выборочное значение коэффициента детерминации . На уровне значимости a =0, 05 с помощью статистики проверяется гипотеза . Укажите критическую область и вывод относительно проверяемой гипотезы.

18.При какой величине выборочного значения коэффициента детерминации на уровне значимости 0, 05 принимается гипотеза Н 0: , если k =6, а объем выборки равен 25?

а) 0, 4 б) 0, 6 в) 0, 5 г) 0, 7

19.При проведении корреляционного анализа по результатам 10 наблюдений рассчитана оценка коэффициента уравнения регрессии и с доверительной вероятностью 0, 9 найдена интервальная оценка для : . Какое значение примет верхняя граница доверительного интервала для , если задана новая доверительная вероятность 0, 95?

Р.S. Для построения доверительного интервала для коэффициента используется статистика .

20.По выборке объема n =18 из трехмерной нормально распределенной генеральной совокупности вычислено значение выборочного коэффициента корреляции =0, 6. На уровне значимости a =0, 05 проверяется гипотеза против альтернативной . Укажите критическую область и вывод относительно проверяемой гипотезы.

21.По выборке объема n =19 из трехмерной нормально распределенной генеральной совокупности вычислено значение частного коэффициента корреляции . На уровне значимости a =0, 05 проверяется гипотеза против альтернативной . Укажите критическую область и вывод относительно проверяемой гипотезы.

22.По выборке объема n =19 из нормально распределенной генеральной совокупности вычислено значение выборочного коэффициента корреляции =0, 6. С вероятностью постройте доверительный интервал для коэффициента корреляции .

23.По выборке объема n =20 из трехмерной нормально распределенной генеральной совокупности вычислено значение частного коэффициента корреляции . С вероятностью постройте доверительный интервал для частного коэффициента корреляции .

 

 

Вопросы и задания к практическим занятиям на тему «Корреляционный анализ порядковых переменных: ранговая корреляция»

 

1. Охарактеризуйте случайную величину порядкового типа. Приведите примеры порядковых случайных величин

2. Дайте понятие методов ранговой корреляции, ранжировки, ранга

3. Какие ранги называют «объединенными» или «связными»?

4. Сформулируйте постановку задачи корреляционного анализа порядковых переменных

5. Выведите формулу для расчета выборочного значения рангового коэффициента корреляции Спирмена

6. Какими свойствами обладает ранговый коэффициент корреляции Спирмена?

7. Опишите алгоритм проверки значимости рангового коэффициента корреляции Спирмена

8. Выведите формулу для расчета выборочного значения рангового коэффициента корреляции Кендалла

9. Какими свойствами обладает ранговый коэффициент корреляции Кендалла?

10. Опишите алгоритм проверки значимости рангового коэффициента корреляции Кендалла

11. Опишите алгоритм построения доверительного интервала для значимого рангового коэффициента корреляции Кендалла

12. Выведите формулу для расчета выборочного значения коэффициента конкордации

13. Какими свойствами обладает коэффициент конкордации?

14. Опишите алгоритм проверки значимости коэффициента конкордации

15. Какие числовые характеристики связи параметрические или ранговые менее чувствительными к выбросам и погрешностям измерения?

16. Требуется проранжировать 13 филиалов по количеству заключаемых договоров в день (в порядке возрастания):

№ филиала                          
Количество договоров                          

Какому филиалу (филиалам) соответствует ранг 11, 5? Сколько групп связанных рангов будет образовано? Какой ранг будет присвоен филиалам, входящих в группу связанных рангов наибольшей длины?

17. Для 3 домохозяйств известны их накопление и потребление за месяц (усл. ед.):

Домохозяйство Накопление Потребление
А    
Б    
В    

Укажите согласованные пары домохозяйств. Чему равно количество инверсий в ранжировках домохозяйств по объему накоплений и объему потреблений?

18. Исследуется взаимосвязь между ВВП на душу населения и спросом на потребительские кредиты по данным 10 стран. Чему равно максимально возможное количество несогласованных пар стран?

19. Эксперт проранжировал 5 инвестиционных проектов по уровню рентабельности и риска:

Характеристика Проект
А Б В Г Д
Рентабельность          
Риск          

Чему равны выборочные значения ранговых коэффициентов корреляции Спирмена и Кендалла между рентабельностью и риском?

20. На основе выборочного обследования 11 предприятий получена оценка рангового коэффициента корреляции Спирмена , где - величина основных фондов, - производительность труда. При каком уровне значимости (0, 01; 0, 05; 0, 1) коэффициент Спирмена между величиной основных фондов и производительностью труда является значимо отличным от нуля?

21. На основе выборочного обследования 11 предприятий получена оценка рангового коэффициента корреляции Кендалла , где - величина основных фондов, - производительность труда. При каком уровне значимости (0, 01; 0, 05; 0, 1) коэффициент Кендалла между величиной основных фондов и производительностью труда является значимо отличным от нуля?

22. Какое минимальное по модулю значение может принять выборочное значение рангового коэффициента корреляции Кендалла, чтобы при объеме выборки равном 50 предприятий на 5% уровне значимости можно было утверждать наличие статистически достоверной связи между величиной основных фондов и производительностью труда?

а) 0, 1 б) 0, 2 в) 0, 3 г) 0, 4

 

Вопросы и задания к практическим занятиям на тему «Корреляционный анализ номинальных признаков: анализ таблиц сопряженности»

 

1. Охарактеризуйте случайную величину номинального типа. Приведите примеры номинальных случайных величин

2. В чем состоят особенности катеризованных и некатегоризованных номинальных признаков?

3. Каким образом может быть задан закон распределения номинальной случайной величины?

4. Каким образом может быть представлено эмпирическое распределение номинальный случайной величины?

5. Опишите структуру, свойства и интерпретацию двухфакторной таблицы сопряженности

6. Опишите структуру, свойства и интерпретацию двухфакторной таблицы сопряженности

7. Какие существуют методы отбора объектов в выборку, в чем их суть?

8. Дайте понятие энтропии распределения

9. В чем состоит алгоритм проверки гипотезы о независимости двух номинальных признаков?

10. Выведите формулу для расчета теоретических частот при проверке гипотезы о независимости двух номинальных признаков

11. Каковы условия применения критерия Пирсона и информационного критерия?

12. В каких случаях используется и в чем состоит точный критерий Фишера?

13. Охарактеризуйте задачу, решаемую с помощью критерий Мак-Нимара

14. Охарактеризуйте меры связи, основанные на статистике Хи-квадрат и рассчитываемые на основе выборочной таблицы сопряженности

15. Охарактеризуйте меры связи, основанные на отношении преобладаний (шансов) и рассчитываемые на основе выборочной таблицы сопряженности

16. Постройте доверительные интервалы для коэффициентов ассоциации и коллигации Юла

17. Каким образом интерпретируется «направление» связи двух дихотомических признаков?

18. Охарактеризуйте меры связи, основанные на статистике Хи-квадрат и рассчитываемые на основе выборочной таблицы сопряженности

19. Постройте доверительные интервалы для коэффициентов Пирсона, Чупрова и Крамера

20. Охарактеризуйте коэффициенты связи Гудмена и Краскала , , , рассчитываемые на основе выборочной таблицы сопряженности

21. Постройте доверительные интервалы для коэффициентов Гудмена и Краскала ,

22. Охарактеризуйте коэффициенты связи Гудмена и Краскала , , , рассчитываемые на основе выборочной таблицы сопряженности

23. Перечислите симметричные и асимметричные коэффициенты связи, рассчитываемые на основе выборочной таблицы сопряженности

24. Можно ли интерпретировать «направление» связи двух номинальных признаков на основе выборочной таблицы сопряженности ?

25. Какие меры связи могут использоваться для таблиц сопряженности порядковых признаков?

26. Охарактеризуйте информационные меры связи, рассчитываемые на основе выборочной таблицы сопряженности

27. Выборочное распределение случайной величина Х – интерес зрителей к телепередаче имеет вид:

Значение признака, Всегда смотрю Обычно смотрю Иногда смотрю Никогда не смотрю
Количество респондентов,        

Ответьте на вопросы: какое количество респондентов опрошено, какова относительная частота , сколько респондентов проявляют какой-либо интерес к телепередаче?

28. Выборочная двухфакторная таблица сопряженности признаков Х – качество жилищных условий и Y – среднегодовой доход на каждого члена семьи имеет вид:

\ Низкий Средний Высокий
Низкое      
Удовлетворительное      
Хорошее      
Очень хорошее      

Ответьте на вопросы: у скольких опрошенных человек низкое качество жилищных условий, сколько опрошенных человек имеют низкий среднегодовой доход, у скольких опрошенных человек при низком среднегодовом доходе очень хорошее качество жилищных условий?

 

 

29. Выборочная таблица сопряженности признаков Х и Y имеет вид:

 
   
   

Чему равна теоретические частоты при проверке гипотезы о независимости признаков X и Y? Чему равно выборочное значение отношения преобладаний (шансов) и как интерпретируется направление связи признаков X и Y?

30. Выборочная таблица сопряженности состоит из трех строк и пяти столбцов. Чему равно число степеней свободы у распределения статистики Пирсона при проверке гипотезы о независимости признаков X и Y?

31. Объем выборки n =1000, точечная оценка коэффициента ассоциации Юла , . С вероятностью определите радиус доверительного интервала для коэффициента ассоциации Юла.

32. На основе выборочной таблицы сопряженности доказано, что между признаками X и Y существует значимая связь. Выборочные значения коэффициента сопряженности Пирсона, коэффициента ассоциации и отношения преобладаний (шансов) составили соответственно 0, 4; -0, 65; 0, 2. Как можно интерпретировать силу и направление связи признаков X и Y?

33. Насколько процентов изменение значения признака Y зависит от изменения значения признака Х, если выборочное значение коэффициента сопряженности Пирсона составляет 0, 7?

34. Объем выборки n =1000, точечная оценка коэффициента сопряженности Пирсона , . С вероятностью определите нижнюю границу доверительного интервала для коэффициента сопряженности Пирсона.

35. Объем выборки n=1000, точечная оценка коэффициента сопряженности Чупрова , . С вероятностью определите верхнюю границу доверительного интервала для коэффициента Чупрова.

36. Выборочная таблица сопряженности имеет вид:

 
     
     
     

Наблюдаемое значение статистики . Чему равно выборочное значение коэффициента сопряженности Пирсона? Каково наиболее вероятное значение признака Y, если значение X неизвестно; если X = ? Каково наиболее вероятное значение признака Х, если значение Y неизвестно; если Y = ?

37. Выборочная таблица сопряженности имеет вид:

 
     
     

Чему равно и как интерпретируется выборочное значение коэффициента

 

3.5 Задание, порядок выполнения и вопросы к защите лабораторной работы на тему «Корреляционный анализ количественных признаков»

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.