Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Закрепление






Перекрестное табулирование

Исходные данные для данной работы находятся в файле Сross-3.sav, Сross-4.sav и показаны в табл. 3, 4.

Таблица 3 Таблица 4

kla sd razmer obraz vf region zadolz educat   kla1 sd1 razmer1 freq gender pref dohod
  l               l     man tm2 lo
  l               l     man tm1 hi
  l               h     wom tm1 hi
  h               h     wom tm1 lo
  h               l     man tm2 hi
  h               l     wom tm2 lo
  l               h     wom tm1 lo
  h               h     man tm2 hi
  l                     wom tm1 lo
  l              
  h            
  h            
  l            
  l            
  l            
  h            
  l            
  l            

Двумерное табулирование

Допустим, в рамках маркетингового исследования анализируются демографические характеристики респондентов, представляющих интерес для производителя [4]. Проанализируйте связь между количеством легковых автомобилей во владении семьи (kla) и семейным доходом (sd). Приняты следующие обозначения: 1 – один автомобиль во владении семьи, 2 – более одного автомобиля, доход условно разделен на 2 уровня: высокий (h) и низкий (l).

ПОСТРОЕНИЕ

1. Постройте таблицу сопряженности kla*sd. Меню: Анализ|НагляднаяСтатистика|Пе-рекрестныеТабличныеДанные…: строки: kla, столбцы: sd, показ кластерных гистограмм.

2. Проценты рассчитывайте по правилам, исходя из предположения, что зависимой является переменная kla. В данном случае это означает, что проценты надо рассчитывать в направлении дохода. Так как каждый уровень дохода соответствует отдельному столбцу, то необходимо рассчитывать проценты по столбцам. Окно Меню: ячейки…|percentages: column | continue.

3. Включите расчет критериев статистической значимости. Окно Меню: Статистика…|chi-square (Хи-квадрат Пирсона), contingency coefficient (коэффициент сопряженности признаков), Phi and Cramer’s V (фи-коэффициент и V-коэффициент Крамера) | continue. Выполните расчеты.

АНАЛИЗ

1. Теперь перейдем к анализу результатов расчетов. Обратите внимание на таблицу сопряженности kla*sd. В строчках count показано количество семей, обладающих данным сочетанием показателей. Например, всего высоким доходом обладает 7 семей и 5 из них имеют 2 автомобиля. В строчках %within SD показаны те же данные, но в % по отношению к общему количеству семей с данным доходом. Проанализируем проценты. Более чем одним автомобилем владеют 71, 4% семей с высоким доходом и только 9, 1% семей с низким доходом. Таким образом, мы видим, что между sd и kla существует связь: семьи с высоким доходом чаще владеют более чем одним автомобилем, чем семьи с низким доходом. Очевидно, что доход влияет на количество машин во владении семьи.

2. Просмотрите кластеризованную гистограмму bar chart. Какой переменной соответствует горизонтальная ось и уровни какой переменной показаны разным цветом столбцов? Гистограмма показывает, что среди семей, владеющих одним автомобилем, гораздо больше семей с низким доходом, чем с высоким. Среди семей, владеющих более чем одним автомобилем, соотношение противоположное.

3. Итак, мы видим, что связь есть и направление этой связи понятно. Теперь необходимо убедиться в ее статистической значимости. Для этого просмотрите результаты расчета статистических критериев chi-square tests и symmetric measures. Сравнивая уровни значимости asymp.sig, exact.sig и approx.sig. с критическими значениями, Вы можете сделать выводы о статистической значимости связи (см. Раздел 1). В данном случае, согласно большинству критериев можно считать связь значимой на уровне 0, 01. Некоторые критерии показывают, что связь значима только лишь на уровне 0, 05.

ЗАКРЕПЛЕНИЕ

1. В целях повторения выполните двумерное табулирование для следующих данных. На количество автомобилей во владении семьи, помимо дохода влияют также и другие переменные, например, размер семьи (razmer). Случаи, когда семья состоит из 4 и менее человек, обозначены как 4, если же размер семьи превышает 4 человека, то эти случаи обозначены как 5. Выполните двумерное табулирование kla*razmer. Проценты рассчитайте исходя из того, что зависимой является переменная kla. В результатах расчетов, помимо таблицы сопряженности должна быть кластеризованная гистограмма и статистические критерии Хи-квадрат: коэффициент сопряженности, фи-коэффициент и V-коэффициент Крамера.

2. Есть ли связь между размером семьи и количеством автомобилей во владении семьи? Является ли эта связь статистически значимой? Исходя из уровней значимости сделайте вывод: с чем количество машин во владении семьи связано более сильно: с доходом или с размером семьи?






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.