Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Regression






Custom Tables

 

 

 
   
   
     
   
   
   
   
   
   
     
   

 

 

[DataSet1] D: \SLISS\--- 2012-2013\- 2013 Анализ данных\RU_ESS5e03.sav

В этой таблице показано, как закодированы переменные

 

  Column N %
Пол респондентов Мужчины 41, 0
Женщины 59, 0
Возраст респондентов в категориях 14 - 24 года 13, 8
25 - 34 года 18, 1
35 - 44 года 15, 9
45 - 54 года 16, 5
55 - 64 года 16, 6
65 - 74 года 11, 5
75 лет и старше 7, 6
2 Место жительства (город - сельская местность) -- описание респондента (без ферм) Большой город 37, 4
Пригород или окраина большого города 5, 2
Небольшой город 34, 9
Поселок или деревня 22, 5
Ферма или отдельностоящий дом в сельской местности , 0
Официальное семейное положение -- перекодированное Состоят в официальном браке 44, 1
Зарегистрированный гражданский брак , 0
Официально расстались , 0
Официально разведены 14, 4
Вдовы и вдовцы 17, 1
Никогда не состояли в зарегистрованном браке 24, 4
Состоят в официальном браке Не состоят в официальном браке 56, 2
Состоят в официальном браке 43, 8
Разведены официально или расстались Не в разводе 85, 7
В разводе или расстались 14, 3
ОБРАЗОВАНИЕ, ES - ISCED Not possible to harmonise into ES-ISCED , 0
ES-ISCED I, начальное 4, 5
ES-ISCED II, неполное среднее 9, 6
ES-ISCED IIIb, среднее , 0
ES-ISCED IIIa, среднее -- продвинутое (гимназия и т.п.) 34, 1
ES-ISCED IV, среднее специальное (техникум и т.п.) 24, 9
ES-ISCED V2, высшее -- специалисты, баки, магистры и выше 27, 0
Other , 0
Голосовали на последних выборах за Единую Россию? Не голосовали за Единую Россию 36, 4
Голосовали за Единую Россию 63, 6
Используют Интернет/e-mail/www в личных целях Нет доступа дома или на работе 49, 8
Никогда не пользуются в личных целях 4, 5
Реже, чем раз в месяц 1, 3
Раз в месяц , 7
Несколько раз в месяц 4, 6
Раз в неделю 2, 7
Несколько раз в неделю 9, 8
Каждый день 26, 6

 

 

REGRESSION

/MISSING LISTWISE

/STATISTICS COEFF OUTS R ANOVA

/CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT netuse

/METHOD=STEPWISE gndr_Пол Возраст_в_категор ГОРОД_СЕЛО2 Брак Развод eisced_Образование Голос_ЕДРОС.

 

Считается линейная пошаговая регрессия (STEPWISE)

Переменная «место жительства» трактуется как интервальная: чем выше значение, тем менее городское место жительства (1 – большой город, 4 – сельская местность).

Regression

 

[DataSet1] D: \SLISS\--- 2012-2013\- 2013 Анализ данных\RU_ESS5e03.sav

 

 

Variables Entered/Removeda
Model Variables Entered Variables Removed Method
  Возраст респондентов в категориях . Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
  2 Место жительства (город - сельская местность) -- описание респондента (без ферм) . Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
  ОБРАЗОВАНИЕ, ES - ISCED . Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
  Пол респондентов . Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
a. Dependent Variable: Используют Интернет/e-mail/www в личных целях

Четыре шага – на последнем – в модели 4 переменных.

 

Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
  , 572a , 327 , 326 2, 473
  , 603b , 363 , 363 2, 405
  , 619c , 383 , 381 2, 369
  , 625d , 390 , 389 2, 355
a. Predictors: (Constant), Возраст респондентов в категориях
b. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
c. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
d. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов

Подавляющую долю дисперсии, судя по R-квадрат, объяснил возраст (33%), вторая по значимости переменная – место жительства добавочно объяснила объяснила лишь 36, 3 – 32, 6 = 3, 7% дисперсии…

 

ANOVAa
Model Sum of Squares df Mean Square F Sig.
  Regression 4714, 283   4714, 283 770, 860 , 000b
Residual 9717, 715   6, 116    
Total 14431, 997        
  Regression 5243, 871   2621, 935 453, 154 , 000c
Residual 9188, 127   5, 786    
Total 14431, 997        
  Regression 5522, 062   1840, 687 327, 855 , 000d
Residual 8909, 936   5, 614    
Total 14431, 997        
  Regression 5634, 794   1408, 699 253, 967 , 000e
Residual 8797, 203   5, 547    
Total 14431, 997        
a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
b. Predictors: (Constant), Возраст респондентов в категориях
c. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
d. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
e. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов

!!! Внимание!!! во вкладке Statistics была поставлена «галочка» для collinearity diagnostics (диагностика коллинеарности).

В пошаговой регрессии по определению каждая модель лучше предыдущей, если рассматривать ANOVA.

Поскольку использовалась пошаговая регрессия, все коэффициенты, включенные в модели – значимы.

Судя по VIF, которые близки к единице, больших проблем с мультиколлинеарностью быть не должно.

Все же стоит посмотреть не растут ли коэффициенты и не меняются ли знаки. В четвертой модели по сравнению с третьей немного увеличился коэффициент для образования, но это не страшно.

 

 

Coefficientsa
Model Unstandardized Coefficients Standardized Coefficients t Sig. Collinearity Statistics
B Std. Error Beta Tolerance VIF
  (Constant) 6, 593 , 165   39, 978 , 000    
Возраст респондентов в категориях -1, 017 , 037 -, 572 -27, 764 , 000 1, 000 1, 000
  (Constant) 7, 709 , 198   38, 867 , 000    
Возраст респондентов в категориях -, 990 , 036 -, 556 -27, 699 , 000 , 994 1, 006
2 Место жительства (город - сельская местность) -- описание респондента (без ферм) -, 485 , 051 -, 192 -9, 567 , 000 , 994 1, 006
  (Constant) 5, 608 , 357   15, 724 , 000    
Возраст респондентов в категориях -, 888 , 038 -, 499 -23, 336 , 000 , 850 1, 176
2 Место жительства (город - сельская местность) -- описание респондента (без ферм) -, 425 , 051 -, 168 -8, 393 , 000 , 966 1, 035
ОБРАЗОВАНИЕ, ES - ISCED , 334 , 048 , 153 7, 039 , 000 , 826 1, 210
  (Constant) 6, 367 , 392   16, 224 , 000    
Возраст респондентов в категориях -, 865 , 038 -, 486 -22, 647 , 000 , 835 1, 198
2 Место жительства (город - сельская местность) -- описание респондента (без ферм) -, 424 , 050 -, 168 -8, 428 , 000 , 966 1, 035
ОБРАЗОВАНИЕ, ES - ISCED , 345 , 047 , 158 7, 301 , 000 , 824 1, 213
Пол респондентов -, 557 , 123 -, 089 -4, 508 , 000 , 981 1, 019
a. Dependent Variable: Используют Интернет/e-mail/www в личных целях

 

Уравнение регрессии (для него всегда используются нестандартизованные коэффициенты B, округляем до десятых):

Интернет = 6, 4 – 0, 9*Возраст – 0, 4*Место жительства + 0, 3*образование – 0, 6*пол использованные в уравнении коэффициенты

Как уже было сказано, судя по стандартизованному коэффициенту бетта сильнее всего влияет на пользование Интернетом возраст.

Интерпретация коэффициентов (нужно учитывать знак и кодировку).

Для пользования Интернетом 0 «минимальное использование» … 7 «максимальное»

Для возраста коэффициент отрицательный, это значит, что старшие возрастные группы реже пользуются интернетом, чем молодые.

Для места жительства – он тоже отрицательный. Учитывая кодировку – жители малых городов и сельских поселений меньше пользуются интернетом в сравнении с жителями больших городов.

Для образования – положительный. Чем выше образовательный уровень, тем больше пользуются Интернетом.

Пол – отрицательный коэффициент показывает, что женщины меньше пользуются Интернетом, чем мужчины.

 

!!! Внимание!!! нельзя ориентироваться только на знак регрессионного коэффициента. Нужно учесть, как закодированы независимые и зависимые переменные.

 

Excluded Variablesa
Model Beta In t Sig. Partial Correlation Collinearity Statistics
Tolerance
  Пол респондентов -, 081b -3, 916 , 000 -, 098 , 984
2 Место жительства (город - сельская местность) -- описание респондента (без ферм) -, 192b -9, 567 , 000 -, 233 , 994
Состоят в официальном браке , 066b 3, 188 , 001 , 080 , 994
Разведены официально или расстались -, 027b -1, 326 , 185 -, 033 , 998
ОБРАЗОВАНИЕ, ES - ISCED , 183b 8, 388 , 000 , 206 , 850
Голосовали на последних выборах за Единую Россию? -, 025b -1, 213 , 225 -, 030 , 984
  Пол респондентов -, 082c -4, 077 , 000 -, 102 , 984
Состоят в официальном браке , 069c 3, 447 , 001 , 086 , 994
Разведены официально или расстались -, 031c -1, 555 , 120 -, 039 , 998
ОБРАЗОВАНИЕ, ES - ISCED , 153c 7, 039 , 000 , 174 , 826
Голосовали на последних выборах за Единую Россию? -, 010c -, 505 , 613 -, 013 , 978
  Пол респондентов -, 089d -4, 508 , 000 -, 112 , 981
Состоят в официальном браке , 054d 2, 723 , 007 , 068 , 982
Разведены официально или расстались -, 041d -2, 075 , 038 -, 052 , 993
Голосовали на последних выборах за Единую Россию? -, 003d -, 159 , 874 -, 004 , 976
  Состоят в официальном браке , 036e 1, 761 , 078 , 044 , 931
Разведены официально или расстались -, 033e -1, 652 , 099 -, 041 , 983
Голосовали на последних выборах за Единую Россию? , 008e , 418 , 676 , 010 , 960
a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
b. Predictors in the Model: (Constant), Возраст респондентов в категориях
c. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
d. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
e. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов

Интернет перекодируется в бинарную переменную: 1 – пользуются Интернетом каждый день, 0 – пользуются реже или вообще не пользуются.

Рассчитывается логистическая регрессия. Зависимая переменная – описанная выше бинарная.

Независимые:

gndr_Пол -- категориальная

Возраст_в_категор -- интервальная

ГОРОД_СЕЛО2 -- категориальная

eisced_Образование - категориальная

maritalb_Семейное_П_перекодированное - категориальная

Голос_ЕДРОС - категориальная

 

RECODE netuse (7=1) (1 thru 6=0) (ELSE=SYSMIS) INTO Интернет.

VARIABLE LABELS Интернет 'Используют Интернет каждый день, или нет'.

EXECUTE.

LOGISTIC REGRESSION VARIABLES Интернет

/METHOD=FSTEP(LR) gndr_Пол Возраст_в_категор ГОРОД_СЕЛО2 eisced_Образование maritalb_Семейное_П_перекодированное Голос_ЕДРОС

/CONTRAST (gndr_Пол)=Indicator(1)

/CONTRAST (ГОРОД_СЕЛО2)=Indicator

/CONTRAST (eisced_Образование)=Indicator(1)

/CONTRAST (maritalb_Семейное_П_перекодированное)=Indicator

/CONTRAST (Голос_ЕДРОС)=Indicator(1)

/PRINT=GOODFIT

/CRITERIA=PIN(0.05) POUT(0.10) ITERATE(20) CUT(0.57).

В диалоге бинарной логистической регрессии нужно нажать на кнопку “Categorical” и указать, какие переменные – категориальные, и, если нужно, указать, какая категория – первая или последняя, будет опорной.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.