Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






  • Regression






    Custom Tables

     

     

     
       
       
         
       
       
       
       
       
       
         
       

     

     

    [DataSet1] D: \SLISS\--- 2012-2013\- 2013 Анализ данных\RU_ESS5e03.sav

    В этой таблице показано, как закодированы переменные

     

      Column N %
    Пол респондентов Мужчины 41, 0
    Женщины 59, 0
    Возраст респондентов в категориях 14 - 24 года 13, 8
    25 - 34 года 18, 1
    35 - 44 года 15, 9
    45 - 54 года 16, 5
    55 - 64 года 16, 6
    65 - 74 года 11, 5
    75 лет и старше 7, 6
    2 Место жительства (город - сельская местность) -- описание респондента (без ферм) Большой город 37, 4
    Пригород или окраина большого города 5, 2
    Небольшой город 34, 9
    Поселок или деревня 22, 5
    Ферма или отдельностоящий дом в сельской местности , 0
    Официальное семейное положение -- перекодированное Состоят в официальном браке 44, 1
    Зарегистрированный гражданский брак , 0
    Официально расстались , 0
    Официально разведены 14, 4
    Вдовы и вдовцы 17, 1
    Никогда не состояли в зарегистрованном браке 24, 4
    Состоят в официальном браке Не состоят в официальном браке 56, 2
    Состоят в официальном браке 43, 8
    Разведены официально или расстались Не в разводе 85, 7
    В разводе или расстались 14, 3
    ОБРАЗОВАНИЕ, ES - ISCED Not possible to harmonise into ES-ISCED , 0
    ES-ISCED I, начальное 4, 5
    ES-ISCED II, неполное среднее 9, 6
    ES-ISCED IIIb, среднее , 0
    ES-ISCED IIIa, среднее -- продвинутое (гимназия и т.п.) 34, 1
    ES-ISCED IV, среднее специальное (техникум и т.п.) 24, 9
    ES-ISCED V2, высшее -- специалисты, баки, магистры и выше 27, 0
    Other , 0
    Голосовали на последних выборах за Единую Россию? Не голосовали за Единую Россию 36, 4
    Голосовали за Единую Россию 63, 6
    Используют Интернет/e-mail/www в личных целях Нет доступа дома или на работе 49, 8
    Никогда не пользуются в личных целях 4, 5
    Реже, чем раз в месяц 1, 3
    Раз в месяц , 7
    Несколько раз в месяц 4, 6
    Раз в неделю 2, 7
    Несколько раз в неделю 9, 8
    Каждый день 26, 6

     

     

    REGRESSION

    /MISSING LISTWISE

    /STATISTICS COEFF OUTS R ANOVA

    /CRITERIA=PIN(.05) POUT(.10)

    /NOORIGIN

    /DEPENDENT netuse

    /METHOD=STEPWISE gndr_Пол Возраст_в_категор ГОРОД_СЕЛО2 Брак Развод eisced_Образование Голос_ЕДРОС.

     

    Считается линейная пошаговая регрессия (STEPWISE)

    Переменная «место жительства» трактуется как интервальная: чем выше значение, тем менее городское место жительства (1 – большой город, 4 – сельская местность).

    Regression

     

    [DataSet1] D: \SLISS\--- 2012-2013\- 2013 Анализ данных\RU_ESS5e03.sav

     

     

    Variables Entered/Removeda
    Model Variables Entered Variables Removed Method
      Возраст респондентов в категориях . Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
      2 Место жительства (город - сельская местность) -- описание респондента (без ферм) . Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
      ОБРАЗОВАНИЕ, ES - ISCED . Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
      Пол респондентов . Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
    a. Dependent Variable: Используют Интернет/e-mail/www в личных целях

    Четыре шага – на последнем – в модели 4 переменных.

     

    Model Summary
    Model R R Square Adjusted R Square Std. Error of the Estimate
      , 572a , 327 , 326 2, 473
      , 603b , 363 , 363 2, 405
      , 619c , 383 , 381 2, 369
      , 625d , 390 , 389 2, 355
    a. Predictors: (Constant), Возраст респондентов в категориях
    b. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
    c. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
    d. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов

    Подавляющую долю дисперсии, судя по R-квадрат, объяснил возраст (33%), вторая по значимости переменная – место жительства добавочно объяснила объяснила лишь 36, 3 – 32, 6 = 3, 7% дисперсии…

     

    ANOVAa
    Model Sum of Squares df Mean Square F Sig.
      Regression 4714, 283   4714, 283 770, 860 , 000b
    Residual 9717, 715   6, 116    
    Total 14431, 997        
      Regression 5243, 871   2621, 935 453, 154 , 000c
    Residual 9188, 127   5, 786    
    Total 14431, 997        
      Regression 5522, 062   1840, 687 327, 855 , 000d
    Residual 8909, 936   5, 614    
    Total 14431, 997        
      Regression 5634, 794   1408, 699 253, 967 , 000e
    Residual 8797, 203   5, 547    
    Total 14431, 997        
    a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
    b. Predictors: (Constant), Возраст респондентов в категориях
    c. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
    d. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
    e. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов

    !!! Внимание!!! во вкладке Statistics была поставлена «галочка» для collinearity diagnostics (диагностика коллинеарности).

    В пошаговой регрессии по определению каждая модель лучше предыдущей, если рассматривать ANOVA.

    Поскольку использовалась пошаговая регрессия, все коэффициенты, включенные в модели – значимы.

    Судя по VIF, которые близки к единице, больших проблем с мультиколлинеарностью быть не должно.

    Все же стоит посмотреть не растут ли коэффициенты и не меняются ли знаки. В четвертой модели по сравнению с третьей немного увеличился коэффициент для образования, но это не страшно.

     

     

    Coefficientsa
    Model Unstandardized Coefficients Standardized Coefficients t Sig. Collinearity Statistics
    B Std. Error Beta Tolerance VIF
      (Constant) 6, 593 , 165   39, 978 , 000    
    Возраст респондентов в категориях -1, 017 , 037 -, 572 -27, 764 , 000 1, 000 1, 000
      (Constant) 7, 709 , 198   38, 867 , 000    
    Возраст респондентов в категориях -, 990 , 036 -, 556 -27, 699 , 000 , 994 1, 006
    2 Место жительства (город - сельская местность) -- описание респондента (без ферм) -, 485 , 051 -, 192 -9, 567 , 000 , 994 1, 006
      (Constant) 5, 608 , 357   15, 724 , 000    
    Возраст респондентов в категориях -, 888 , 038 -, 499 -23, 336 , 000 , 850 1, 176
    2 Место жительства (город - сельская местность) -- описание респондента (без ферм) -, 425 , 051 -, 168 -8, 393 , 000 , 966 1, 035
    ОБРАЗОВАНИЕ, ES - ISCED , 334 , 048 , 153 7, 039 , 000 , 826 1, 210
      (Constant) 6, 367 , 392   16, 224 , 000    
    Возраст респондентов в категориях -, 865 , 038 -, 486 -22, 647 , 000 , 835 1, 198
    2 Место жительства (город - сельская местность) -- описание респондента (без ферм) -, 424 , 050 -, 168 -8, 428 , 000 , 966 1, 035
    ОБРАЗОВАНИЕ, ES - ISCED , 345 , 047 , 158 7, 301 , 000 , 824 1, 213
    Пол респондентов -, 557 , 123 -, 089 -4, 508 , 000 , 981 1, 019
    a. Dependent Variable: Используют Интернет/e-mail/www в личных целях

     

    Уравнение регрессии (для него всегда используются нестандартизованные коэффициенты B, округляем до десятых):

    Интернет = 6, 4 – 0, 9*Возраст – 0, 4*Место жительства + 0, 3*образование – 0, 6*пол использованные в уравнении коэффициенты

    Как уже было сказано, судя по стандартизованному коэффициенту бетта сильнее всего влияет на пользование Интернетом возраст.

    Интерпретация коэффициентов (нужно учитывать знак и кодировку).

    Для пользования Интернетом 0 «минимальное использование» … 7 «максимальное»

    Для возраста коэффициент отрицательный, это значит, что старшие возрастные группы реже пользуются интернетом, чем молодые.

    Для места жительства – он тоже отрицательный. Учитывая кодировку – жители малых городов и сельских поселений меньше пользуются интернетом в сравнении с жителями больших городов.

    Для образования – положительный. Чем выше образовательный уровень, тем больше пользуются Интернетом.

    Пол – отрицательный коэффициент показывает, что женщины меньше пользуются Интернетом, чем мужчины.

     

    !!! Внимание!!! нельзя ориентироваться только на знак регрессионного коэффициента. Нужно учесть, как закодированы независимые и зависимые переменные.

     

    Excluded Variablesa
    Model Beta In t Sig. Partial Correlation Collinearity Statistics
    Tolerance
      Пол респондентов -, 081b -3, 916 , 000 -, 098 , 984
    2 Место жительства (город - сельская местность) -- описание респондента (без ферм) -, 192b -9, 567 , 000 -, 233 , 994
    Состоят в официальном браке , 066b 3, 188 , 001 , 080 , 994
    Разведены официально или расстались -, 027b -1, 326 , 185 -, 033 , 998
    ОБРАЗОВАНИЕ, ES - ISCED , 183b 8, 388 , 000 , 206 , 850
    Голосовали на последних выборах за Единую Россию? -, 025b -1, 213 , 225 -, 030 , 984
      Пол респондентов -, 082c -4, 077 , 000 -, 102 , 984
    Состоят в официальном браке , 069c 3, 447 , 001 , 086 , 994
    Разведены официально или расстались -, 031c -1, 555 , 120 -, 039 , 998
    ОБРАЗОВАНИЕ, ES - ISCED , 153c 7, 039 , 000 , 174 , 826
    Голосовали на последних выборах за Единую Россию? -, 010c -, 505 , 613 -, 013 , 978
      Пол респондентов -, 089d -4, 508 , 000 -, 112 , 981
    Состоят в официальном браке , 054d 2, 723 , 007 , 068 , 982
    Разведены официально или расстались -, 041d -2, 075 , 038 -, 052 , 993
    Голосовали на последних выборах за Единую Россию? -, 003d -, 159 , 874 -, 004 , 976
      Состоят в официальном браке , 036e 1, 761 , 078 , 044 , 931
    Разведены официально или расстались -, 033e -1, 652 , 099 -, 041 , 983
    Голосовали на последних выборах за Единую Россию? , 008e , 418 , 676 , 010 , 960
    a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
    b. Predictors in the Model: (Constant), Возраст респондентов в категориях
    c. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
    d. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
    e. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов

    Интернет перекодируется в бинарную переменную: 1 – пользуются Интернетом каждый день, 0 – пользуются реже или вообще не пользуются.

    Рассчитывается логистическая регрессия. Зависимая переменная – описанная выше бинарная.

    Независимые:

    gndr_Пол -- категориальная

    Возраст_в_категор -- интервальная

    ГОРОД_СЕЛО2 -- категориальная

    eisced_Образование - категориальная

    maritalb_Семейное_П_перекодированное - категориальная

    Голос_ЕДРОС - категориальная

     

    RECODE netuse (7=1) (1 thru 6=0) (ELSE=SYSMIS) INTO Интернет.

    VARIABLE LABELS Интернет 'Используют Интернет каждый день, или нет'.

    EXECUTE.

    LOGISTIC REGRESSION VARIABLES Интернет

    /METHOD=FSTEP(LR) gndr_Пол Возраст_в_категор ГОРОД_СЕЛО2 eisced_Образование maritalb_Семейное_П_перекодированное Голос_ЕДРОС

    /CONTRAST (gndr_Пол)=Indicator(1)

    /CONTRAST (ГОРОД_СЕЛО2)=Indicator

    /CONTRAST (eisced_Образование)=Indicator(1)

    /CONTRAST (maritalb_Семейное_П_перекодированное)=Indicator

    /CONTRAST (Голос_ЕДРОС)=Indicator(1)

    /PRINT=GOODFIT

    /CRITERIA=PIN(0.05) POUT(0.10) ITERATE(20) CUT(0.57).

    В диалоге бинарной логистической регрессии нужно нажать на кнопку “Categorical” и указать, какие переменные – категориальные, и, если нужно, указать, какая категория – первая или последняя, будет опорной.

     






    © 2023 :: MyLektsii.ru :: Мои Лекции
    Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
    Копирование текстов разрешено только с указанием индексируемой ссылки на источник.