Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Анализ данных повторных и сравнительных исследований






 

Обработка данных включает в себя кодирование информации, создание переменных, статистический анализ полученных данных.

После проведения полевого исследования наступает его заключительный этап, включающий обработку, обобщение и анализ информации.

Обработка первичной социологической информации представляет собой приведение эмпирических данных к такому числовому виду, который делает возможной с их помощью проверку гипотез исследования.

Обработка первичной социологической информации начинается с процедур редактирования и кодирования. Она включает в себя проверку методического инструментария на точность, полноту и качество заполнения, корректировку ошибок, выбраковку некачественно заполненных анкет. Затем информация кодируется, т.е. переводится на язык формализованной обработки и анализа (каждому варианту ответов присваивается некое условное число — код), после чего следует машинная обработка данных и, наконец, статистический и другие виды анализа информации.

Остановимся более детально на редактировании полученных данных.

Если речь идет об обработке данных, полученных с помощью количественных методов (анкетирования, формализованного интервью), то она начинается с предварительной проверки полученных материалов (анкет) на точность, полноту и качество заполнения. Редактирование, корректировка материалов осуществляется как сопутствующая этим видам проверки процедура.

Проверка на точность предполагает, что в заполненных анкетах нет противоречий формального характера. Так, если на вопрос: «Занимаетесь ли вы спортом?» - был получен ответ «Нет», а в вопросе: «Если да, то какими видами спорта вы занимаетесь?» — указаны варианты ответов, то ясно, что респондент либо где-то ошибся, либо намеренно вводит нас в заблуждение. Анализ ответов на другие вопросы анкеты позволит скорректировать выявленные ошибки респондента.

Важным для получения высококачественной информации является проверка анкет на полноту заполнения. Особые требования предъявляются к социально-демографическому блоку («паспортичке»), здесь пропуск двух-трех вопросов приводит к выбраковке анкет. Также бракуются анкеты, в которых пропущено свыше 20% вопросов содержательного блока. В некоторых ситуациях исследователь восстанавливает пропущенные вопросы. В данном случае он может действовать, исходя из общей логики ответов респондента на вопросы анкеты или воспроизводя в памяти саму процедуру опроса (если он выступал в роли анкетера). Необходимо учитывать, что процедура коррекции пропусков не дает полной гарантии надежности полученных данных.

При проверке анкет нужно оценивать также и качество их заполнения, особенно разборчивость, понятность ответов на полузакрытые и открытые вопросы. Это важное условие их кодирования. Предварительная проверка материалов на точность, полноту и качество заполнения приводит к выбраковке части анкет. Возможность потери анкет при выбраковке, а также при самой процедуре опроса исследователю следует учитывать при тиражировании инструментария. Тираж анкет должен несколько превышать их количество, необходимое для выборки.

Другая важная процедура обработки информации - кодирование: присвоение каждому индикатору определенного числа (кода). Если речь идет об анкетировании, то процедура кодирования осуществляется еще на стадии разработки инструмента, когда формулируются вопросы анкеты и каждому варианту ответа присваивается определенный номер (код).

Необходимо отметить, что существует две общепринятые системы кодирования: порядковая (сплошная нумерация всех вариантов ответов в анкете) и позиционная (автономная нумерация позиций каждого вопроса). И та и другая имеют как свои преимущества, так и недостатки (см. таблицу 6).

Таблица 6

Системы кодирования

 

Порядковая система кодирования Позиционная система кодирования
Как вы считаете, кому легче поступить в вуз - юношам или девушкам? 1. Юношам. 2. Девушкам. 3. Пол не имеет значения. 1. Как вы считаете, кому легче поступить в вуз - юношам или девушкам? 1. Юношам. 2. Девушкам. 3. Пол не имеет значения.
Как вы относитесь к утверждению, что показатели успеваемости у девушек выше, чем у юношей? 4. Положительно. 5. Отрицательно. 6. Затрудняюсь ответить. 2. Как вы относитесь к утверждению, что показатели успеваемости у девушек выше, чем у юношей? 1. Положительно. 2. Отрицательно. 3. Затрудняюсь ответить.

Приведенные примеры кодирования выполнены в линейной форме, однако иногда целесообразно использовать табличные вопросы, которые представляют собой сведенные воедино и компактно оформленные в таблице несколько однотипных вопросов. Например, три вопроса, касающиеся оценки клиентами социальной службы качества приема, стиля общения, отношения с социальным работником, могут быть совмещены в одной таблице, поскольку построены единообразно. Каждый показатель здесь измерен с помощью порядковой пятичленной шкалы, фиксирующей степень удовлетворенности респондента (см. таблицу 7).

Таблица 7

Насколько вы удовлетворены следующими характеристиками приема в данном учреждении? (Выберите по одному ответу в каждой строке)

 

Характеристики образовательного процесса Полностью удовлетворен Скорее удовлетворен Скорее не удовлетворен Полностью не удовлетворен Затрудняюсь ответить
Качество приема          
Стиль общения          
Отношения со специалистом          

 

В данной таблице коды размещаются горизонтально, это указывается в комментарии к формулировке вопроса, данном в скобках. Возможно построение табличных вопросов, имеющих вертикальное расположение кодов.

Особую сложность при обработке данных представляют полузакрытые и открытые вопросы. Они требуют создания кодификатора. Процедуру кодирования этого типа вопросов можно разбить на несколько этапов; сначала на отдельный лист бумаги выписываются все суждения респондентов по какому-либо вопросу; затем эти суждения следует классифицировать, разбив их на несколько групп и присвоив каждой группе определенный код (т.е. разработать кодификатор); наконец, с помощью разработанного кодификатора каждая анкета кодируется для последующей машинной обработки.

Например, школьников просят: «Назовите ваши любимые предметы». В специально оставленной строке они перечисляют: математика, русский язык, химия, история, физика и т.д. Предположим, что для целей исследования достаточно знать, какому блоку дисциплин (гуманитарным, естественно­научным, точным) отдают предпочтения респонденты. Поэтому весь перечень дисциплин разбивают на три группы, присваивая группе «гуманитарные дисциплины» код «1», группе «естественно-научные дисциплины» код «2», группе «точные дисциплины» код «3». Затем в заполненных анкетах, где на данный открытый вопрос перечислены в ответах любимые предметы школьников, необходимо проставить соответствующие им коды. После этого анкета считается готовой к машинной обработке.

Кодирование полузакрытых вопросов осуществляется точно таким же образом. Полученные ответы мы классифицируем, разбив на смысловые группы. Теперь для создания кодификатора мы присваиваем каждой классификационной группе код, которые являются продолжением нумерации вариантов ответов в разработанном нами вопросе о причинах поступления в вуз. Теперь только остается во всех заполненных респондентами анкетах закодировать данный полузакрытый вопрос, и анкета готова к машинной обработке.

Иная ситуация с открытыми вопросами. Различают два вида открытых и полуоткрытых вопросов: перечневые и текстовые. Перечневые открытые вопросы содержат многократно повторяющуюся и легко поддающуюся группировке информацию. Такая информация вводится в компьютер, при помощи которого и осуществляется ее группировка.

Завершая разговор о кодировании, необходимо отметить, что существуют определенные требования к составлению кодификатора. Во-первых, в кодификаторе учитывают только те суждения респондентов, которые соответствуют целям и задачам исследования. Замечания не по теме (например, «анкетер выглядит божественно», «опросы до смерти надоели») в кодификатор не вносятся, но учитываются при анализе, поскольку характеризуют отношение респондентов к процедуре опроса.

Во-вторых, при составлении кодификатора необходимо четко разграничивать группы по смыслу. Любое суждение должно быть однозначно отнесено только к одной группе. Если возникают сомнения, к какой классификационной группе относится то или иное высказывание респондента, можно быть уверенным, что кодификатор сделан не вполне удачно.

Если инструментарий составлен профессионально и методически апробирован, то при кодировании полузакрытых вопросов количество дополнительных вариантов ответов не должно быть слишком большим (превышать 3-4 пункта). В противном случае каждому пункту будут соответствовать 1-2 суждения, что при достаточно большом объеме выборки не является статистически значимым, а, следовательно, не влияет на результаты исследования.

Часто приходится обрабатывать большие массивы анкет: 1000, 2000 и более. В этом случае создание кодификатора становится очень трудоемкой задачей. Чтобы упростить процесс классификации суждений, отбирают 100-200 анкет и создают кодификатор на основе данной выборки.

Кодирование информации позволяет перейти к ее обработке (ручной или машинной). Вопрос о способе обработки данных зависит от количества анкет. Если их больше 100, то целесообразна машинная обработка, в противном случае можно обойтись ручной.

 

3. Статистическая обработка данных. Обобщение результатов: группировка, ранжирование и др.

 

Для машинной обработки данных используют компьютерные программы статистической обработки SPSS, SAS, а также Exel for, Windows Word for Windows и др. У данных программ огромные статистические возможности, поэтому существует опасность некорректного и избыточного использования статистики. Получить цифры расчетов нетрудно, а вот корректность вычислений и умелость их интерпретирования – важные вопросы, которыми иногда пренебрегают.

В результате машинной обработки первичной социологической информации получают данные, которые используются для дальнейших статистического и логического анализов. При обработке эмпирические данные подвергаются обобщению. Одним из простых способов обобщения является статистическая группировка.

Группировки бывают простые и сложные. Простые - это группировки по одному признаку, сложные - по двум и более.

Простые группировки образуются в результате подсчета ответов респондентов на вопросы анкеты. Их основная функция - показать структуру совокупности. Например, распределение респондентов по полу: из 200 опрошенных 160 человек - мужчины, 40 - женщины. Данная группировка показывает количественное соотношение мужчин и женщин в группе.

Сложные группировки строятся по двум и более признакам. Их функции заключаются не только в выявлении структуры совокупности (например, половозрастной), но и в установлении взаимосвязи между признаками. Так, можно сгруппировать данные, чтобы выявить: отношение к смене профессии в зависимости от пола, уровень заработной платы рабочих в зависимости от квалификационного разряда.

В результате группировки первичной социологической информации получают ряды распределения. Ряды распределения - это ряды, чисел, характеризующие распределение единиц совокупности по какому-либо признаку.

Ряды распределения могут быть следующих видов:

· Атрибутивные (по качественному признаку).

· Вариационные (по количественному признаку).

· Дискретные.

· Интервальные.

Атрибутивный ряд образуется по качественному признаку, например распределение респондентов по полу, профессии, социальному статусу, основным жизненным ценностям, мотивам профессиональной деятельности.

Вариационный ряд - это ряд, сформированный по количественному признаку, т.е. признаку, выраженному в числовом значении, например распределение по количеству рабочих дней, пропущенных по болезни, а также по возрасту, стажу (в годах), уровню дохода (в рублях), квалификационному разряду (в номерах квалификационных разрядов).

В зависимости от типа признака способы обработки данных различаются. Есть существенные различия в подсчете средних величин, показателей вариации и т.д.

Вариационные ряды, в свою очередь, делятся на дискретные и интервальные. В дискретном ряду каждый признак характеризуется количественными показателями. В интервальном ряду значения признака колеблются в определенных пределах (интервалах). Таково, например, распределение респондентов по стажевым группам: до года - 5 человек; от года до 5 лет - 15 человек; от 5 до 10 лет - 30 человек; от 10 лет и более - 20 человек.

Дискретные и вариационные ряды также предполагают различия в способах обработки данных.

Для того чтобы полученную числовую информацию можно было представить обобщенно, компактно, а также выявить типичные характеристики совокупности, рассчитывают средние величины. Средние величины - это обобщающие показатели. Их можно рассчитывать по количественным и по качественным признакам. В первом случае - это средний возраст сотрудников фирмы, средний стаж работы, средняя заработная плата и т.д. Во втором - типичный для большинства группы мотив получения образования, смены профессии или уровень удовлетворенности учебой, работой, формой проведения свободного времени.

Важнейшим условием применения средних величин является их расчет на качественно однородной совокупности. Это требование - «мухи отдельно, котлеты отдельно» - предполагает, например, что, намереваясь выявить покупательную способность типичного работника предприятия, мы не будем усреднять заработную плату администрации и низовых работников, размеры которой сильно различаются.

В статистическом анализе применяют различные виды средних величин. Так, часто используют арифметическую простую и арифметическую взвешенную. Средняя арифметическая взвешенная применяется, если имеется некоторая повторяемость значений единиц совокупности.

Для определения средних значений качественных признаков, выраженных в порядковых шкалах, строятся индексы. Например, индекс удовлетворенности безработных службой занятости можно рассчитать по пятичленной шкале, предполагающей следующие варианты ответов.

Для трехчленной шкалы данную формулу нужно упростить, т.е. от суммы положительных ответов отнять сумму отрицательных и полученный результат разделить на количество опрошенных (величину выборки).

Индексы функционально значимы для исследования, поскольку способны «сворачивать» информацию, представлять ее в компактном, сжатом виде, служить базой для процедуры сравнения.

Если средняя величина дает обобщающую характеристику совокупности, представляет типичный уровень варьирующегося признака, то с помощью показателей вариации можно количественно измерить колеблемость признака в совокупности. Показатели вариации позволяют оценить совокупность с точки зрения ее однородности. Степень однородности совокупности - ее важная характеристика.

Для неоднородной совокупности среднее значение не является типичной характеристикой. Так, мы изучаем уровень доходов в группе респондентов. Средний доход на члена семьи - это обобщающий показатель для изучаемой совокупности респондентов. Однако он может складываться из доходов одних респондентов, находящихся за чертой бедности, и других, относящихся к обеспеченным слоям населения. Поэтому нельзя только на базе полученных средних значений делать выводы и давать рекомендации, касающиеся всей совокупности респондентов. Для дальнейших логического и статистического анализов необходимо рассчитать вариацию признака «доход на одного члена семьи».

Чем больше показатель вариации, тем менее однородна совокупность, с которой исследователь имеет дело, тем менее типично среднее значение.

К относительным показателям вариации относится коэффициент вариации, он измеряется в процентах, также характеризуя степень однородности изучаемой совокупности. Если коэффициент превышает 33, 3%, то исследуемая совокупность считается неоднородной.

Следовательно, выводы и рекомендации, общие для всех групп респондентов, возможны далеко не всегда. Для проведения конкретно-социологического исследования, скорее всего, необходима предварительная дифференциация совокупности на группы по слоевой принадлежности респондентов и анализ специфики каждой группы в отдельности.

Для наглядности и удобства анализа ряды распределения обычно оформляют в виде таблиц. Таблица - это форма представления данных об объекте социологического исследования на основе группировки одного, двух и более признаков. В структуре таблицы различают подлежащее и сказуемое. Подлежащее - это сам объект (перечень его единиц или групп), который характеризуется числовыми показателями. Оно располагается в строках таблицы, как правило, слева. Сказуемое представляет собой числовые показатели, характеризующие объект и располагающиеся в столбцах таблицы.

Одномерные таблицы строятся на основе группировки данных по одному признаку.

Один из способов анализа таблицы - расчет процентов к общему числу ответивших на этот вопрос респондентов.

Одномерная таблица в первую очередь позволяет проанализировать структуру совокупности. Двумерные таблицы расширяют аналитические возможности исследователя. В качестве синонимов двумерных таблиц употребляются такие названия, как таблица сопряженностей, корреляционная таблица, таблица двумерного распределения, комбинационная статистическая таблица.

Двумерные таблицы строятся на основе группировки данных по двум признакам. Так, на вопрос: «Собираетесь ли вы после окончания вуза работать по специальности?» - юноши и девушки ответили следующим образом (см. таблицу 8):

Таблица 8

Студенты о намерениях работать по специальности после окончания вуза, чел.

 

Собираетесь ли вы после окончания вуза работать по специальности? Мужчины Женщины
Да    
Нет    
Затрудняюсь ответить    
Итого    

 

Из таблицы видно, что опрошенные 250 респондентов (150 юношей и 100 девушек) имеют разные намерения относительно работы по специальности. Расчет процентов по каждой группе даст возможность сравнить их между собой. Этот способ можно назвать расчетом по «вертикальному» признаку (т. е. по столбцам). Возможен и расчет по «горизонтальному» признаку (см. таблицу 9).

Таблица 9

Студенты разных курсов о совмещении учебы с работой, %

 

Курс обучения Совмещаете ли вы учебу с работой? Итого
  Да Нет  
Первый      
Второй      
Третий      
Четвертый      
Пятый      

 

Здесь проценты вычисляются по строке, т. е. по каждому курсу обучения. Это позволяет сравнить между собой студентов разных курсов, увидеть динамику вторичной занятости студентов в зависимости от года обучения.

При анализе информации возможен расчет процентов как по «вертикальному» признаку, так и по «горизонтальному», а также к общему числу опрощенных. Выбор способа представления данных в виде процентного распределения зависит от целей и задач исследования и определяется общей логикой анализа полученной информации.

Построение двумерных таблиц служит основой для выявления взаимосвязи между признаками. Когда мы имеем дело с социальным объектом, то речь, как правило, идет о корреляционной зависимости. Этот тип связи имеет свою специфику.

Корреляционная зависимость обладает вероятностным характером, она не является абсолютно полной и точной. Для корреляционной зависимости характерно соответствие значению одной величины комплекса значений другой. Например, с изменением уровня образования человека меняется и размер его дохода, здесь определенному уровню образования соответствует целый разброс значений признака «доход». Корреляционная зависимость не предполагает жесткой связи между признаками, поскольку в ней отражается множественность причин и следствий. Так, на размер дохода работника влияет не только его образование, но и статус, сфера и мотивы трудовой деятельности, состояние здоровья, способности, семейные и прочие обстоятельства.

Корреляционная зависимость показывает, что если две величины изменяются совместно, то по значению одной из них можно предсказать тенденцию изменения значений другой. В данном случае нельзя говорить, что один признак является причиной другого, а другой, в свою очередь, его следствием.

Так, возраст - это не причина профессионального роста, оба признака изменяются совместно, «параллельно» друг другу. Корреляционная связь не является, собственно, причинно-следственной, но она подразумевает ее наличие и становится первоначальным этапом исследования причинных связей.

В ходе конкретно-социологических исследований социологи часто сталкиваются с ложными корреляциями, когда совместное изменение двух признаков вызвано не их взаимосвязью, а случайным совпадением. Например, эмпирически выявленная зависимость между должностным ростом и уменьшением количества больничных дней работника вовсе не означает благотворного влияния статусного продвижения на здоровье человека.

Корреляционный анализ предполагает изучение парной (между двумя признаками) и множественной (между несколькими признаками) корреляции. Для определения силы связи между признаками рассчитывают различные коэффициенты корреляции. Корреляционный анализ предполагает решение целого ряда задач, в том числе выявление воздействия различных факторов на изучаемое социальное явление.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.