Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Статистические гипотезы






Лекция № 6

Тема: Основные понятия, используемые в математической обработке психологических данных

План

1. Признаки и переменные.

2. Шкалы измерения.

3. Распределение признака. Параметры распределения

4. Статистические гипотезы

5. Статистические критерии

6. Уровни статистической значимости

7. Правило отклонения H0 и принятия Н1

8. Мощность критериев

9.Классификация задач и методов их решения

10. Принятие решения о выборе метода математической обработки.

 

Литература

1. Загвязинский, В.И. Методология и методы психолого-педагогического исследования: учеб. пособие для студентов пед. вузов по спец.031000 – Педагогика и психология / В.И. Загвязинский – М.: Академия, 2001. – 202 с.

2. Сидоренко Е.В. Методы математической обработки в психологии / Е. В. Сидоренко – СПб.: Речь, 2010. – 11 – 34.

Признаки и переменные

Признаки и переменные – это измеряемые психологические явления. Такими явлениями могут быть время решения задачи, количество допущенных ошибок, уровень тревожности, интенсивность агрессивных реакций, уровень развития самостоятельности и множество других переменных.

Понятия признака и переменной могут использоваться как взаимозаменяемые. Они являются наиболее общими. Иногда вместо них используются понятия показателя или уровня, например, уровень настойчивости, показатель вербального интеллекта и др. Понятия показателя и уровня указывают на то, что признак может быть измерен количественно, так как к ним применимы определения " высокий" или " низкий", например, высокий уровень интеллекта, низкие показатели тревожности и др.

Психологические переменные являются случайными величинами, поскольку заранее неизвестно, какое именно значение они примут.

Математическая обработка – это оперирование со значениями признака, полученными у испытуемых в психологическом исследовании. Такие индивидуальные результаты называют также " наблюдениями", " наблюдаемыми значениями", " вариантами", " датами", " индивидуальными показателями" и др. В психологии чаще всего используются термины " наблюдение" или " наблюдаемое значение".

Значения признака определяются при помощи специальных шкал измерения.

Шкалы измерения

Измерение – это приписывание числовых форм объектам или событиям в соответствии с определенными правилами (Стивенс С., 1960, с. 60). С. Стивенсом предложена классификация из 4 типов шкал измерения:

1) номинативная, или номинальная, или шкала наименований;

2) порядковая, или ординальная, шкала;

3) интервальная, или шкала равных интервалов;

4) шкала равных отношений.

Номинативная шкала - это шкала, классифицирующая по названию: name (лат.) – имя, название. Название же не измеряется количественно, оно лишь позволяет отличить один объект от другого или одного субъекта от другого. Номинативная шкала – это способ классификации объектов или субъектов, распределения их по ячейкам классификации.

Простейший случай номинативной шкалы – дихотомическая шкала, состоящая всего лишь из двух ячеек, например: " имеет братьев и сестер - единственный ребенок в семье"; " иностранец - соотечественник"; «проголосовал " за" - проголосовал " против"» и т.п.

Признак, который измеряется по дихотомической шкале наименований, называется альтернативным. Он может принимать всего два значения. При этом исследователь зачастую заинтересован в одном из них, и тогда он говорит, что признак " проявился", если тот принял интересующее его значение, и что признак " не проявился", если он принял противоположное значение.

Расклассифицировав все объекты, реакции или всех испытуемых по ячейкам классификации, мы получаем возможность от наименований перейти к числам, подсчитав количество наблюдений в каждой из ячеек.

Как уже указывалось, наблюдение – это одна зарегистрированная реакция, один совершенный выбор, одно осуществленное действие или результат одного испытуемого.

Допустим, мы определим, что кандидатуру А выбрали 7 испытуемых, кандидатуру Б – 11, кандидатуру В – 28, а кандидатуру Г – всего 1. Теперь мы можем оперировать этими числами, представляющими собой частоты встречаемости разных наименований, то есть частоты принятия признаком " выбор" каждого из 4 возможных значений. Далее мы можем сопоставить полученное распределение частот с равномерным или каким-то иным распределением.

Таким образом, номинативная шкала позволяет нам подсчитывать частоты встречаемости разных " наименований", или значений признака, и затем работать с этими частотами с помощью математических методов.

Единица измерения, которой мы при этом оперируем - количество наблюдений (испытуемых, реакций, выборов и т. п.), или частота. Точнее, единица измерения - это одно наблюдение. Такие данные могут быть обработаны с помощью метода , биномиального критерия m и углового преобразования Фишера .

Порядковая шкала - это шкала, классифицирующая по принципу " больше - меньше". Если в шкале наименований было безразлично, в каком порядке мы расположим классификационные ячейки, то в порядковой шкале они образуют последовательность от ячейки " самое малое значение" к ячейке " самое большое значение" (или наоборот). Ячейки теперь уместнее называть классами, поскольку по отношению к классам употребимы определения " низкий", " средний" и " высокий" класс, или 1-й, 2-й, 3-й класс, и т.д.

В порядковой шкале должно быть не менее трех классов, например " положительная реакция - нейтральная реакция - отрицательная реакция" или " подходит для занятия вакантной должности - подходит с оговорками - не подходит" и т. п.

В порядковой шкале мы не знаем истинного расстояния между классами, а знаем лишь, что они образуют последовательность. Например, классы " подходит для занятия вакантной должности" и " подходит с оговорками" могут быть реально ближе друг к другу, чем класс " подходит с оговорками" к классу " не подходит".

От классов легко перейти к числам, если мы условимся считать, что низший класс получает ранг 1, средний класс – ранг 2, а высший класс - ранг 3, или наоборот. Чем больше классов в шкале, тем больше у нас возможностей для математической обработки полученных данных и проверки статистических гипотез.

Например, мы можем оценить различия между двумя выборками испытуемых по преобладанию у них более высоких или более низких рангов или подсчитать коэффициент ранговой корреляции между двумя переменными, измеренными в порядковой шкале, допустим, между оценками профессиональной компетентности руководителя, данными ему разными экспертами.

Итак, единица измерения в шкале порядка – расстояние в 1 класс или в 1 ранг, при этом расстояние между классами и рангами может быть разным (оно нам неизвестно).

Интервальная шкала – это шкала, классифицирующая по принципу " больше на определенное количество единиц - меньше на определенное количество единиц". Каждое из возможных значений признака отстоит от другого на равном расстоянии.

Можно предположить, что если мы измеряем время решения задачи в секундах, то это уже явно шкала интервалов. Однако на самом деле это не так, поскольку психологически различие в 20 секунд между испытуемым А и Б может быть отнюдь не равно различию в 20 секунд между испытуемыми Б и Г, если испытуемый А решил задачу за 2 секунды, Б - за 22, В - за 222, а Г - за 242.

Мы можем с определенной долей уверенности утверждать лишь, что испытуемый А решил задачу быстрее Б, Б быстрее В, а В быстрее Г.

Принцип построения большинства интервальных шкал построен на известном правиле " трех сигм": примерно 97, 7-97, 8% всех значений признака при нормальном его распределении укладываются в диапазоне . Можно построить шкалу в единицах долей стандартного отклонения, которая будет охватывать весь возможный диапазон изменения признака, если крайний слева и крайний справа интервалы оставить открытыми.

Р.Б. Кеттелл предложил, например, шкалу стенов – " стандартной десятки". Среднее арифметическое значение в " сырых" баллах принимается за точку отсчета. Вправо и влево отмеряются интервалы, равные 1/2 стандартного отклонения. На Рис. 1.2 представлена схема вычисления стандартных оценок и перевода " сырых" баллов в стены по шкале N 16-факторного личностного опросника Р. Б. Кеттелла.

Рис. 1.1. Схема вычисления стандартных оценок (стенов) по фактору N 16-факторного личностного опросника Р.Б. Кеттелла; снизу указаны интервалы в единицах ½ стандартного отклонения

Справа от среднего значения будут располагаться интервалы, равные 6, 7, 8, 9 и 10 стенам, причем последний из этих интервалов открыт. Слева от среднего значения будут располагаться интервалы, равные 5, 4, 3, 2 и 1 стенам, и крайний интервал также открыт. Теперь мы поднимаемся вверх, к оси " сырых баллов", и размечаем границы интервалов в единицах " сырых" баллов. Поскольку М=10, 2; , вправо мы откладываем 1/2 , т.е. 1, 2 " сырых" балла. Таким образом, граница интервала составит: (10, 2 + 1, 2) = 11, 4 " сырых" балла. Итак, границы интервала, соответствующего 6 стенам, будут простираться от 10, 2 до 11, 4 баллов. В сущности, в него попадает только одно " сырое" значение - 11 баллов. Влево от средней мы откладываем 1/2 и получаем границу интервала: 10, 2-1, 2=9. Таким образом, границы интервала, соответствующие 9 стенам, простираются от 9 до 10.2. В этот интервал попадают уже два " сырых" значения - 9 и 10. Если испытуемый получил 9 " сырых" баллов, ему начисляется теперь 5 стенов; если он получил 11 " сырых" баллов - 6 стенов, и т. д.

Мы видим, что в шкале стенов иногда за разное количество " сырых" баллов будет начисляться одинаковое количество стенов. Например, за 16, 17, 18, 19 и 20 баллов будет начисляться 10 стенов, а за 14 и 15 - 9 стенов и т.д.

В принципе, шкалу стенов можно построить по любым данным, измеренным по крайней мере в порядковой шкале, при объеме выборки n> 200 и нормальном распределении признака.

Другой способ построения равноинтервальной шкалы - группировка интервалов по принципу равенства накопленных частот. При нормальном распределении признака в окрестности среднего значения группируется большая часть всех наблюдений, поэтому в этой области среднего значения интервалы оказываются меньше, уже, а по мере удаления от центра распределения они увеличиваются, (см. Рис. 1.2). Следовательно, такая процентильная шкала является равноинтервальной только относительно накопленной частоты (Мельников В.М., Ямпольский Л.Т., 1985, с. 194).

Построение шкал равных интервалов по данным, полученным по шкале порядка, напоминает трюк с веревочной лестницей, на который ссылался С. Стивенс. Мы сначала поднимаемся по лестнице, которая ни на чем не закреплена, и добираемся до лестницы, которая закреплена. Однако каким путем мы оказались на ней? Измерили некую психологическую переменную по шкале порядка, подсчитали средние и стандартные отклонения, а затем получили, наконец, интервальную шкалу. " Такому нелегальному использованию статистики может быть дано известное прагматическое оправдание; во многих случаях оно приводит к плодотворным результатам" (Стивенс С, 1960, с. 56).

Многие исследователи не проверяют степень совпадения полученного ими эмпирического распределения с нормальным распределении и тем более не переводят получаемые значения в единицы долей стандартного отклонения или процентили, предпочитая пользоваться " сырыми" данными. " Сырые" же данные часто дают скошенное, срезанное по краям или двухвершинное распределение. На Рис. 1.3 представлено распределение показателя мышечного волевого усилия на выборке из 102 испытуемых. Распределение с удовлетворительной точностью можно считать нормальным ( при v = 9, М = 89, 75, ).

 

На рис. 1.4 представлено распределение показателя самооценки по шкале методики Дж. Менестера - Р.Корзини " Уровень успеха, которого я должен был достичь уже сейчас" (п=356). Распределение значимо отличается от нормального ( при v = 7, р < 0, 01, М = 80, 64, ).

С такими " ненормальными" распределениями приходится встречаться очень часто, чаще, может быть, чем с классическими нормальными. И дело здесь не в каком-то изъяне, а в самой специфике психологических признаков. По некоторым методикам от 10 до 20% испытуемых получают оценку " ноль" - например, в их рассказах не встречается ни одной словесной формулировки, которая отражала бы мотив " надежда на успех" или " боязнь неудачи" (методика Хекхаузена). То, что испытуемый получил оценку " ноль", нормально, но распределение таких оценок не может быть нормальным, как бы мы ни увеличивали объем выборки.

Шкала равных отношений - это шкала, классифицирующая объекты или субъектов пропорционально степени выраженности измеряемого свойства. В шкалах отношений классы обозначаются числами, которые пропорциональны друг другу: 2 так относится к 4, как 4 к 8. Это предполагает наличие абсолютной нулевой точки отсчета.

Абсолютный нуль, правда, может иметь место при подсчете количества объектов или субъектов. Например, при выборе одной из 3 альтернатив испытуемые не выбрали альтернативу А ни одного раза, альтернативу Б - 14 раз и альтернативу В - 28 раз. В этом случае мы можем утверждать, что альтернативу В выбирают в два раза чаще, чем альтернативу Б. Однако при этом измерено не психологическое свойство человека, а соотношение выборов у 42 человек.

Распределение признака. Параметры распределения

Распределением признака называется закономерность встречаемости разных его значений (Плохинский Н.А., 1970, с. 12).

В психологических исследованиях чаще всего ссылаются на нормальное распределение.

Нормальное распределение характеризуется тем, что крайние знамения признака в нем встречаются достаточно редко, а значения, близкие к средней величине - достаточно часто. Нормальным такое распределение называется потому, что оно очень часто встречалось в естественно-научных исследованиях и казалось " нормой" всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции (Плохинский Н.А., 1970, с.17). График нормального распределения представляет собой привычную глазу психолога-исследователя так называемую колоколообразную кривую.

Параметры распределения - это его числовые характеристики, указывающие, где " в среднем" располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака. Наиболее практически важными параметрами являются математическое ожидание, дисперсия, показатели асимметрии и эксцесса.

В реальных психологических исследованиях мы оперируем не параметрами, а их приближенными значениями, так называемыми оценками параметров. Это объясняется ограниченностью обследованных выборок. Чем больше выборка, тем ближе может быть оценка параметра к его истинному значению. В дальнейшем, говоря о параметрах, мы будем иметь в виду их оценки.

Среднее арифметическое (оценка математического ожидания) вычисляется по формуле: , где

х i - каждое наблюдаемое значение признака;

i - индекс, указывающий на порядковый номер данного значения признака;

п - количество наблюдений;

- знак суммирования.

Оценка дисперсии определяется по формуле:

х i - каждое наблюдаемое значение признака;

– среднее арифметическое значение признака;

п – количество наблюдений.

Величина, представляющая собой квадратный корень из несмещенной оценки дисперсии (S), называется стандартным отклонением или средним квадратическим отклонением. Для большинства исследователей привычно обозначать эту величину греческой буквой (сигма), а не S. На самом деле, – это стандартное отклонение в генеральной совокупности, a S – несмещенная оценка этого параметра в исследованной выборке. Но, поскольку S - лучшая оценка (Fisher R.A., 1938), эту оценку стали часто обозначать уже не как S, а как : .

В тех случаях, когда какие-нибудь причины благоприятствуют более частому появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторонней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней, или отрицательной - более высокие (см. рис. 1.5).

Показатель асимметрии (А)вычисляется по формуле: .

Для симметричных распределений А=0.

В тех случаях, когда какие-либо причины способствуют преимущественному появлению средних или близких к средним значений, образуется распределение с положительным эксцессом. Если же в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное (см. Рис. 1.6).

Показатель эксцесса (Е) определяется по формуле:

В распределениях с нормальной выпуклостью Е=0.


 

Параметры распределения оказывается возможным определить только по отношению к данным, представленным по крайней мере в интервальной шкале. Как мы убедились ранее, физические шкалы длин, времени, углов являются интервальными шкалами, и поэтому к ним применимы способы расчета оценок параметров, по крайней мере, с формальной точки зрения. Параметры распределения не учитывают истинной психологической неравномерности секунд, миллиметров других физических единиц измерения.

На практике психолог-исследователь может рассчитывать параметры любого распределения, если единицы, которые он использовал при измерении, признаются разумными в научном сообществе.

Статистические гипотезы

Формулирование гипотез систематизирует предположения исследователя и представляет их в четком и лаконичном виде. Благодаря, гипотезам исследователь не теряет путеводной нити в процессе расчетов и ему легко понять после их окончания, что, собственно, он обнаружил.

Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.

Нулевая гипотеза - это гипотеза об отсутствии различий. Она обозначается как Но и называется нулевой потому, что содержит число 0: X1 – Х2 = 0, где X1, X2 - сопоставляемые значения признаков. Нулевая гипотеза - это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий.

Альтернативная гипотеза - это гипотеза о значимости различий. Она обозначается как H1. Альтернативная гипотеза - это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой.

Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности задания, или что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам. Однако чаще нам все-таки требуется доказать значимость различий, ибо они более информативны для нас в поиске нового. Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.

Направленные гипотезы

Но: X1 не превышает Х2

H1: X1 превышает Х2

Ненаправленные гипотезы

Но: X1 не отличается от Х2

H1: X1 отличается от Х2

Если вы заметили, что в одной из групп индивидуальные значения испытуемых по какому-либо признаку, например по социальной смелости, выше, а в другой ниже, то для проверки значимости этих различий нам необходимо сформулировать направленные гипотезы.

Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, чем вгруппе Б, то нам тоже необходимо сформулировать направленные гипотезы.

Если же мы хотим доказать, что различаются формы распределения признака в группе А и Б, то формулируются ненаправленные гипотезы.

При описании каждого критерия в руководстве даны формулировки гипотез, которые он помогает нам проверить.

Построим схему - классификацию статистических гипотез.

Проверка гипотез осуществляется с помощью критериев статистической оценки различий.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.