Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






А-с разными средними и разными дисперсиями, б-с одинаковыми средними, но разными дисперсиями






Другими словами, предположим, что, будучи опрошенными много раз, наши два респондента в среднем будут давать разные оценки. Скажем, если речь идет об оценке политического лидера - то оценки l-го респондента в среднем низки, а р- го - в среднем высоки. Будет ли в таком случае осмысленной наша главная задача - приписывание лидеру такого числа, которое отразило бы суммарное, усредненное мнение наших респондентов? Наверное, нет. Соответствующее среднее мнение так же будет лишено смысла, как пресловутая " средняя температура по больнице".

Наверное, любой добросовестный социолог при наличии в изучаемой совокупности таких респондентов, мнение которых отвечает распределениям, изображенным на рис. 6.4 а, придет к выводу, что среди интересующих его людей мнения относительно рассматриваемого лидера разделились: одним респондентам этот лидер нравится, другим - нет. И прежде чем осуществлять шкалирование, вероятно, такой социолог сочтет разумным разделить всю совокупность на две и для каждой из полученных подсовокупностей искать среднюю оценку отдельно. В итоге мы получим две оценки: среди интересующего нас множества людей имеются такие, которые одобряют рассматриваемого лидера и их средняя оценка - такая-то, но имеются и те, кто не одобряет его, и их средняя оценка - другая.

Ставя вопрос в более общем виде, можно сказать, что в описанной ситуации исходная совокупность респондентов недостаточно однородна для того, чтобы к ней мог быть применен метод парных сравнений, и для того, чтобы такое применение было осмысленным, необходимо в исходной совокупности выделить однородные подсовокупности.

Вероятно, разумно предположить, что в нашем случае однородность совокупности респондентов определяется равенством не только средних соответствующих распределений, но и соответствующих дисперсий. Действительно, представим себе, что каким-то двум респондентам отвечают распределения, изображенные на рис. 6.4 б, где? ip и? il - средние квадратические отклонения (напомним: для получения дисперсий надо их возвести в квадрат), отвечающие р-му и /-му респондентам соответственно. Один из них (р-и) хорошо знает рассматриваемого политического лидера и поэтому уверен в своих оценках. Его дисперсия мала, кривая " узка", вероятность дать ответ, сильно отличающийся от среднего, практически равна нулю. Напротив, другой респондент (/-и) имеет об упомянутом политике весьма смутное представление. Ему более или менее все равно, какие оценки давать. Весьма сильно разнящиеся ответы могут встретиться примерно с одинаковой вероятностью. Наверное, построение оценки, средней для таких двух респондентов, тоже будет сомнительным.

Итак, будем считать, что наша совокупность однородна, т.е. что распределения, отвечающие одному объекту, но разным респондентам, одинаковы (т.е. имеют одинаковые средние и дисперсии). Значит, в обозначениях математических ожиданий (средних) и средних квадратических отклонений этих распределений можно убрать индексы, отвечающие номеру респондента: mil= mip = mi; sil= sip = si

Следует отметить, что математика предлагает нам способы, позволяющие по матрицам парных сравнений судить о степени однородности рассматриваемого массива респондентов [Пригарина, Чеботарев, 1989]. Мы этим вопросом заниматься не будем, поскольку он выходит за пределы собственно метода ПС (решение вопроса однородности - это еще одна из причин, которая привела к расширению идей, предложенных Терстоуном).

Вспомним, что основным объектом изучения в математической статистике являются случайные величины-признаки, относительно каждого значения которых определена вероятность его встречаемости. Задать случайную величину - значит задать распределение вероятностей и наоборот. Можно сказать, что для каждого шкалируемого нами объекта ai определена некоторая случайная величина? i, отвечающая мнению об этом объекте каждого из рассматриваемых респондентов. Эта величина нормально распределена и имеет математическое ожидание (среднее) mi и среднее квадратическое отклонение si.

В соответствии со сказанным выше будем полагать, что нашей задачей является поиск чисел т1, т2..., тn (они и будут служить искомыми оценками V 1 ,..., Vn) математических ожиданий нормально распределенных и имеющих одинаковые дисперсии s1, s2, ..., snслучайных величин? 1?, 2...,? n отвечающих шкалируемым объектам a1, a2, ..., аn. Перейдем к описанию соответствующего алгоритма.

Построение системы уравнений для искомых школьных значений объектов

Итак, мы хотим найти средние величины (математические ожидания) некоторых гипотетически существующих случайных величин. Распределения, отвечающие этим величинам, нам неизвестны и мы вряд ли можем их найти, рассчитать экспериментально (их получение связано с тщательным изучением мнения респондента о каждом объекте, с обеспечением возможности многократного опроса одного и того же респондента и т.д. Все это вряд ли может позволить себе социолог). Значит, мы должны идти другим путем. Вспомним кое-что о понятии вероятностного распределения.

Нормальное распределение в математической статистике хорошо изучено. Это, в частности, означает, что для этого распределения существуют статистические таблицы, которые позволяют по каждому значению случайной величины найти вероятность его встречаемости, по каждой вероятности-значения, которые с этой вероятностью встречаются. Нам надо найти определенные значения наших случайных величин (те, которые являются средними). Значит, следует попытаться проанализировать, от каких вероятностей мы можем отталкиваться. Имеются ли у нас какие-либо вероятности, связанные с рассматриваемыми случайными величинами? Конечно, имеются, они заключены в наших исходных данных. Чтобы понять, как матрицы ПС могут быть связаны с некоторыми вероятностями, рассмотрим еще один элемент той модели, которая была предложена Терстоуном.

Прежде всего отметим, что, поскольку для каждого объекта совокупностям оценок разных респондентов отвечает одна и та же случайная величина, логично предположить, что приблизительное (выборочное) распределение этой величины может быть найдено двумя путями: путем многократного опроса одного (любого) респондента, либо путем однократного опроса многих респондентов. Результат будет один и тот же!

Теперь сложим все наши матрицы ПС. Нетрудно понять, что тогда на пересечении i-й строки и j-го столбца полученной матрицы-суммы будет стоять количество респондентов, утверждающих, что ai> aj. Поделим эту сумму на общее количество респондентов и получим соответствующую долю. Обозначим ее через pil:

pij =(?? ijl)/N

l

Следуя описанной выше логике, позволяющей " подменять" совокупность мнений разных респондентов многократно повторенным мнением одного респондента, будем считать, что pij говорит о том, сколь часто один респондент будет предпочитать i-и объект j-му (если представить себе, что мы многократно предъявляем респонденту все рассматриваемые пары объектов).

Заметим, что матрица || pil || обладает рядом свойств, знание которых может помочь в использовании описываемых теоретических положений на практике, а именно, для всех / и у выполняются соотношения: 0 < р < 1; pij +p ji =1 (pij= 1/2 условно).

Теперь вспомним закон сравнительного суждения Терстоуна:

чем чаще при многократных опросах некий респондент предпочитает объект аi объекту аj, тем дальше отстоят друг от друга отвечающие этому респонденту шкальные значения рассматриваемых объектов. Наверное, если учесть, что любому респонденту отвечает целый набор шкальных значений, каждое из которых встречается с определенной вероятностью (т.е. каждому респонденту отвечает некоторая случайная величина), то естественно предположить, что доля pij равна вероятности того, что наша i-я случайная величина (т.е. случайная величина, отвечающая i-му объекту) больше j-й (отвечающей j-му объекту), или, на формальном языке:

pij = P(? i>? j) (6.1)

Итак, наши эмпирические данные (суммарная матрица ПС) задают нам определенного рода вероятности. Чтобы стало ясно, каким образом можно, используя знание этих вероятностей и таблицы для нормального распределения, перейти к средним значениям случайных величин i и j (лишний раз напомним, что эти средние являются тем, что мы ищем), введем новое обозначение:? ij =? i -? j

Тогда выражение для pij перепишется в виде:

pij = P(? ij> 0) (6.2)

Следующие соотношения опираются на известные результаты из области математической статистики. Они не используют никакие модели восприятия, никакие предположения о сути того, что происходит в сознании одного респондента, о связи процессов, имеющих место в представлениях разных респондентов, и т.д.

Величина? ij, будучи разностью двух нормально распределенных случайных величин? i и? j с математическими ожиданиями тi и тj средними квадратическими отклонениями si и sj соответственно, сама является нормально распределенной случайной величиной с математическим ожиданием тij и средним квадратическим отклонением? ij, определяющимися следующим образом:

тij= тij (6.3)

s ij2 = s i2 + s j2 -2rij s i s j (6.4)

где rij - коэффициент корреляции между? i и? j (к обсуждению его " физического" смысла мы еще вернемся).

На основе соотношения (6.2) мы можем, пользуясь таблицами нормального распределения, найти отвечающее стоящей в левой части этого равенства вероятности значение величины? ij. Однако, чтобы это сделать, необходимы некоторые дополнительные рассуждения. Дело в том, что известные статистические таблицы разработаны только для так называемого стандартизованного нормального распределения, т.е. для таких случайных величин? станд которым отвечает нулевое среднее и единичная дисперсия (конечно, нельзя рассчитать таблицы для всех мыслимых нормальных распределений, поскольку в качестве математического ожидания могут выступать любые действительные числа, в качестве дисперсии - любые положительные действительные числа). Но тем не менее таблица может все-таки быть полезной, если воспользоваться следующим известным в математической статистике положением:

P(? ij> 0) = P(? станд > (тij / s ij)) (6.5)

Итак, пользуясь таблицей для стандартизированного нормального распределения, на основе соотношения (6.5) можно найти величину тij / s ij. Обозначим ее через zij. Ясно, что

тij = s ij zij

что, в силу (6.3) и (6.4), эквивалентно соотношению:

тij= zij (s ij 2 + s ij2 -2rij s i s j)1/2

Мы получили систему уравнений для нахождения искомых шкальных значений тi и тj (i и j были произвольными номерами наших объектов, поэтому уравнений типа (6.6) у нас будет столько, сколько пар из этих объектов можно составить).

Подчеркнем, что уравнения (6.6) получаются на основе суммарной матрицы ПС очень быстро: по каждой частоте pij сразу, только заглянув в соответствующую статистическую таблицу, находим zij и, значит, сами уравнения. Все предыдущие рассуждения о моделях восприятия нужны только затем, чтобы оправдать этот шаг. Поэтому то, что этим рассуждениям выше уделено значительное место, не должно смущать читателя. Алгоритм практических действий пока прост. Но далее он усложняется: нам надо решить систему (6.6), а здесь есть о чем поговорить.

Решение системы уравнении

Начнем с того, что помимо интересующих нас шкальных значений изучаемых объектов, система (6.6) содержит и другие неизвестные: s i, s j, rij. Поступим с ними так, как это делали Терстоун и его последователи.

Прежде всего упростим уравнения (6.6), сделав некоторые дополнительные предположения о свойствах наших моделей, связанных с тем, каковы величины rij, s i, s j. Отметим, что в литературе известны разные способы такого упрощения. Разным ограничениям на упомянутые параметры отвечают разные модели. Именно поэтому в начале настоящего параграфа мы говорили не о модели, а о моделях Терстоуна. Опишем ту, которая приводит к наиболее простой системе уравнений.

Но прежде сделаем одно важное методологическое замечание. Вообще говоря, любые свойства используемого в социологии математического аппарата так или иначе " выходят" на определенные содержательные представления (ср. п. 3.3). Однако зачастую суть этих представлений бывает очень трудно оценить. В данном случае удается установить связь между формализмом и содержанием: проследить, какой социологический смысл имеют рассматриваемые ограничения. И просим читателя обратить внимание не только на анализируемые ниже свойства конкретной модели восприятия, но и на методологический аспект проблемы - на то, как надо связывать элементы используемого формализма с содержанием решаемой задачи.

Итак, сделаем следующие предположения.

Во-первых, предположим, что rij = 0. Ясно, что это значительно облегчает решение системы (6.6), поскольку в правой части этой системы при таком предположении исчезает самое " длинное" слагаемое. Но нам важно понять, какие изменения в нашу модель вносит это предположение.

Вспомним, что rij - коэффициент корреляции между двумя случайными величинами: i и j Нетрудно понять, что наличие соответствующей связи означает зависимость мнения респондента об i-м объекте от его же мнения о j-м объекте. И наше предположение означает отрицание такой зависимости. Всегда ли это оправданно? Наверное, не всегда. Предположим, что респондент, оценивая политического лидера Иванова, учитывает свой негативный практический опыт общения с этим лидером и дает ему низкую оценку. Переходя к оценке лидера Петрова, он может также высказать отрицательное мнение просто потому, что, по его сведениям, Петров принадлежит к той же политической партии, что и Иванов. Таких примеров можно привести множество.

Приравнивая к нулю рассматриваемый коэффициент корреляции, мы тем самым налагаем и соответствующие содержательные ограничения на нашу модель. Конечно, мы далеко не всегда можем проверить, справедливы ли наши посылки. Но если мы хотим все же стремиться к получению результатов, действительно отражающих реальность, то уж во всяком случае должны по возможности давать себе отчет в том, какие модели используем.

Во-вторых, будем полагать, что s i= s j = s. Другими словами, предположим, что мера уверенности в оценках нашими респондентами разных объектов одинакова. Представляется, что это предположение в большей мере сомнительно, чем сформулированное выше предположение о том, что у разных респондентов одинакова мера уверенности в оценке одного и того же объекта (собственно, последнее предположение тоже вполне может быть неадекватным реальности, но выше мы убрали соответствующую проблему, сведя ее к требованию обеспечения определенной однородности совокупности рассматриваемых респондентов). Ради простоты формального способа поиска интересующих нас шкальных значений все же примем это предположение, но сделаем это, как и выше, " с открытыми глазами".

Итак, система (6.6) в результате сделанных допущений превращается в следующую:

тij= zijs 21/2 (6.7)

В этой системе, помимо искомых величин т1, т2,..., тn содержится еще одно неизвестное - s. Найти его можно только путем экспериментального изучения распределения оценок респондентом какого-либо из рассматриваемых объектов. Для социолога это обычно бывает нереально. Поэтому будем полагать, что s - произвольно. Положим его равным 1, т.е. будем решать систему (6.7) как бы без него. Но при этом не будем забывать, что наиденное решение, каким бы оно ни было, всегда будет таким, что разности ij) определены лишь с точностью до некоторого постоянного множителя - s.

Это принципиальный для социолога момент. В п.1.1 мы уже отмечали, что с подобной неоднозначностью результатов измерения он имеет дело очень часто. Числа мало пригодны для нужд социологии. И проявляется это в первою очередь именно в том, что практически никогда их не удается определить однозначно. Степень неоднозначности определяет тип шкалы. В рассматриваемом случае эта степень (т.е. то, что разности шкальных значений определены с точностью до постоянного множителя) говорит о том, что мы имеем дело с интервальной шкалой. Если какой-то набор чисел будет решением нашей системы, то таким же решением будет и любой другой набор чисел, получающийся из первого путем растягивания (сжатия) всех интервалов между ними в одно и то же число раз.

Итак, положим s = 1 и перейдем к обсуждению решения системы (6.7).

Нашей целью не является обучение читателя решению подобного рода систем уравнений. Тем не менее позволим себе сделать некоторые замечания по поводу такого решения, поскольку, на наш взгляд, в соответствующем подходе содержится ряд положений, имеющих определенную методическую ценность для решения многих социологических задач.

Во-первых, рассматриваемая система переопределена - число уравнений, вообще говоря, гораздо больше числа неизвестных (количество пар, которые мы можем составить из каких-либо объектов, больше, чем количество объектов, если мы имеем дело с более чем тремя объектами). Следовательно, эта система чаще всего не будет иметь решения: даже если мы и найдем решение нескольких уравнений, совсем необязательно они будут удовлетворять и оставшимся уравнениям. Как же быть? На помощь приходит знакомый нам по регрессионному анализу метод наименьших квадратов (напомним, что там мы ищем прямую линию, которая была бы максимально близка одновременно ко всем рассматриваемым точкам, может быть даже не проходя ни через одну из них). Найдем с его помощью такое решение, которое в максимальной степени будет делать схожими правые и левые части наших уравнений, может быть даже не удовлетворяя полностью ни одному из них.

Говоря более конкретно, будем искать такие тi и тj, которые обращают в минимум сумму квадратов разностей между правыми и левыми частями системы (6.7):

S ((тi j) - zij 21/2)2 min (6.8)

i, j

Напомним читателю, что выбираются такие от, и т с помощью вычисления производных выражения (6.8) (п производных - по числу искомых величин) и приравнивания каждой из них к нулю. Получаем п линейных уравнений с п неизвестными. Такая система легко решается.

(Мы столь подробно говорим о способе решения системы (6.7) для того, чтобы читатель лишний раз убедился в значимости для социолога знания метода наименьших квадратов (из-за сложности построения моделей социальных явлений социолог, как правило, имеет дело с соотношениями, которые не могут быть удовлетворены в точности) и владения элементами дифференциального и интегрального исчисления. Аналогичное утверждение относительно теории вероятностей и математической статистики подтверждается текстом, изложенным в настоящем параграфе выше.)

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.