Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Вероятностный характер ошибок






Рассуждая о величине ошибки выборки и о характере ее зависимости от дисперсии и объема изучаемой сово­купности, мы не должны забывать о том, что речь идет о теоретически возможной величине ошибки. Ведь реаль­ная фактическая ошибка может быть, как указывалось, установлена только в сравнительно редких случаях. По­этому у социолога не может быть полной уверенности в том, что найденная им выборочная средняя будет отли­чаться от не известной ему генеральной средней не более чем на величину средней ошибки. Очевидно, что может идти речь только о вероятностных, предположительных оценках этой величины.

В теории вероятностей разработаны принципы, позво­ляющие определить конкретную вероятность того, что фактическая не известная исследователю ошибка не пре­вышает средней стандартной ошибки.

Покажем это на примере со студентами. Предполо­жим, что выборку по 200 человек осуществляли в поряд­ке эксперимента независимо друг от друга 100 социоло­гов. Мы можем также считать, что выборка носила бес­повторный характер, и студент, включенный в одну вы­борку, уже автоматически не мог попасть в другую. В результате эксперимента было получено 100 выбороч­ных средних о возрасте, успеваемости, социальном про­исхождении, жилищных условиях и других характеристи­ках студентов. Согласно теории вероятностей выбороч­ные средние, полученные описанным выше путем, будут располагаться по кривой, которая при увеличении числа этих средних, будет приближаться к нормальному рас­пределению.

В соответствии с этим распределением основная масса выборочных средних (примерно 2/3 всех средних—68%) отклоняется от генеральной средней на величину, не пре­вышающую одной средней ошибки (^i). При этом одна половина этих средних (или 34% общего числа) больше генеральной средней (но на величину не более (л), а дру­гая половина — меньше, но опять-таки не более чем на ц.

Если же считать допустимым отклонение от истинной средней (или предельную ошибку), равное А=2|л, то ока­жется, что этому более мягкому требованию удовлетво­ряют уже 95% всех выборочных средних. И опять-таки здесь соблюдается симметрия: одна половина выбороч­ных средних будет больше истинной средней на величи­ну, не превышающую 2ц, а другая—соответственно меньше. Наконец, 'предельной ошибке, равной Зц, соот­ветствует вероятность, равная 99%.

Со снижением требовательности к точности, с возра­станием нашей готовности смириться с возможностью бо­лее крупной предельной ошибки возрастает число выбо­рочных средних, на которые мы можем положиться при указанных выше ограничениях. Если мы хотим, чтобы выборочная средняя отличалась от генеральной средней всего яа ц, то мы должны 'быть готовы к тому, что 32% всех средних (100%—68%) могут иметь более крупные ошибки. Но если нас устроит меньшая точность и пре­дельная ошибка, равная 2|х, для нас терпима, то мы мо­жем исходить из того, что только 5% (100%—95%) всех возможных выборочных средних могут отклоняться бо­лее чем на 2|л. Наконец, если мы будем 'мириться с пре­дельной ошибкой, равной 3{л, то тогда только 1 % всех выборочных средних может обладать еще более крупны­ми недостатками.

 

картинка

 

Итак, чем выше предельная ошибка, тем меньшее число средних может выйти за ее границы. Это важное положение математической статистики многим хорошо известно из практики: чем точнее должен быть результат измерения, тем труднее его достичь, и, наоборот, чем ме­нее жесткие требования, тем легче они могут быть удов­летворены.

Рассуждая о распределении выборочных средних во­круг истинной средней аналогичным образом, мы опери­ровали мысленным экспериментом, в котором множество социологов изучали один и тот же объект (в данном слу­чае студентов одного вуза) и измеряли одни и те же свойства. Поэтому и у нас появилась возможность срав­нивать друг с другом 100 выборочных средних.

Но в действительности так не бывает. Социолог имеет возможность по каждому показателю получить только одну выборочную среднюю. Тогда перед ним возникает вопрос о том, какова же возможная ошибка этой единст­венной средней, находящейся в его распоряжении. В этой ситуации упомянутые выше величины 68%, 95%, 99% превращаются для него в прогнозные, вероятностные оценки возможной ошибки его индивидуальной выбороч­ной средней.

В приведенном выше примере из исследования Л. А. Гордона и Э. В. Клопова средние затраты времени на просмотр телепрограмм у незамужних молодых жен­щин характеризовались величиной х=2 ч 15 мин ± ± 19 мин. Второй элемент этого выражения представляет среднюю (или стандартную ошибку), соответствующую, как отмечалось, уровню вероятности 0, 68.

Если же мы хотим ориентироваться на более высокий уровень вероятности, например 0, 95, то тогда нам придет­ся согласиться на предельную ошибку, равную 2|л, т. е. в данном случае 38 мин. Это означает существенное рас­ширение интервала, в котором может оказаться истинная средняя (теперь она находится между 1 ч 37 мин и 2 ч 51 мин), и заметное ухудшение точности результата.

Теория случайной выборки позволяет, как мы видим, заранее, еще на стадии проектирования исследования, предсказывать величину возможной ошибки выборки.

Некоторые социологи исходят из того, что теория слу­чайной выборки разрешает применение формул только тогда, когда изучаемые признаки распределяются в гене­ральной совокупности нормально [132; 49—52], [6; 45]. В действительности нормальное распределение выбороч­ных характеристик присуще большим выборкам в соот­ветствии с центральной предельной теоремой независимо от типа распределения изучаемых характеристик. В то же время несомненно, что близость распределения изу­чаемых признаков к нормальному распределению суще-

ственно повышает точность выборочных результатов, особенно, если объем выборки является небольшим.

В иной ситуации приходится прибегать к расчетам, опирающимся на распределение, не являющееся строго нормальным, например на распределение Стьюдента.

Очевидно, что каждому показателю, исчисленному по материалам выборочного обследования, присуща своя, конкретная величина ошибки. Так как абсолютное боль­шинство исследований оперирует десятками и даже сот­нями показателей, то число вычисленных ошибок в прин­ципе может быть таким же большим1.

Совершенно ясно, что ошибки репрезентативности од­ного и того же социологического исследования подверже­ны сильным колебаниям. В уже упоминавшейся книге «Человек после работы» величина ошибок, относящихся к данным о доле лиц, обладающих определенным при­знаком, колеблется от 1, 2 до 4, 5%.

Но возможно ли исчисление интегральной оценки ре­презентативности всей совокупности показателей, исполь­зованных в социологическом исследовании? Такой вопрос кажется вполне естественным. Однако даже в литера­туре он поставлен сравнительно недавно, а число попы­ток практически определить величину этой интегральной оценки невелико.

Данная методическая проблема тесно переплетается с более общим вопросом о соизмерении признаков раз­личного характера, который, в частности, играет столь важную роль в таксономии.

Одно из решений этой важной задачи было предло­жено П. Махалонобисом. Оно предполагает сопоставле­ние двух векторов — характеристик генеральной и выбо­рочной совокупностей — и исчисление показателя, харак­теризующего суммарное расстояние между всеми компо­нентами этих векторов.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.