Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Основные процедуры одномерной стратифицированной выборки






Выше был изложен общий принцип построения рай­онированной выборки. На основе этого принципа разра­ботаны различные процедуры, отличающиеся друг от друга прежде всего использованием при выделении страт одного или нескольких признаков, отбором из каждой страты числа единиц пропорционально или непропорцио­нально объему страты, формированием страты на основе примерных соображений или с использованием формаль­ных методов.

Простейшая процедура стратификации предполагает использование для выделения страт одного признака, формирование страт на основе эвристических соображе--ний и применение пропорционального отбора. Эта про­цедура называется одномерной пропорциональной рай­онированной выборкой.

В качестве исходных моментов при использовании данной процедуры выступает обычно ранжированный ряд, характеризующий вариацию 'в исходной совокупно­сти признака, используемого для стратификации. Не­редко этот ряд предварительно преобразуется в интер­вальный с тем, чтобы из каждой выделенной группы от­бирать число единиц пропорционально ее объему.

Одномерная районированная пропорциональная выборка до сих пор чаще всего применялась в отечест­венной социологии при стратифицированной выборке. Заметим при этом, что стратификация применяется на разных ступенях отбора, так что ее объектом оказыва­ются и непосредственные (или конечные) единицы на­блюдения, и так называемые промежуточные единицы (области, города, предприятия, вузы и т. д.).

Наиболее часто стратификация применяется именно по отношению к последним. В этих целях обычно исполь­зуют: для стратификации областей и городов — интен­сивность того или иного показателя, характеризующего уровень экономики или культуры; для стратификации предприятий — отрасли народного хозяйства, ведомст­венную принадлежность, численность рабочих и служа­щих, размер средней заработной платы, процент выпол­нения плана, удельный вес групп рабочих с различным содержанием труда и т. д.; для стратификации вузов— отрасль народного хозяйства или науки, число студен­тов и т. д.

Усовершенствование одномерной выборки может быть осуществлено несколькими способами: за счет отказа при определенных условиях от принципа пропорционально­сти при размещении выборки в стратах и за счет приме­нения более строгих приемов формирования страт. Во всех случаях прогресс в технике отбора опирается на ис­пользование априорной информации о дисперсии при­знака, служащего основой для стратификации, и о ха­рактере его связи с изучаемым признаком.

Если страта состоит из единиц, очень похожих друг на друга, и имеет, следовательно, небольшую дисперсию, то при прочих равных условиях она может быть пред­ставлена в выборке меньшим числом представителей, чем разнородная страта. Процедура стратифицированного от­бора, построенная на этих идеях и разработанная неза­висимо друг от друга А. А. Чупровым (1923 г.) и Е. Нейманом (1934 г.), получила название оптимально­го размещения. Эта процедура обеспечивает максималь­но экономное использование ресурсов, - выделяемых на обследование.

При простейшем варианте этого метода (он иногда называется методом минимальной дисперсии) исходят из предположения, что денежные и прочие затраты на изу-

картинка

 

Важно подчеркнуть, что оптимальное размещение, предусматривая непропорциональный объем выборки из каждой страты, предполагает в то же время как само со­бой разумеющееся применение весов страты при исчис­лении всех характеристик совокупности (средней, ошиб­ки средней и т. д.) 1.

Заметим также, что в условиях пропорционального отбора можно воспользоваться в качестве весов в итого­вых расчетах объемами выборки из каждой страты. Са­мовзвешивающийся характер пропорциональной выбор­ки гарантирует, что структура выборки будет соответ­ствовать структуре генеральной совокупности.

В условиях применения оптимального размещения или других способов непропорционального отбора (напри­мер, при размещении в каждой страте выборки равного объема) объем выборки из страты уже не может играть роль «веса», и нужны прямые данные об объеме страты. Это обстоятельство в известной мере увеличивает затра­ты на обработку материалов обследования.

Метод оптимального размещения можно рациональ­но использовать, как видно из сказанного выше, только тогда, когда имеется необходимая информация о диспер­сии стратифицирующего признака и если дисперсии это­го признака в отдельных стратах сильно отличаются друг от друга1.

Особое значение имеют сведения о тесноте связи меж­ду стратифицирующим и изучаемым признаками. «Опти­мальное размещение» оказывается «самым лучшим» при коэффициенте корреляции между указанными признака­ми, близком к единице. Если же этот коэффициент мал, то легко себе представить ситуацию, при которой «опти­мальное размещение» даст худший результат по сравне­нию с пропорциональной выборкой2.

Необходимо подчеркнуть еще одно принципиальное обстоятельство. Исследователь всегда работает в режи­ме неполной информации. Поэтому в лучшем случае со­циолог может рассчитывать на получение с помощью метода оптимального размещения высокорепрезентатив-ных данных только в отношении признаков, о которых он обладает какой-то априорной информацией. Что же касается других изучаемых признаков, то его отказ от механизма «самовзвешивания», присущий пропорцио­нальному отбору, означает готовность идти на известный

1 Именно поэтому эффективность рассматриваемого метода сильно снижается, если изучаются качественные признаки. И дело в том, что, как уже отмечалось, дисперсия р(\—р) малочувствитель­на к колебаниям между 0, 2 и 0, 8. Указанный метод невозможно при­менить и тогда, когда разность между значениями признака в край­них группах очень велика. В этом случае применение оптимального размещения требует выборки очень большого размера. См. об этом [226; 97], [89а; 119].

2 Представим себе, что мы, изучая интенсивность чтения книг, вновь воспользовались для стратификации уровнем образования. Мы, однако, не подозревали, что зависимость между интенсивностью чте­ния и образованием в данной совокупности была весьма слабой (на­пример, из-за влияния «третьей» переменной — возраста, семейного положения и т. д.). Руководствуясь, однако, предположениями о сильной зависимости между этими признаками, мы в соответствии с принципами оптимального размещения из группы лиц с закончен­ным высшим образованием отобрали для опроса гораздо меньше людей, чем из группы лиц, не имеющих среднего образования, пола­гая, что во второй группе разброс по уровню образования довольно большой, в то время как в первой он почти равен нулю. В дейст­вительности же в первой группе дисперсия изучаемого признака — интенсивности чтения — была намного выше, чем во второй группе, и избранная стратегия отбора оказалась крайне неудачной.

риск ухудшения репрезентативности указанных призна­ков1.

Все описанные выше обстоятельства объясняют, по­чему на практике оптимальное размещение использует­ся сравнительно редко. Вместе с тем разработка этого метода серьезно углубила понимание многих проблем применения выборки2.

Если первый путь улучшения стратификации основы­вается на манипулировании структурой выборки при за­данном расчленении совокупности на страты, то второй путь ориентирован на поиск лучших вариантов разделе­ния генеральной совокупности на страты.

 

картинка

 

Современные вычислительные средства позволяют эф­фективно формировать страты (если их число невелико) с помощью прямого перебора.

Само собой разумеется, что ориентация проектиров­щика выборки одновременно на оптимальную стратифи­кацию и оптимальное размещение теоретически обещает получение при заданном объеме выборки наилучших оце­нок. Однако и здесь следует напомнить, что такая стра­тегия предполагает теснейшую связь между изучаемым и стратифицирующим признаками. Если же эта связь яв­ляется слабой, то тогда в силу вступает так называемая схема Далениуса [21; 70—71], которая, решая вопрос о формировании страт и размещении между ними выборки, учитывает тесноту связи между соответствующими при­знаками и допускает отклонение от пропорционального

отбора только в той мере, в какой позволяет идти на этот риск конкретный коэффициент корреляции 1.

Практика применения оптимальной стратификации очень бедна. Один из немногих примеров — работа, про­деланная Ю. П. Вороновым 'при проектировании выбор­ки в исследовании аудитории «Литературной газеты» [40], [197]. В качестве признака стратификации исполь­зовался показатель плотности подписки на газету в рас­чете на 10 тыс. жителей. На первой ступени отбора 150 территориальных единиц были объединены в страты так, чтобы был обеспечен минимум дисперсии по ука­занному признаку.

Следует подчеркнуть, что эффективность стратифика­ции находится в определенной зависимости от числа страт. Увеличение числа страт выше определенного уров­ня приносит очень небольшой выигрыш.

С учетом этих соображений можно полагать, что чис­ло страт при использовании одного стратифицирующего признака может быть в интервале от 3 до 10 [289; 102].






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.