Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Многомерная стратификация






До сих пор шла речь о поиске путей уменьшения ве­личины ошибок одновременно по многим переменным в рамках одномерной стратификации. Новый этап в разви­тии выборки как раз и связан с выходом на многомер­ную стратификацию.

В известном смысле первыми шагами в указанном на­правлении можно считать применение такого приема стратификации по двум или трем признакам, как метод «решетки»1.

В целом можно утверждать, что многомерная страти­фикация возникла не как развитие идей оптимального размещения и оптимальной стратификации, а как совер­шенно новый подход к проектированию выборки.

Сама идея многомерной стратификации возникла после появления аппарата распознавания образов [43], [73], [125]. Появление возможностей группировки объектов по мно­гим признакам породило надежду, что новые методы по­зволяют сформировать страты из похожих по многим при­знакам единиц отбора. Предполагалось, что однород­ность страты настолько велика, что практически между всеми переменными в пределах страты существует тесная корреляция и поэтому можно добиться высокого эффек­та районирования, даже не прибегая к таким сложным и малоприспособленным к многоцелевой выборке приемам, как оптимальное размещение и оптимальная стратифи­кация.

Методы многомерной стратификации для априорного описания объекта впервые были использованы в рабо­тах Ю. П. Воронова при планировании выборки для об­следования миграции сельского населения Западной Си­бири, проведенного под руководством Т. И. Заславской [41], [42], [49], [ИЗ].

Предварительно было построено многомерное описа­ние районов Новосибирской области по шести показате­лям. 29 районов Новосибирской области с помощью ше­сти указанных характеристик были разбиты на 14 групп. Далее из каждой группы было взято для обследования по одному району. В состав отобранных районов входи­ло 185 сельсоветов. Для отбора сельсоветов было пост-. роено их многомерное описание в терминах также шести характеристик. Полученное описание содержало 18 еди­ничных групп (каждая из 1 сельсовета) и 19 групп, со­держащих от 2 до 37 сельсоветов. Согласно опублико­ванным данным использование многомерной стратифика­ции в исследованиях новосибирцев дало в отношении не­которых переменных неплохие результаты [49; 48], [113;

69]. К сожалению, нам неизвестно, в каком соотношении находится эффективность использованной новосибирцами методики по сравнению с одномерной стратифика­цией.

Метод таксономии нашел применение и при проекти­ровании выборки в исследовании Ю. В. Арутюняна [9].

Существенное улучшение методики многомерной стра­тификации связано с включением в аппарат социологов, занимающихся проектированием выборки, факторного анализа. Он позволил заметно расширить совокупность признаков, из которой отбираются стратифицирующие переменные. Специальная процедура, основывающаяся на применении указанных методов, получила название структурной классификации.

Первая стадия исследования посвящается составле­нию перечня признаков, которые могут быть использо­ваны для стратификации. Отбор признаков осуществляет­ся с учетом, во-первых, соображений о предполагаемом влиянии этих признаков на переменные, подлежащие изучению, во-вторых, наличия и доступности соответст­вующей информации [67; 56].

В последнее время для отбора признаков часто при­влекаются эксперты. С помощью экспертов на основе ра­нее накопленной информации можно более • эффективно решить (кроме составления самого перечня показателей) такие задачи, как определение примерного «веса», зна­чимости признака, выяснение характера его связей с дру­гими признаками (и прежде всего для выделения отно­сительно зависимых и независимых признаков), опреде­ление «метрики», т. е. того, в каком виде признак будет

использован4, изучение степени сопоставимости призна­ков друг с другом исходя из временных и пространствен­ных критериев.

На второй стадии с помощью факторного анализа 2 вся совокупность признаков, которые исследователь ре­шил использовать как стратифицирующие, объединяется, исходя из их близости, в отдельные группы. При этом исследователю иногда удается дать содержательную ин-' терпретацию каждой группе признаков и выделить тот внутренний, латентный фактор, который и объединил данные признаки в одну группу. Например, Е. С. Петрен­ко [136], (137], [138] разбила 32 признака, характеризую­щие 74 города РСФСР.на 5 факторов. Первый фактор объединил данные о числе лиц с различным уровнем об­разования. Эта группа признаков 'в целом характеризует уровень образования жителей города. Во (второй груп­пе оказались объединенными показатели, характеризую­щие число рабочих, а также служащих, занятых в торгов­ле, общественном питании, транспорте и связи. По мне­нию исследователя, этот фактор дает представление об уровне развития сферы обслуживания.

Признаки, образующие третий фактор, дают пред­ставление о характере промышленности города, а обра­зующие четвертый фактор — о интенсивности строитель­ства, образующие пятый — о наличии в городе резервов рабочей силы.

В процессе типологизации по 22 признакам 171 сель­ского населенного пункта Новосибирской области Т. И. Заславская и И. Б. Мучник [72], [73] выделили

4 Так, например, данные об уровне 'образования населения могут быть представлены в виде доли лиц, имеющих образование опреде­ленного уровня, числа лиц с указанным образованием на 1000 жите­лей, среднего числа лет обучения на 1 жителя, соотношения числа лиц с разным уровнем образования и т. д.

2 В использованных ниже примерах типологизации применена такая разновидность факторного анализа, как метод экстремальных группировок, позволяющий формировать «чистые» факторы и обеспе­чивающий включение каждого признака только в один фактор [19], [20].

Несколько иной подход к стратификации применил О. В. Старо­веров и его соавторы [2; 223—229]. Ими был применен для образова­ния страт из городов метод главных компонент. Оказалось, что 5 глав­ных компонент могут объяснить 70% суммарной дисперсии по 32 при­знакам. На основе этих данных было осуществлено распределение 74 городов: на 5 страт.

4 фактора. В первый фактор вошло б признаков, в том числе расстояние села от ближайшего ателье по пошиву и ремонту одежды, расстояние от комбината бытового обслуживания, расстояние от районного центра. В целом этот фактор характеризует удаленность села от межсель­ских предприятий обслуживания.

Второй фактор, объединяющий показатели обеспечен­ности торговыми заведениями, учреждениями связи, ме­дицинской помощью, по мнению авторов, в целом харак­теризует уровень развития сферы обслуживания непо­средственно в селе. Интерпретацию получили также тре­тий и четвертый факторы.

На третьей стадии классификации происходит пост­роение частных классификаций. Единицы исследования (например, населенные пункты) разбиваются по каждо­му фактору на отдельные классы.

Расчленение единиц отбора на отдельные 'классы мо­жет быть осуществлено различными приемами. Простей­ший прием предполагает выделение признака, который в данном факторе имеет наибольший вес и который иг­рает чаще всего решающую роль при интерпретации со­держания фактора. Так, например, при типологизации сел среди признаков, объединенных во второй фактор, наибольший вес (0, 839) имел индекс обеспеченности тор­говыми заведениями. Его-то и можно было бы использо­вать для выделения нескольких групп сел.

Второй прием основывается на возможности припи­сать каждой единице отбора вес исходя из данного обоб­щающего фактора. После этого не составляет труда раз­бить всю совокупность единиц отбора на группы.

Наконец, можно использовать для расчленения еди­ниц отбора на классы обычные методы таксономии, на­пример так называемую автоматическую классифика­цию. С 'помощью этого приема единицы отбора объединя­ются в таксоны 'исходя 'из близости их векторов, 'каждый из которых образуется «з переменных, объединенных одним фактором.

С помощью выделенного фактора можно разбить сово­купность единиц отбора на разное число классов. Обыч-, но исследователь, исходя из критерия «наполняемости» отдельных классов, сам определяет это число. Часто ог­раничиваются выделением двух-трех классов. Так, в упо­минавшейся стратификации городов все города по каж-

дому фактору были расчленены на три группы. По пер­вому фактору были выделены города с населением, име­ющим высокий средний и сравнительно низкий уровень образования. Сельские населенные пункты были разбиты по каждому фактору на два класса, например на села отдаленные и не очень отдаленные от общественных центров, со слабо или высокоразвитым обслуживание и т. п.

Таким образом, после завершения третьей стадии каждая единица исследования (а в данном случае она является и единицей отбора) оказывается приписанной к разным классам, число которых равно количеству выде­ленных факторов. Например, каждый город оказался включенным в 5 классов, а каждое село в 4 класса.

На четвертой стадии исследователь пытается свести частные классификации в одну общую типологию. Это осуществляется путем выделения таких сочетаний раз­личных классов, на которые приходится значительное число единиц отбора. В результате упоминавшейся клас­сификации каждый город получил пятизначный код, в ко­тором первая цифра характеризовала принадлежность города к одному из классов по первому фактору, вторая цифра — принадлежность города к одному из классов по второму фактору 'и т. д.

Формально в данном исследовании можно выделить 74 общих классов городов. Однако оказалось, что боль­шая часть городов (60%) распределяется между 10 об­щими классами. Первый общий класс, например, объеди­нил города, в которых население имеет средний (по сравнению.с другими городами) уровень образования, уровень обслуживания является высоким, 'уровень разви­тия промышленности является средним, а строитель­ства — низким, доля нетрудоспособного населения вы­сокая.

Несколько иной подход, напоминающий технику кла­стерного анализа и сегментации, применили классифи­каторы сел. Вначале они прорайонировали факторы по их «силе». Затем в качестве исходного пункта они взяли классы, выделенные по самому значимому фактору, потом каждый из этих классов разбили на подклассы по второму по важности фактору и т. д. В результате было выделено 7 общих классов. В первый из этих классов, на­пример, вошли самые малые периферийные поселки, уда-

ленные от общественных центров, с преобладанием сель­ского типа застройки и слабым развитием обслужива­ния.

Выделенные общие классы городов и сел являются готовыми стратами для отбора из них единиц исследова­ния.

Первые опыты применения многомерной стратифика­ции во многом напоминали тот период в истории выбор­ки, когда использование оптимального размещения не предполагало в качестве обязательного условия предва­рительное изучение связей между стратифицирующим и исследуемым 'признаками. Новый этап в 'применении многомерной стратификации связан опять-таки с усиле­нием интереса к этой стороне дела.

Теоретически можно себе представить, что с учетом неодинакового характера связи изучаемых переменных со стратифицирующими признаками следует в рамках одно­го и того же обследования построить несколько различ­ных стратификаций1. В этой связи важное значение при­обретает пробное обследование, в рамках которого сле­дует установить, какая из типологизаций единиц отбора наиболее тесно связана с изучаемыми признаками [50].

Серьезным препятствием при проектировании много­целевой и многомерной стратифицированной выборки яв­ляется отсутствие информации о признаках, подлежащих изучению. Для его преодоления можно воспользоваться имеющимися сведениями о тех признаках, которые могут условно заменять изучаемые признаки.

Использование многомерной стратификации вовсе не исключает значение вопросов, относящихся к размеще­нию выборки между отдельными стратами, или таксонами. Нельзя игнорировать и в этом случае принципы «оп­тимального размещения». Очевидно, что разнородные таксоны могут быть представлены в выборке интенсив­нее, чем другие, при условии, что во время исчисления характеристик выборочной совокупности будут учтены истинные «веса» таксонов1.

Использование многомерной стратификации в социо­логии только начинается, и в будущем многие еще неяс­ные вопросы, видимо, найдут свое решение.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.