Разделы сайта

Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Коэффициент конкордации

⇐ ПредыдущаяСтр 11 из 59Следующая ⇒

Коэффициент конкордации является характеристикой связи между несколькими порядковыми признаками. Выборочное значение коэффициента конкордации между p ранжировками рассчитывается по формуле:

. (3.9)

Коэффициент конкордации часто используется для оценки согласованности мнений экспертов. Пусть p – количество экспертов, n – количество объектов, – ранг, присвоенный i -му объекту j -ым экспертом, , . Тогда – сумма рангов всех объектов, проставленных j -ым экспертом, ; – сумма рангов всех объектов, проставленных всеми p экспертами; – средний ранг объекта у p экспертов.

Пусть мнения экспертов полностью согласованы, причем первому объекту все эксперты дают ранг 1, второму – ранг 2, … n -му объекту – ранг n. Тогда – сумма рангов, проставленных p экспертами i -му объекту, . Вычислим сумму квадратов отклонений мнений экспертов от среднего ранга объекта при полной согласованности мнений экспертов:

Для того чтобы коэффициент конкордации принимал значение 1 при полной согласованности мнений экспертов, разделим на величину Получаем формулу (3.9).

Свойства коэффициента конкордации:

1. коэффициент конкордации принимает значения от 0 до 1 (ранжировки могут полностью совпадать, но не могут полностью не совпадать в том смысле, который вкладывается в это понятие при );

2. коэффициент конкордации равен 1 тогда и только тогда, когда все p ранжировок совпадают;

3. если и анализируемые ранжировки генерируются подобно случайному независимому p -кратному извлечению из множества всех возможных упорядочений n объектов, то связи между ними нет и ;

4. пусть – среднее значение коэффициента Спирмена, рассчитанное по значениям коэффициентов, характеризующих связь между всеми возможными парами ранжировок, тогда . В частности, при , т.е. коэффициент конкордации, вычисленный для двух ранжировок, пропорционален ранговому коэффициенту корреляции Спирмена.

Формула (3.9) используется для расчета выборочного значения коэффициента конкордации только в случае отсутствия объединенных рангов в рассматриваемых ранжировках. Если же таковые имеются, то используется следующая формула:

, (3.10)

где – поправочные величины, ;

– число групп неразличимых рангов в ранжировке ;

– число элементов, входящих в группу t неразличимых рангов.

После расчета выборочного значения коэффициента конкордации необходимо проверить значимость коэффициента. Для этого выдвигаются гипотезы:

(коэффициент конкордации между p порядковыми признаками незначим);

(коэффициент конкордации между p порядковыми признаками значим).

Для проверки нулевой гипотезы используется статистика , имеющая при справедливости гипотезы и объеме выборки распределение Хи-квадрат с числом степеней свободы .

Существуют и другие способы проверки значимости коэффициента конкордации [12].

3.3 Корреляционный анализ номинальных признаков: анализ двухфакторных таблиц сопряженности

Рассмотрим два категоризованных номинальных признака X и Y. Признак X может принимать значения ; признак Y – . Закон распределения случайного вектора можно представить в виде таблицы распределения вида:

\			…
			…
			…
…	…	…	…	…	…
			…
			…

где – вероятность того, что случайная величина Х примет значение , а случайная величина Y примет значение , , ;

– вероятность того, что случайная величина Х примет значение , , ;

– вероятность того, что случайная величина Y примет значение , , ;

Вероятности , , задают распределение вероятностей случайной величины Х; вероятности , , задают распределение вероятностей случайной величины Y. Ряд распределения случайной величины Х имеет вид:

			…
			…

Ряд распределения случайной величины Y имеет вид:

			…
			…

В силу случайности рассматриваемых признаков исход наблюдения имеет некоторую неопределенность. Возникает вопрос: можно ли предсказать значение, которое примет случайная величина при очередном наблюдении? Зная закон распределения случайной величины, можно в некоторой мере оценить надежность прогноза.

Например, две случайные величины X и Y имеют следующие законы распределения:


	0, 5	0, 5


	0, 9	0, 1

Из этих таблиц видно, что закон распределения случайной величины Y имеет значительно меньшую неопределенность и позволяет с высокой вероятностью предсказать, что результатом наблюдения будет значение .

Числовой характеристикой распределения дискретной случайной величины, которая может служить мерой его неопределенности, является энтропия закона распределения, определяемая формулой:

, где .

Энтропия зависит не от значений случайной величины, а только от их вероятностей и количества r возможных значений. Основание логарифмов может быть произвольным. Однако для сравнения энтропий различных распределений они должны вычисляться при одном и том же основании. В теории информации в качестве основания логарифмов принято брать 2.

Энтропии приведенных выше распределений при натуральных логарифмах принимают следующие значения: , .

Свойства энтропии:

1) , равенство достигается, когда случайная величина X принимает одно значение;

2) не меняется при взаимно-однозначных преобразованиях;

3) максимально, когда все возможные значения Х равновероятны.

По аналогии с одномерной случайной величиной энтропия пары случайных величин определяется следующим образом:

Свойства энтропии двумерного распределения:

1) ;

2) , причем равенство достигается, когда Х и Y независимы.

Пусть имеется выборка объема n из генеральной совокупности (Х, Y). Тогда эмпирическое распределение генеральной совокупности (Х, Y) может быть представлено в виде двухфакторной таблицы сопряженности признаков Х и Y размерности , имеющей вид [12, 15, 50, 42]:

\			…
			…
			…
…	…	…	…	…	…
			…
			…		n

где – наблюдаемая частота, т.е. число объектов в выборочной совокупности, характеризующихся i -ой категорией признака X и j -ой категорией признака Y, , ;

– маргинальная частота, характеризующая сколько объектов в выборочной совокупности обладают i -ой категорией признака X, , ;

– маргинальная частота, характеризующая сколько объектов в выборочной совокупности обладают j -ой категорией признака Y, , ;

Замечание: признаки X и/или Y могут быть измерены в порядковой или количественной шкале. В последнем случае для построения выборочной таблицы сопряженности наблюдаемые значения признаков должны быть сгруппированы в форме интервального вариационного ряда.

На практике применяют три метода отбора объектов в выборку.

1) Перекрестный отбор

Предполагается, что величины , , , имеют полиномиальное распределение с вероятностями и с фиксированным числом наблюдений . До сбора данных назначается только объем выборки. Многие выборочные обследования проводятся именно таким образом. Например, при изучении структуры потребительского спроса всех опрошенных можно классифицировать в зависимости от пола и потребительского предпочтения. Целью исследования является выяснение, зависимы признаки или нет.

2) Целевой отбор

Распределения строк , , …, , , рассматриваются как независимые выборки из полиномиальных распределений с вероятностями и фиксированным числом наблюдений . Такая организация данных возникает в том случае, когда сравниваются несколько одномерных распределений, представленных выборками фиксированного объема . Аналогично можно представить распределение столбцов , , …, , , с фиксированным числом наблюдений . Например, производится опрос разновозрастных групп населения об их отношении к проводимой в стране реформе пенсионного обеспечения. Ответ имеет три значения (категории): «поддерживаю», «не поддерживаю», «затрудняюсь ответить». Число опрашиваемых в группа фиксированного: – в возрасте от 20 до 40 лет, – от 40 до 60 лет, – от 60 до 80 лет.

3) Третья схема отбора объектов получается из первой схемы, когда число n является не фиксированной, а случайной величиной, подчиненной заданному закону распределения. В этом случае являются независимыми случайными величинами с заданным законом распределения.

⇐ Предыдущая 6 7 8 9 101112 13 14 15 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.