Коэффициент ранговой корреляции Спирмена

До сих пор мы анализировали зависимость между двумя количественными переменными. Вместе с тем в практике эконометриста иногда встречаются случаи, когда необходимо установить тесноту связи между ординальными (порядковыми) переменными (например, качество жилищных условий, тестовые баллы, экзаменационные оценки и т. п.). В этом случае объекты анализа упорядочивают или ранжируют по степени выраженности измеряемых переменных. При этом каждому объекту присваивается определенный номер, называемый рангом. Например, объекту с наименьшим проявлением (значением) признака присваивается ранг 1, следующему за ним — ранг 2 и т. д. Если объекты ранжированы по двум признакам, то имеется возможность оценить тесноту связи между переменными, основываясь на рангах, т. е. тесноту ранговой корреляции.

Коэффициент ранговой корреляции Спирмена находится по формуле

где г,- и 5,- ранги /-го объекта по переменным Л' и Y; п — число пар наблюдений.

Если ранги всех объектов равны (г, = /=1,2,..., л), то р=1,

т. е. при полной прямой связи р=1. При полной обратной связи, когда ранги объектов по двум переменным расположены в обратном порядке, можно показать, что р=— 1. Во всех остальных случаях |р| < 1.

При ранжировании иногда сталкиваются со случаями, когда невозможно найти существенные различия между объектами по величине проявления рассматриваемого признака: объекты, как говорят, оказываются связанными. Связанным объектам приписывают одинаковые средние ранги, такие, чтобы сумма всех рангов оставалась такой же, как и при отсутствии связанных рангов. Например, если четыре объекта оказались равнозначными в отношении рассматриваемого признака и невозможно определить, какие из четырех рангов (4,5,6,7) приписать этим объектам, то каждому объекту приписывается средний ранг, равный (4+5+6+7)/4=5,5. В модификациях формулы (3.49) на связанные ранги вводятся поправки.

При проверке значимости р исходят из того, что в случае справедливости нулевой гипотезы об отсутствии корреляционной связи между переменными при я>10 статистика

имеет /-распределение Стьюдента с (п—2) степенями свободы. Поэтому р значим на уровне а, если >ti_a.n_2, где t-a? „-2 ~ табличное значение /-критерия Стьюдента, определенное на уровне значимости а при числе степеней свободы (я—2).

? Пример 3.6. По результатам тестирования 10 студентов по двум дисциплинам А и В на основе набранных баллов получены следующие ранги (табл. 3.4). Вычислить коэффициент ранговой корреляции Спирмена и проверить его значимость на уровне а=0,05.

Решение. Разности рангов и их квадраты поместим в последних двух строках табл. 3.4.

Таблица 3.4

Ранги по дисцшии- нам

Результаты тестирования студентов

Все-

го

1-й

2-й

3-й

4- й

5-й

6-й

7-й

8-й

9-й

10-й

Л

п

2

4

5

1

7,5

7,5

7,5

7,5

3

10

55

В

Si

2,5

6

4

1

2,5

7

8

9,5

5

9,5

55

п-

Si

-0,5

-2

1

0

5

0,5

-0,5

-2

-2

0,5

(П-

S,)2

0,25

4

1

0

25

0,25

0,25

4

4

0,25

39

6*39

По формуле (3.49) р = 1--= 0,763 .

Р 103-ю

Для проверки значимости р по формуле (3.50) вычислим

/ = 0,763 . ^ ^ - = 3,34 и найдем по табл. II приложений V1-0,7632

А),95;8 = 2,31. Так как t > /Ь,95;8> то коэффициент ранговой корреляции р значим на 5%-ном уровне. Связь между оценками дисциплин достаточно тесная. ?

Ранговый коэффициент корреляции р может быть использован и для оценки тесноты связи между обычными количественными переменными. Достоинство р здесь заключается в том, что нахождение этого коэффициента не требует нормального распределения переменных, линейной связи между ними. Однако необходимо учитывать, что при переходе от первоначальных значений переменных к их рангам происходит определенная потеря информации. Чем теснее связь, чем меньше корреляционная зависимость между переменными отличается от линейной, тем ближе коэффициент корреляции Спирмена р к коэффициенту парной корреляции /*.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >