Измерение тесноты связи

Часто приходится рассматривать сведения не об одном показателе, а брать их во взаимосвязи и пытаться понять, есть взаимосвязь между показателями или нет. В этом случае один показатель рассматривается как фактор и обозначается х, а другой — как результат и обозначается у.

В том случае, если х и у — количественные переменные, то связь между ними может измеряться коэффициентом парной корреляции. Это симметричная мера, т.е. г^ = гух. Коэффициент корреляции может быть, как меньше нуля, < 0 — в случае обратной связи (рис. 3.5, А), так и больше нуля, гху> 0 — в случае прямой связи (рис. 3.5, В). По абсолютной величине коэффициент корреляции изменяется от нуля до единицы: чем ближе значение к единице, тем теснее связь между х и у. Для выяснения наличия и характера связи строится поле корреляции, т.е. поле точек: каждая точка соответствует наблюдению, координаты соответствуют значениям переменных х и у.

Поле корреляции

Рис. 3.5. Поле корреляции

пз

Если корреляция отсутствует, то точки на поле корреляции будут расположены хаотично, (рис. 3.5, С).

Рассмотрим расчет коэффициента корреляции на примере измерения взаимосвязи между затратами на рекламу и прибылью в сетях кофеен формата «Кофе с собой». В табл. 3.5 приведены данные для расчета.

Таблица 3.5

Исходные данные

№ сети кофеен

Затраты на рекламу х, тыс. руб.

Прибыль у, тыс. руб.

1

3495

44 920

2

3750

34 080

3

2525

22 750

4

3850

34 680

5

4384

25 640

6

4026

26 243

7

5926

53 380

Итого

27 956

241 693

Среднее значение

3994

34 528

Среднее квадратическое

1031

11 180

отклонение

Построим поле корреляции по приведенным выше данным. На рис. 3.6 видно, что в данном случае связь между затратами на рекламу и прибылью прямая: в среднем с ростом затрат на рекламу наблюдается рост прибыли.

Поле корреляции

Рис. 3.6. Поле корреляции: затраты на рекламу и прибыль

Измерение корреляционной связи основано на отклонении от средних по одной и другой переменным (т.е. на ковариации). В случае линейной связи теснота связи между х и у измеряется с помощью коэффициента парной корреляции:

где х, — значение факторного признака для i-ой кофейни; у{ — значение результативного признака для i-й кофейни; х — среднее значение признака-фактора; у — среднее значение результативного признака.

Разделив числитель и знаменатель на п — число наблюдений, получим

На основе данных табл. 3.5 рассчитаем коэффициент парной корреляции между затратами на рекламу и прибылью:

Полученное значение коэффициента корреляции показывает, что связь между затратами на рекламу и прибылью является прямой и заметной, так как |г| > 0,6.

Интерпретация значений коэффициента корреляции в соответствии с его значениями дается на шкале Чеддока: если коэффициент корреляции находится в интервале от 0,1 до 0,3, то связь считается слабой; 0,3—0,5 — умеренной; 0,5—0,7 — заметной; 0,7—0,9 — высокой; 0,9— 0,99 — весьма высокой.

Квадрат коэффициента корреляции г2 представляет собой коэффициент детерминации. Коэффициент детерминации часто более предпочтителен для измерения связи, так как он может быть использован для измерения не только линейных, но и нелинейных связей. Коэффициент детерминации может быть выражен в процентах. В рассматриваемом примере г2 = 0,422, или, иначе говоря, на 42,2% прибыль кофеен зависит от затрат на рекламу.

В примере рассмотрено только семь кофеен, т.е. выборка — малая. Поэтому нужно проверить, что полученное значение коэффициента корреляции неслучайно.

В генеральной совокупности коэффициент корреляции обозначается р.

Проверим гипотезу, что в генеральной совокупности корреляция не отличается от нуля:

Н0 — нулевая гипотеза, которая проверяется с доверительной вероятностью 95%.

Проверка нулевой гипотезы проводится с помощью t-критерия:

t-статистика подчиняется распределению Стьюдента со степенями свободы df=n - 2.

Для проверки гипотезы нужно установить уровень значимости а = 0,05, или 5% (доверительная вероятность 95%).

Рассчитаем значение t-статистики:

Табличное значение равно гтабл =2,306 (d/ = 7- 2 = 5, а = 0,05). Поскольку Цак1 > tTa6jl, нулевая гипотеза Н0 отклоняется.

Таким образом, наблюдаемая корреляция является статистически значимой, т.е. затраты на рекламу и прибыль — действительно взаимосвязанные переменные.

Использование t-критерия для проверки значимости коэффициента корреляции предполагает, что объем выборки достаточно велик. При сравнительно небольших объемах выборки (до 30 ед.) и г > 0,4 рекомендуется применить z-преобразование:

и перейти от значения коэффициента корреляции к значению величины z. Если справедлива нулевая гипотеза Н0 о незначимое™ коэффициента корреляции между переменными х и у, то z-преобразование имеет приближенно стандартное нормальное распределение. Поэтому если а — заданный уровень значимости критерия и U а — квантиль

  • 1_2
  • 1 а

порядка 1-— стандартного нормального распределения, то нулевая

гипотеза Н0 принимается при выполнении неравенства |z| <U а. В про-

~ 2

тивном случае гипотеза Н0 отклоняется и принимается альтернативная гипотеза значимости коэффициента корреляции между хиу.

Использование метода измерения корреляции более подробно рассмотрено в главе 6. Еслих иу можно поставить в отношение «причина — следствие», то возможно построить уравнение зависимости у от х.

Парное уравнение линейной регрессии будет иметь вид у = а+Ьх, где а — свободный член, а b — коэффициент регрессии, который показывает, на сколько единиц в среднем изменяется результат при изменении фактора на одну единицу. Величины а и b называются параметрами уравнения регрессии.

Для расчета параметров уравнения регрессии можно воспользоваться функцией «анализ данных, регрессия» в пакете Microsoft Excel.

По данным рассматриваемого примера получаем уравнение^=6394 + + 7,05х. Таким образом, с увеличением затрат на рекламу на 1 тыс. руб. прибыль растет в среднем на 7,05 тыс. руб.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >