Полная версия

Главная arrow Статистика arrow СТАТИСТИКА

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

СТАТИСТИЧЕСКИЙ АНАЛИЗ МНОГОМЕРНЫХ ДАННЫХ

В результате освоения данной темы студент должен:

знать

• методы статистического анализа взаимосвязей между признаками, формулы расчета в случае многомерных данных коэффициентов корреляции и регрессии, методы классификации и формулы расчета расстояния между объектами и кластерами;

уметь

• рассчитывать парные, частные и множественные коэффициенты корреляции, коэффициенты множественного линейного уравнения регрессии, расстояния между объектами и кластерами, интерпретировать полученные результаты;

владеть

• категориями, понятиями и методами анализа многомерных данных.

Анализ степени зависимости многомерных данных

В случае многомерных данных анализ степени зависимости переменных сводится к определению парных, частных и множественных коэффициентов корреляции и детерминации.

Парный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными на фоне действия всех остальных показателей, входящих в модель.

Частный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными при исключении влияния всех остальных показателей, входящих в модель.

Парные и частные коэффициенты корреляции изменяются от -1 до +1, причем чем ближе коэффициент корреляции к +1, тем сильнее зависимость между переменными. Если коэффициент корреляции больше нуля, то зависимость прямая, а если меньше нуля — обратная.

Множественный коэффициент корреляции характеризует тесноту линейной связи между одной переменной (результативной) и остальными (аргументами), входящими в модель. Он изменяется от 0 до 1.

Множественный коэффициент детерминации, равный квадрату множественного коэффициента корреляции, характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных (аргументов), входящих в модель.

Пусть имеются данные по п наблюдениям и каждое i наблюдение характеризуется значениями переменных (.га, ха,..., ху,..., xik), где х1} — значение j-й переменной для i-го наблюдения (г = 1, 2, ..., п). Таким образом, исходной для анализа является матрица:

размерности (п ? k), i строка которой характеризует i наблюдение (объект) по всем к показателям (j - 1, 2,k).

По данным матрицы определим: вектор средних (.г), вектор средних квадратических отклонений (л) и корреляционную матрицу (R) порядка к:

Матрица парных коэффициентов корреляции R симметричная (r;e = rej) и положительно определенная, где:

Здесь — значение г-го наблюдения у-го фактора; rt! парный коэффициент корреляции, характеризует тесноту линейной связи между показателями Xj И X/.

По корреляционной матрице (R) находим частные и множественные коэффициенты корреляции любого порядка. Например, частный коэффициент корреляции (к - 2)-го порядка между факторами Х и х2 составляет

где Rji — алгебраическое дополнение элемента rie корреляционной матрицы R. При этом /ф = (-1 у+ / • М;/, где Мц — минор, определитель матрицы, получаемой из матрицы R, путем вычеркиванияу-й строки и /-го столбца.

Множественный коэффициент корреляции (k - 1)-го порядка фактора (результативного признака) Хх определяется по формуле

где R — определитель матрицы R.

Деятельность п = 8 карьеров характеризуется себестоимостью 1 т песка (xt), сменной добычей песка (х2) и фондоотдачей (х3). Значения показателей представлены в таблице.

Xj, тыс. руб.

30

20

40

35

45

25

50

30

х2, тонн

20

30

50

70

80

20

90

25

*3

20

25

20

15

10

30

10

20

Оцените степень зависимости между переменными посредством парных, частных и множественных коэффициентов корреляции и детерминации.

Решение. Найдем значения средних арифметических (Xj), среднеквадратических отклонений (Sj), где j = 1, 2, 3, а также парных коэффициентов корреляции г12* г13 и г23 по формулам

_ 1 п

где х{х2 = — ^xnxi2 = —(30 • 20 + 20 • 30 + 40 • 50 +... + 30 • 25) = 1875. п ,=j 8

В результате расчетов получим

Найдем значения частных коэффициентов корреляции. Первоначально определим

где Rn алгебраическое дополнение элемента г12 корреляционной матрицы R Rl{ и R22 алгебраические дополнения 1-го и 2-го диагонального элементов этой матрицы;

Аналогично находим г13/2 = -0,462 и г23/1 = -0,494.

Исчислим значение множественного коэффициента корреляции по формуле где R — определитель корреляционной матрицы;

Таким образом, себестоимость песка {х{) сильно зависит от его сменной добычи 2) и фондоотдачи (лг3). Множественный коэффициент детерминации, равный 0,81, показывает, что 81% вариации хх обусловлено влиянием х2 и х3.

 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>