Полная версия

Главная

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ   >>

3.4. Канонические корреляции и канонические величины генеральной совокупности

Рассматриваемый в этом параграфе статистический подход определения взаимосвязи между двумя большими множествами величин является очень полезным, но на сегодняшний день недостаточно часто используемым на практике методом. При его использовании можно ограничиться рассмотрением небольшого числа наиболее коррелированных линейных комбинаций из каждого подмножества [13].

Взаимосвязь между этими подмножествами почти полностью описывается коэффициентом корреляции между несколькими первыми каноническими случайными величинами.

Суть метода. Для нахождения максимальных корреляционных связей между двумя группами случайных величин используют канонические корреляции. Каноническая зависимость определяется при помощи новых аргументов – канонических величин, вычисленных как линейные комбинации исходных признаков. Новые канонические величины выбираются таким образом, чтобы новые координаты непосредственно указывали значение корреляции. С этой целью в каждой группе находят линейные комбинации исходных величин, имеющие максимальную корреляцию. Эти линейные комбинации исходных величин и являются первыми координатами новых систем. Далее в каждой группе рассматриваются следующие линейные комбинации, у которых корреляция больше, чем между любыми другими линейными комбинациями, не коррелированными с первыми линейными комбинациями, и т.д. Построение продолжается до тех пор, пока не будут полностью получены две новые координатные системы.

Канонические корреляции используются для научного обоснования системы показателей при проведении многомерного статистического анализа, а также в качестве основного инструментария в каноническом факторном анализе.

Пример 3.10 [13]

Для пояснения многомерного метода канонических корреляций рассмотрим многомерный случайный нормированный вектор X порядка к (с дисперсиями компонент, равными единице, и математическими ожиданиями, равными нулю) и положительно определенной корреляционной матрицей R.

Вектор X разбивается на два подвектора, имеющие размерностии, где

Будем считать, что подвекторсодержитпризнаков, относящихся к характеристикам эффективности производства: фондоотдача, производительность труда, себестоимость продукции и т.д., а подвекторсодержит признаки-аргументы, характеризующие такие факторы производства, как составляющие материальных и трудовых затрат, организационные, технологические и др.

Задача заключается в выявлении максимальных связей между этими двумя группами показателей.

Введем новые переменные (канонические величины) V и U, которые представляют собой линейные комбинации результативных показателей-компонент подвектора и аргументов-признаков .

Общая корреляционная матрица вектора X будет состоять из подматриц, которые используются для решения задачи:

где – корреляционная матрица группы показателей эффективности (размерности); – корреляционная матрица показателей-аргументов (размерности ); и – матрицы взаимных корреляций первой и второй групп признаков. связанные соотношением

Определим собственные значения и собственные векторы с использованием корреляционной матрицы исходных признаков размерности

где и – соответствующие обратные матрицы.

Собственные значения матрицы В ранжированы по убыванию и равны квадратам канонических корреляций.

Так как метод канонических корреляций является обобщением множественной корреляции, обратимся к множественной корреляции, которая является мерой связи между одной случайной величиной и множеством других случайных величин. Как было рассмотрено выше, коэффициент множественной корреляции является максимальной корреляцией между одной случайной величиной и линейной комбинацией других случайных величин. Это свойство было обобщено Г. Хотеллингом (стоявшим у истоков разработки метода главных компонент) для случая связи между множествами случайных величин.

Рассмотренный статистический подход очень полезен, если у исследователя имеется два больших множества величин и он хочет определить взаимосвязи между ними. При этом можно ограничиться рассмотрением небольшого числа наиболее коррелированных линейных комбинаций из каждого подмножества.

Взаимосвязь между этими подмножествами почти полностью описывается коэффициентом корреляции между несколькими первыми каноническими случайными величинами.

 
<<   СОДЕРЖАНИЕ   >>