Статистическая проверка гипотез для многомерных генеральных совокупностей
Сравнение вектора генеральных средних со стандартом. Рассматривается ^-мерная генеральная совокупность распределения Л'Др, X), где |х| * 0. По выборке объема п из этой генеральной совокупности определены вектор средних арифметических и несмещенная оценка s ковариационной матрицы 2.
Если ковариационная матрица известна, то для проверки гипотезы о равенстве вектора генеральных средних стандартному (заданному) значению Н0: р = р() против альтернативы Я,: р Ф р0 применяется статистика
имеющая распределение у} с числом степеней свободы = к при справедливости гипотезы Я0.
Если же ковариационная матрица 2 неизвестна, то можно воспользоваться статистикой Хотеллинга
Как уже было сказано, при истинности Н0 имеет место равенство
Поэтому для критической областиможно вычислить
с помощью таблиц Е-распределения.
Напоминаем, что применяемые статистики являются обобщениями соответствующих статистик для одномерной случайной величины. Это следует из того факта, что квадрат нормированной нормально распределенной (одномерной) случайной величины имеет распределение у} с одной степенью свободы, а квадрат случайной величины, имеющей Г-распределение Стьюдента, имеет f-распределение с числами степеней свободы 1 и п – 1.
Сравнение двух генеральных совокупностей. Генеральные совокупности однородны, если кроме одних и тех же признаков они имеют одинаковые законы распределения вероятностей.
Рассмотрим две нормально распределенные совокупности X и Y. Их распределения полностью определяются заданием параметров pr, 2Г и р(/, Х(/. Следовательно, для проверки однородности этих совокупностей достаточно сравнить их ковариационные матрицы 2Д. и 2,;. Затем в случае принятия гипотезы о равенстве этих ковариационных матриц надо сравнить генеральные средние рА и р совокупностей [13].
Для сравнения матриц генеральных коэффициентов ковариации проверяется гипотеза Н0: 2Д = £(/ против Я,: 2Д ■*- 2 с уровнем значимости а на основе выборок из совокупностей соответственно объемов пх и п„.
В качестве статистики критерия проверки берется случайная величина W = Ьа, где
Sx – несмещенная оценка ковариационной матрицы с элементами
Sv – несмещенная оценка ковариационной матрицы с элементами
– несмещенная оценка ковариационной матрицы, полученная по суммарной выборке, так как
При справедливости гипотезы Я0, достаточно больших пх и пу, а также при достаточно малой величине
статистика IT аппроксимируется распределением х2 с числом степеней свободы
Таким образом, критическая область имеет вид
Если WHa6,, = Ъа попадает в критическую область (Wlla6;l > W ), то гипотеза Я0: £г = 2(/ отвергается с вероятностью ошибки а. Тогда считается доказанным, что ковариационные матрицы £, и не равны и, следовательно, генеральные совокупности неоднородны.
Если Wm6!l не попало в критическую область < VVKp), го гипотеза Нп: Xr = не противоречит наблюдениям и обычно принимается, т.е. считается, что ковариационные матрицы £Л. и £ равны. После этого переходят к сравнению генеральных средних, т.е. к проверке на уровне значимости а гипотезы Я0: рд. = ц при Я,: рЛ ф р.
Для проверки применяется критерий, основанный на статистике Хотел- линга вида
Если гипотеза Я0: р, = р,, справедлива, то статистики Г2 и F связаны формулой
гденаходится по таблицам /•'- распределения Фишера – Снедекора с числом степеней свободы в числителе V|= к и в знаменателе
. Критическая область имеет вид
Если гипотеза Я0: рг = р отвергается с вероятностью ошибки а, то считается доказанной неоднородность генеральных совокупностей X и У. Если же гипотеза Я0: р, = р(/ не отвергается, то, принимая эту гипотезу, мы считаем, что генеральные совокупности однородны.
Пример 2.1
Сравним деятельность двух групп предприятий по показателям фондовооруженности и производительности труда на основе выборочных данных (в условных единицах), приведенных в табл. 2.3.
Таблица 2.3
Сравнение деятельности двух групп предприятий по показателям фондовооруженности и производительности труда, усл. ед.
Первая группа предприятий X |
Вторая группа предприятий Y |
||
фондовооруженность |
производительность труда дг2 |
фондовооруженность у у |
производительность труда у2 |
56 |
52 |
58 |
74 |
51 |
64 |
56 |
75 |
52 |
63 |
62 |
71 |
72 |
68 |
69 |
83 |
67 |
59 |
62 |
78 |
51 |
62 |
65 |
72 |
52 |
64 |
59 |
80 |
50 |
68 |
71 |
70 |
59 |
70 |
38 |
60 |
60 |
70 |
47 |
65 |
- |
74 |
60 |
|
59 |
76 |
Решение
Будем предполагать, что приведенные в табл. 2.3 выборки взяты из двумерных нормально распределенных генеральных совокупностей . с неизвестными параметрами
и
Проверим на уровне значимости а = 0,05 гипотезу о равенстве ковариационных матриц £д. и 2Д.. Вычислим оценки основных параметров двух генеральных совокупностей:
Для вычисления статистики критерия получим значения определителей матриц оценок ковариаций:
Тогда
Следовательно,
По таблицам распределениянайдем при
критическое значение
>. Так как
не попало в критическую область
, то мы гипотезу
не отвергаем и будем считать ковариационные матрицы генеральных совокупностей равными. Заметим, что в этом примере значение С, равное 0.0015316. подтверждает правильность аппроксимации распределения W распределением
Теперь можно проверить гипотезу о равенстве генеральных средних на уровне значимости а = 0,05 против альтернативы
Находим обратную матрицу для
Тогда наблюдаемое значение статистики Т2 есть а критическое значение
есть
Так как , гипотеза о равенстве векторов генеральных средних отвергается с вероятностью ошибки 0.05. Следовательно, можно считать доказанным, что генеральные совокупности неоднородны. Таким образом, есть основания на указание существенности различия в двух способах организации производства но данным выборки.