Полная версия

Главная

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ   >>

2.4.2. Оценки параметров многомерной генеральной совокупности

Выборку объема п из ^-мерной (k > 1) генеральной совокупности X можно представить в виде матрицы данных, строки которой рассматриваются как п независимых реализаций ^-мерного случайного вектора и которую будем обозначать также буквой X:

Таким образом, элементы ху матрицы X можно рассматривать либо как случайные (одномерные) величины (независимые но г), либо как конкретные наблюдаемые значения – координаты п точек в ^-мерном евклидовом пространстве (или п точек в А-мерном пространстве).

Приведем точечные оценки моментов генеральной совокупности, которые получили наибольшее практическое применение [4, 13].

Оценка начального момента т-го порядка l-й компоненты случайного вектора X) вычисляется по формуле, при т = 1 имеем среднюю арифметическую.

Оценка ковариационной матрицы 2 случайного вектора (матрицы выборочных дисперсий и ковариации) определяется как

причем– выборочная дисперсия 1-й компоненты случайного вектора; S/j – выборочная ковариация компонент / и j вектора. Вместо S употребляют также несмещенную оценку

При алгоритмизации задач многомерного анализа полезным может оказаться вычисление оценок параметров генеральной совокупности с использованием операций над матрицами.

Оценкакорреляционной матрицы К с элементами rtj, где оценка парного коэффициента корреляции между /-Й и j-й компонентами вектора, /, j = 1,.... k, имеет вид

или

Определения и понятия интервального оценивания можно перенести на случай векторного параметрас заменой доверительного интервала доверительной областью в соответствующем ш-мерном пространстве.

Доверительной областью вектора параметров 8 генеральной совокупности называется случайная область, полностью определяемая результатами наблюдений, которая с близкой к единице доверительной вероятностью (надежностью) у содержит неизвестное значение вектора 9.

Очевидно, что существует бесконечное множество доверительных областей, соответствующих одному и тому же значению у. Обычно стараются определить доверительные области, имеющие минимальные размеры при данной надежности у. Этому условию удовлетворяют области, симметричные относительно вектора оценок 0 параметров 0.

Основную трудность в построении доверительной области представляет определение законов распределений подходящих статистик. В настоящее время эти вопросы достаточно хорошо разработаны только для нормального распределения наблюдаемых случайных величин.

Доверительная область для вектора математического ожидания. Пусть по результатам п наблюдений из генеральной совокупности X с 6-мерным нормальным распределениемнайдены вектор средних х и несмещенная оценка S ковариационной матрицы. Требуется найти с вероятностью у доверительную область для 6-мерного вектора генеральных средних р.

Предположим, что ковариационная матрица известна. Найдем такую подходящую статистику, чтобы ее распределение было известным и по которой однозначно можно определить доверительную область.

Напомним, что для одномерной нормально распределенной генеральной совокупности доверительный интервал для р определяется из формул

где статистика t подчиняется стандартному закону. Последнее равенство можно переписать в виде

полагаяпри 6=1.

Полученное равенство обобщается на случай 6-мерной совокупности следующим образом:

Отметим, что статистика t2 имеет распределениес числом степеней свободы v = 6, где 6=1,2

Таким образом, с надежностью у можно утверждать, что вектор р накрывается доверительной областью, задаваемой неравенством

Пусть теперь ковариационная матрицанеизвестна.

Чтобы при 6=1 построить доверительный интерват для р, используют статистику

которая имеет ^распределение с v = n-l степенями свободы. Равенство можно переписать в эквивалентной форме:

По аналогии строится статистика Хотеллинга которую используют при построении доверительной области для вектора средних р:

(2.12)

где – матрица, обратная ковариационной матрице .

Учитывая, что F- и ^-распределения связаны соотношением

(2.13)

получим уравнение поверхности, ограничивающей доверительную область k генеральных средних с надежностью у:

где – точка F-распределения, соответствующая уровню значимости и числам степеней свободы к и п – к.

Уравнения (2.12) и (2.13) определяют /г-мерный эллипсоид (эллипс при к = 2) с центром х, так как его левая часть представляет собой положительно определенную квадратичную форму относительно р.

Пример 2.9

В таблице приведены данные о численности работников .v, и товарообороте фирмы x2 [13]

Численность работников

х

20

36

28

51

70

45

30

56

Товарооборот, млн руб.

*2

3,5

5,4

2,7

9.8

10,1

6.2

2,4

9,5

Найдем оценки математических ожиданий, дисперсии и коэффициента корреляции, доверительную область для вектора математических ожиданий с вероятностью у = 0,95.

Решение

Найдем средние арифметические:. Перейдем к центрированным величинам :

Отсюда

Итак, оценки дисперсий и средних квадратических отклонений следующие: Найдем выборочный коэффициент корреляции:

Обратная матрица кбудет иметь вид

Тогда согласно уравнению (2.13)

где Т(0,05; 2; 6) = 5,14 находим но таблице для а = 1 – у = 0,05 и чисел степеней свободы V, = 2 и v2 = 6.

После преобразований получаем уравнение эллипса

которое определяет границы доверительной области для вектора Пусть вектор X подчиняется ^-мерному распределению, где ковариационная матрица, и пусть С – матрица размерности k х / ранга /, причем. Тогда С'Х подчиняется /-мерному нормальному распределению, так как линейные комбинации нормально распределенных величин также распределены нормально.

В этом случае статистика Т2 имеет вид

(2.14)

Для вероятностивыполняется соотношение

Поскольку вектор Стц содержит / генеральных средних, то, в отличие от уравнения (2.13), теперь числа степеней свободы равны / и и – /. В частном случае, когда С – единичная матрица порядка k, уравнение (2.14) сводится к уравнению (2.13) и число степеней свободы становится равным, как и прежде, knn-k.

Использование линейных комбинаций компонент вектора р позволяет расширить область применения статистики Т2 Хотеллинга при интервальном оценивании в задачах сравнения.

С помощью линейных комбинаций можно, например, найти совместные доверительные интервалы или проверить гипотезу относительно первых () средних значений генеральной совокупности. Для этого достаточно принять

Поскольку С1 имеет размерность / х к и ранг /, то вектор С7р имеет размерность / х 1 и содержит / (/ < к) генеральных средних.

Чтобы построить доверительный интервал для генерального среднего р;, у = 1,2,.... к, достаточно принять, что С; естьj-й столбец единичной матрицы размерности к. Тогда С7р = р; и статистика Хотеллинга

имеют распределение, зависящее от чисел степеней свободы 1 и п – 1.

Таким образом, согласно уравнению (2.14), доверительная область дляс надежностью у будет ограничена поверхностью

В частности, с вероятностью у доверительные границы для линейной комбинации(гдеесть j-й столбец матрицы С) определяются как

Пример 2.10

По данным примера 2.9 с помощью линейных комбинаций найдем с надежностью у = 0,95 интервальные оценки генеральных средних р, и р:,.

Решение

Для нашего примера а = 1 – у = 0,05, v, = 1, v2 = и – 1 = 7. Согласно таблице /-'-распределения /'(0,05; 1; 7) = 5,59.

Для построения интервальной оценки средней р, примем С, = (1; О)7, так что С,х = 42; CfSCf = Of = 275,714. Тогда границы доверительного интервала для р, имеют вид

откуда 28.120 SP, <55,880.

Для построения интервальной оценки генерального среднего Pi принимаем откуда!.

Тогда с надежностью у = 0,95 границы доверительного интервала таковы; откуда 3,488 < р, < 8,912.

Определение совместной доверительной области для математического ожидания и дисперсии. Один из простых подходов в построении многомерной доверительной области состоит в определении таких интервалов для координатвектора параметров 0, для которых вероятность одновременного накрытия всех соответствующими интервалами была бы не меньше заданного значения у. Таким образом, речь идет о нахождении прямоугольной доверительной области для вектора 0 соответствующей надежности, не меньше чем у [13,30].

Введем события, и обозначим прямоугольную область в m-мсрном пространстве, образованную интервалами /,(0,), , через /(0). На основании свойств вероятностей получим

где– пересечение событий– объединение событий, противоположных событиям Aj.

Из этого неравенства следует, что для определения доверительной области достаточно найти доверительные интервалы для координат вектора 0, соответствующие доверительной вероятности . Тогда доверительная вероятность для всех параметров будет не меньше у.

Пусть для нормальной генеральной совокупности х с неизвестными параметрами р и ст взята случайная выборкаобъема п. Требуется с надежностью у найти (совместную) доверительную область для р и ст, т.е. для двумерного вектора параметров

По данным выборки найдем среднюю арифметическую х и среднее квадратическое отклонение 5. Тогда доверительные интервалы отдельно для математического ожидания р и среднего квадратического отклонения ст, отвечающие надежности у, имеют вид

(2.15)

(2.16)

где а = 1-у, ta и у} находятся по таблицам распределений Стьюдента и у} для числа степеней свободы v = я-1 и вероятностей а и соответственно.

Доверительную область для вектора 0 можно определить по формуле

(2.17)

где

Эта область представляет собой трапецию.

Для построения такой области с заданной доверительной вероятностью у можно руководствоваться следующим.

Так как при нормальном распределении генеральной совокупности х оценки х и s независимы, причем х имеет нормальное распределение – распределение х2 с v = п -1 степенями свободы, то

Определив Г ииз условий•, где С

произвольное число, найдем доверительную область вектора параметров 0 = j, соответствующую вероятности у.

По результатам контроля и = 14 изделий найдено, что средняя высота сальниковой камеры равна х = 88 мм, а 5 = 0,96 мм. Требуется определить доверительную область для вектора параметров с надежностью у = 0,95.

Решение

Для сравнения определим сначала с надежностью у – 0,95 доверительные интервалы для математического ожидания И и среднего квадратического отклонения о.

По таблице /-распределения для числа степеней свободы V – л -1 = 13 и уровня значимости а = 1-у = 0,05 находим Г =2,160. Согласно выражению (2.15) имеем

откуда 87,425 S р < 88,575.

По таблице х2-распределения для числа степеней свободы v = 13 и вероятности найдем верхнюю границу ~ 24,736 доверительного интервала для XJ Отсюда нижняя граница для о равна по формуле (2.16)

Для числа степеней свободы v = 13 и вероятностинайдем'.

Отсюда верхняя граница а имеет вид по формуле (2.16)

Таким образом, 0,722< ст < 1,605.

Чтобы определить доверительную область для вектора (р. а) с вероятностью у = 0,95,найдем по таблице интегральной функции Лапласа t = 2,24 из условия

По таблице ^-распределения находим

По формуле (2.17) найдем доверительную область:

Теперь для сравнения найдем прямоугольную доверительную область с коэффициентом доверия у = 0,95. Для этого по формулам (2.15) и (2.16) определим доверительные интервалы для р и а. соответствующие вероятности В результате получим

Стагпистичвской гипотезой называют непротиворечивое множество предположений о виде или параметрах неизвестных законов распределения генеральных совокупностей.

Если гипотеза однозначно определяет закон распределения вероятностей //„: F(x) – Fn(x), то она называется простой, в противном случае (//,,: /■'(.г) = F0(x, 9), 0 с 0О) – сложной.

Нулевой (Н0) называют выдвинутую гипотезу, которую нужно проверить, конкурирующей (альтернативной) (//]) – гипотезу, противоположную нулевой.

Статистическим критерием называют однозначно определенное правило, устанавливающее условия, при которых проверяемую гипотезу (//0) следует либо отвергнуть, либо не отвергнуть.

Основу критерия представляет специально составленная выборочная характеристика (статистика критерия) 6' = 0' (д:,, х2 х„), точное или приближенное распределение которой известно [28].

Пусть дана выборка хи х2, .... х„ объемом п. Каждый критерий разбивает все множество возможных значений статистики 0* = f(xt, х2, ..., х„) на два непересекающихся подмножества (области): критическую область (область отклонения гипотезы) и область принятия гипотезы.

Основной принцип проверки гипотезы: если наблюденные значения статистики критерия попадают в критическую область, то гипотезу отвергают. В противном случае гипотезу не отвергают.

Такой принцип проверки гипотезы не дает логического доказательства или опровержения гипотезы. При его использовании возможны четыре случая:

 
<<   СОДЕРЖАНИЕ   >>