Статистическая проверка гипотез

Пусть Х,#2, •• • )хп ~~ случайная выборка значений случайной величины имеющей некоторое полностью или частично неизвестное распределение F(x). В предыдущем подразделе рассматривались методы получения оценок параметров или характеристик этого неизвестного распределения. Однако часто нас интересуют не столько конкретные количественные оценки, сколько правильность или ошибочность некоторых утверждений, относящихся к распределению наблюдаемой случайной величины. Например, является ли это распределение нормальным или нет? Равно математическое ожидание заданному значению или нет? Если кроме выборки xi,X2, ...,жп имеется выборка T/i,t/2i • • ‘ чУп значений другой случайной величины Г), то можно поставить вопрос о том, равны или нет математические ожидания случайных величин ? и г). Если имеется выборка (xi,yi), 22 • • • ЛхпчУп) двумерной случайной величины (5,т)), то может возникнуть вопрос о равенстве нулю коэффициента корреляции между ? и т).

Логика проверки статистических гипотез

Решению задач проверки гипотез о генеральном распределении по выборке из этого распределения посвящен специальный раздел математической статистики — проверка статистических гипотез. Логика проверки гипотез в математической статистике (она напоминает логику доказательства от противного) состоит в следующем. Вначале предполагается, что проверяемая гипотеза (ее принято называть нулевой гипотезой и обозначать Яо) верна. В этом предположении ищется распределение вероятностей некоторой функции д(х,х2, ... , хп) от значений выборки, называемой статистикой критерия (правило проверки гипотезы принято называть критерием), и в области значений этой статистики выделяется некоторая область W, называемая критической областью, такая, что вероятность Р(д 6 W) попадания выборочного значения статистики д в эту область не превосходит заданного малого значения ос, называемого уровнем значимости критерия (обычно полагают а равным 0,05 или 0,01). Если для данной конкретной выборки д попадает в критическую область W, то гипотеза Яо отвергается (говорят — «отвергается на уровне значимости а»), поскольку вероятность этого события, если в действительности верна Яо, мала. Если д не попадает в критическую область W, то говорят, что «гипотеза Яо не отвергается на уровне значимости а» или «полученные данные не дают оснований отвергнуть гипотезу Яо на уровне значимости а».

Очевидно, что можно разными способами задать статистику критерия д{х,Х2, ... п), а для заданной статистики — разными способами выбрать критическую область W, удовлетворяющую условию Р(д 6 W) = ос. Поэтому следует выбирать д и W в некотором смысле наилучшими из возможных, а именно такими, чтобы полученный критерий был наиболее мощным.

Для определения понятия мощности критерия введем понятие альтернативной гипотезы Н, т.е. гипотезы, которая выполняется, если не выполняется нулевая гипотеза Яо. Тогда в терминах правильности или ошибочности принятия Яо и Н можно указать четыре потенциально возможных результата применения критерия к выборке (табл. 2.3).

Как видим, мощность критерия — это вероятность принятия при применении данного критерия альтернативной гипотезы Н при условии, что она верна. Очевидно, что при фиксированной вероятности ошибки 1-го рода (ее задаем самостоятельно, и она не зависит от свойств критерия) критерий будет тем лучше, чем больше его мощность (т. е. чем меньше вероятность ошибки 2-го рода).

Проиллюстрируем основные понятия рассмотренной методологии на простом примере проверки гипотезы о равенстве маТаблица 2.3

Возможные результаты применения критерия к выборке

Верна

Принята гипотеза

гипотеза

Но

Я,

Но

1 — а — вероятность правильно принять Но, когда верна Но

а — вероятность ошибочно принять Н1, когда верна Я0 (вероятность ошибки 1-го рода, уровень значимости)

Hi

[3 — вероятность ошибочно принять Но, когда верна Hi (вероятность ошибки 2-го рода)

1 —(3 — вероятность правильно прштять Hi, когда верна Hi (мощность критерия)

тематического ожидания нормально распределенной случайной величины с известной дисперсией заданному числу (с точки зрения практического применения этот пример несколько искусственен, поскольку дисперсия наблюдаемой случайной величины обычно неизвестна).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >