СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ

9.1. Основные понятия теории проверки гипотез

Задача построения доверительных областей для параметров распределения родственна задаче проверки гипотез об этих параметрах. Ясно, что никаких точных утверждений о параметрах распределения по результатам выборки делать нельзя, так как частота события, полученная в результате опыта, практически всегда отличается от его вероятности. Можно лишь высказывать различные предположения о них — гипотезы.

Определение 9.1. Статистической гипотезой называется любое утверждение о виде или параметрах распределений, наблюдаемых в эксперименте.

Задача проверки статистических гипотез состоит в том, чтобы установить, противоречит принятая гипотеза экспериментальным данным или нет.

Различают гипотезы, которые содержат одно предположение и более одного предположения.

Простой называется гипотеза, содержащая только одно предположение (однозначно определяющая распределение выборки).

Сложной называется гипотеза, состоящая из конечного или бесконечного числа простых гипотез.

Пример 9.1. Пусть (xv х2,..., хп) — выборка из ГС, распределенной нормально с параметрами , а2). Тогда гипотеза о том, что а = 0, будет простой, а гипотеза а > 0 — сложной.

Пример 9.2. Имеется выборка х2у..., хп) из ГС с ФР /%(х), причем F^(x) — неизвестна. Гипотеза о том, что F^(x) = F0(x), является простой, а гипотеза F^(x) е Т7, где F — множество функций распределения, — сложной.

Выдвинутую гипотезу называют обычно основной, или нулевой и обозначают #0 (например, Н0: а = 0). Наряду с выдвинутой гипотезой часто рассматривают противоречащую ей гипотезу. Такую гипотезу называют конкурирующей, или альтернативной и обозначают Нх.

Пример 9.3. Пусть нулевая гипотеза состоит в том, что математическое ожидание нормального распределения а = 10, тогда конкурирующая гипотеза, в частности, может состоять в предположении, что а * 10. Коротко записывается так: Н0 :а = 10; Нх :аФ 10.

Выдвинутая гипотеза может быть правильной или неправильной. В итоге статистической проверки нулевой гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены ошибки двоякого рода. Ошибка I рода состоит в том, что нулевая гипотеза будет отвергнута, в то время как в действительности она верна. Ошибка II рода состоит в том, что нулевая гипотеза будет принята, в то время как в действительности она неверна.

Если для исследуемого явления сформулирована та или иная гипотеза #0, то задача состоит в том, чтобы отыскать такое правило, которое позволяло бы по результатам наблюдений принять или отклонить эту гипотезу. Правило, согласно которому проверяемая гипотеза #0 принимается или отвергается, называется статистическим критерием или просто критерием проверки гипотезы #0. Разработка таких правил и их обоснование с точки зрения требований оптимальности и составляют предмет теории проверки гипотез. В основе критерия лежит использование специально подобранной статистики D = D(x{, х2п) (ее называют статистикой критерия), точное или приближенное распределение которой в случае справедливости #0 известно. После выбора статистики критерия множество всех возможных ее значений, определяемых ее распределением, разбивают на два непересекающихся подмножества: одно из них содержит значения статистики, при которых Н0 отвергается, а другое — при которых она принимается.

Определение 9.2. Множество значений статистики критерия Д при которых гипотезу отвергают, называется критической областью (обозначение — К).

Совокупность значений статистики критерия, при которых гипотезу принимают, называется областью принятия решения. Точки, отделяющие критическую область К от области принятия решения, называются критическими. Далее на основе реализации выборки х, х2, хп) вычисляется значение статистики Д которое называется наблюдаемым и обозначается Д1абл. Если наблюдаемое значение принадлежит критической области К, то нулевую гипотезу отвергают. В противном случае говорят, что гипотеза не противоречит экспериментальным данным. Естественно, критическую область К выбирают таким образом, чтобы вероятность попасть в нее при справедливости гипотезы #0 была мала, т.е. P{D е К/Н0} = а, где а — мало; а называется уровнем значимости. Таким образом, по своему смыслу критическая область содержит все маловероятные при гипотезе Я0 значения статистики критерия.

Уровень значимости а можно считать вероятностью ложного отвержения гипотезы #0, когда она на самом деле верна. Следовательно, а есть вероятность ошибки Iрода. Ошибку II рода мы допускаем, когда принимаем #0, в то время как верпа Нх; тогда вероятность ошибки Ирода Р = P{D ? К/Н{).

Мощностью критерия W называется вероятность несовершения ошибки второго рода, т.е. W = 1 - Р = P{D е К/Н{}.

Обычно критическую область К определяют так, чтобы мощность критерия была максимальна, т.е. P{D е К/НJ —» шах.

Из всего вышесказанного можно предложить следующий алгоритм проверки статистической гипотезы.

  • 1. Формулировка основной и, если необходимо, альтернативной гипотез.
  • 2. Выбор статистики критерия D для проверки гипотезы #0, распределение которой при справедливости /70 известно.
  • 3. Определение критической области К на основе знания распределения статистики D.
  • 4. Вычисление на основе реализации выборки ?)набл = D(pc^ х2,..., хп).
  • 5. Принятие статистического решения.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >