Полная версия

Главная arrow Статистика arrow МАТЕМАТИЧЕСКАЯ СТАТИСТИКА ДЛЯ СОЦИОЛОГОВ

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Методологические аспекты проверки математико-статистических гипотез

Ошибки первого и второго рода

Надеемся, читателю ясно, что принятие решения на основе проверки той или иной математико-статистической гипотезы //„ носит вероятностный характер. Мы можем совершить две ошибки: отвергнуть верную гипотезу и принять неверную. Какова вероятность каждой из этих ошибок? Как уменьшить эти вероятности? Попытаемся ответить на эти вопросы.

Прежде всего напомним, что, если значение используемого критерия попало в «маловероятную» область (т.е. «зашкалило» за соответствующее критическое, табличное значение, вероятность чего мала при справедливости Н0, меньше выбранного уровня значимости а), гипотеза отвергается. Новедь наш уровень значимости не равен нулю. Пусть очень редко, но значение критерия для конкретной выборки все же может «зашкалить» за найденное нами критическое значение и при справедливости /?0. Тогда отказ от #0будет ошибкой: гипотеза верна, а мы ее отвергли. Эта ошибка называется ошибкой первого рода. Представляется очевидным, что вероятность совершения такой ошибки равна а. Очевидно, что мы можем этой вероятностью управлять. Если из содержательных соображений для нас является важным недопущение отказа от справедливой гипотезы, будем уменьшать значение а и, соответственно, увеличивать критическое значение критерия.

А в каких случаях можем принять в действительности неверную гипотезу, т.е. совершить ошибку второго рода? Чтобы разобраться с этим, введем понятие мощности критерия и поясним, что это такое, на примере.

Рассмотрим один из возможных способов проверки затронутой в п. 10.3 гипотезы Н0: р = 0. В качестве альтернативной рассмотрим гипотезу Ну р 5* 0. Ясно, что эта гипотеза — не направленная и критерий будет двусторонним. Поэтому при а = 0,05 табличное значение будем считать для ~ - 0,025. Воспользуемся рассуждениями Гласса и Стэнли из книги: «Статистические методы в педагогике и психологии».

Обратимся к рис. 11.1. Известно, если в генеральной совокупности (для приводимых ниже рассуждений требуется, чтобы нашим признакам отвечало двумерное нормальное распределение) коэффициент корреляции равен нулю (т.е. если наша нуль-гипотеза верна), то всевозможные выборочные значения этого коэффициенталля выборки объема п будут иметь приблизительно нормальное распределение с нулевым средним и стандартным отклонением, равным 1 „

I- . Так, если п = 200, стандартное отклонение о распределения

V/1- I

выборочных коэффициентов корреляции будет равно примерно 0,071. И мен но такое распределение изображено слева на рис. 11.1. Нетрудно проверить также, что площадь под «хвостом» этого распределения, равная 0,025, будет располагаться правее величины г=0,14 (соответствующеетабличное значение, равное, как известно 1, 96, будучи умноженным на среднее квадратическое отклонение, равное 0,071, даст 0,14). Значит, в соответствии с описанной ранее логикой проверки статистических гипотез, будем отклонять нашу #0, если|гвмб| а 0,14. Если наша гипотеза верна, и, следовательно, распределение выборочных коэффициентов корреляции совпадаете левым распределением (см. рис. 11.1), риск сделать ошибку первого рода возможен с вероятностью 0,05. [1]

Пример мощности критерия для //

Рис. 11.1. Пример мощности критерия для //0: р = 0 против //,: р * О в случае, когда р = 0,20 (п =200, а = 0,05); г — г*"6

Источник: Гласс Дж., Стэнли Дж. С. 259 (рис. 13.6).

А теперь представим, что в действительности в генеральной совокупности коэффициент корреляции равен не нулю, а, скажем, 0,2. Тогда распределение выборочных коэффициентов корреляции будет совпадать с правой кривой (соответствующее отбудет несколько меньше, чем у левой кривой, но на этом мы останавливаться не будем). Мы об этом не знаем и продолжаем использовать обычную логику принятия или отвержения гипотезы. Естественно, если в такой ситуации мы примем нашу гипотезу, тем самым совершим ошибку второго рода. Мы ошибемся именно таким образом, если наш единственный выборочный коэффициент корреляции попадет в интервал от-0,14 до + 0,14. Чтобы оценить вероятность этой ошибки, ошибки второго рода, вспомним, что в действительности распределение выборочных средних совпадаете правой кривой (см. рис. 11.1). И вероятность попадания единственного выборочного значения коэффициента корреляции будет равна соответствующей площади под правой кривой. На рис. 11.1 она отмечена буквой «р». Это и есть вероятность ошибк и второго рода. Мы видим, что она не очень велика. Это означает, что довольно большой является величина (1 - Р). Она называется мощностью критерия. На рис. 11.1 мощность критерия равна заштрихованной площади и составляет примерно 0,82.

Таким образом, для того чтобы вероятность ошибки второго рода была мала, необходимо, чтобы мощность критерия была велика. Ясно, что мощность критерия равна вероятности отвергнуть неверную нуль- гипотезу.

Чтобы более ярко представить себе, что такое мощность критерия, предположим, что в реальности генеральное значение коэффициента корреляции равно 0,1. Тогда ситуация, подобная только что рассмотренной, будет иметь вид, представленный на рис. 11.2.

Пример мощности критерия для Н

Рис. 11.2. Пример мощности критерия для Н0: р = 0 против //,: р * 0 в случае, когда р = 0,10 {п = 200, а = 0,05)

Источник: Гласс Дж., Стэнли Дж. С. 260 (рис. 13.7).

Как и ранее, принимаем нуль-гипотезу (и тем самым совершаем ошибку второго рода), если единственный выборочный коэффициент попадет в интервал от —0,14 до +0,14. Фактическая вероятность этого равна заштрихованной площади под правой кривой на рис. 11.2 (ведь в действительности именно эта кривая отвечает распределению выборочных значений коэффициентов корреляции). (3, равная вероятности совершения ошибки второго рода, велика, мощность критерия, равная (1— Р), мала.

Кривая мощности критерия для //

Рис. 11.3. Кривая мощности критерия для //0: р = 0 против //,: р * 0 при п = 200 и а = 0,05

Источник: Гласс Дж., Стэнли Дж. С. 261 (рис. 13.8).

Рассмотрим график на рис. 11.3. По горизонтали откладываются значения генеральных коэффициентов корреляции. По вертикали — вероятность отвергнуть неверную нуль-гипотезу, т е. мощность критерия. Надеемся, что читателю понятен смысл этой кривой.

Если в генеральной совокупности коэффициент корреляции близок к нулю, очень мала будет вероятность отвергнуть нашу нулевую гипотезу (эта вероятность будет равна выбранному уровню значимости). Это означает, что мощность критерия мала: велика величина (3, т.е. вероятность принятия Н0. Если генеральный коэффициент корреляции достигаетО,3 и выше, вероятность отвержения нуль-гипотезы становится близкой к единице.

Все сказанное можно свести в таблицу (табл. 11.1).

Таблица 11.1 Виды ошибок, возникающих при проверке статистической гипотезы

Исследовательское

решение

Состояние природы

Я, верна

Я, верна

Отвергнуть Я„ (принять Я,)

Ошибка первого рода (вероятность = а)

Правильное решение (вероятность = 1 - (5)

Отвергнуть Я, (принять HJ

Правильное решение (вероятность = 1 - «)

Ошибка второго рода (вероятность=р)

а — уровень значимости, (1 - р) — мощность критерия.

  • [1] Это утверждение носит лишь приблизительный характер. В других работахдаются другие оценки характеристик распределения значений /**•*. Например, вучебнике (Айвами С.А., Мхитарян В.С. Теория вероятностей и прикладная статистика. С. 408) говорится о том, что в случае совместной нормальной распределенностиисследуемых переменных и при достаточно большом объеме выборки п (а именнопри я>200) распределение г можно считать приближенно нормальным со средним, (| - г7)2 равным своему генеральному значению, и дисперсией о2 --. При малых п и п | гI, близкому к единице, это приближение становится очень грубым. В любом случае проверку гипотезы Н{): р = 0 лучше осуществлять с помощью критерия te ? (см.п. 10.3).
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>