Полная версия

Главная arrow Статистика arrow МАТЕМАТИЧЕСКАЯ СТАТИСТИКА ДЛЯ СОЦИОЛОГОВ

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Логика проверки статистической гипотезы. Использование принципа невозможности реализации маловероятных событий

К приведенным рассужденим, на наш взгляд, читателю было бы целесообразно обратиться дважды: сейчас и после прочтения параграфов, посвященных описанию способов проверки конкретных гипотез.

Для примера заметим, что в качестве проверяемой статистической гипотезы в описанной выше ситуации можетфигурировать гипотеза отом, что в генеральной совокупности наши средние (т.е. математические ожидания зарплат для мужчин и для женщин) равны. Проверяемая гипотеза обозначается Н0 и называется нуль-гипотезой. Заметим, что не для каждой интересующей социолога гипотезы математическая статистика предоставляет возможность ее проверки, не для каждой гипотезы разработана соответствующая теория. Но если упомянутая возможность существует, соответствующая логика рассуждений сводится к следующему.

Мы предполагаем, что для генеральной совокупности гипотеза верна. Изучаем выборку. Если выборочная ситуация резко отличается оттого, чтодолжнобыть в генеральной совокупности при условии справедливости гипотезы, гипотеза отвергается; если это отличие мало — гипотеза принимается (подчеркнем, что гипотезу не доказывают, а считают, что выборочные данные не дают оснований ее отвергнуть). Конечно, здесь возникают по крайней мере два вопроса: что значит «выборочная ситуация», что значит «большое» или «малое» отличие выборочной ситуации от генеральной.

Прежде всего вспомним термины «параметр» и «статистика» и будем выборочную ситуацию описывать с помощью некоторых статистик, в то время как проверяемая гипотеза будет касаться определенных предположений о характере параметров генеральных распределений изучаемых (одномерных и многомерных) случайных величин.

Предположим, что мы хотим проверить некую гипотезу Н0, для которой существует упомянутая выше теория. Последнее означает, что математическая статистика предлагает нам критерий, представляющий собой определенную статистику/ — числовую функцию от наблюдаемых величин, например, рассчитанную на основе частот выборочной таблицы сопряженности ;

Представим, что у нас имеется много выборок (при доказательстве используемых нами положений математической статистики предполагается, что выборок — бесконечное количество), для каждой из которых вычисляется значение функции/ Распределение таких функций в предположении, что Я0 верна, хорошо изучено, т.е. известно, какова вероятность попадания каждого значения в любой интервал. Проще говоря, это означает, что для каждого полученного для конкретной выборки значения/ пользуясьсоответствуюшей вероятностной таблицей, можно судить о том, какова та вероятность, с которой мы могли на него «наткнуться».

Необходимо пояснить, какого типа распределения будут нас интересовать. Мы уже отмечали, что речь пойдет о нормальном распределении, распределенияхх2, Стьюдента и ^-распределении (распределении Фишера). «Маловероятными» для них всех являются области, лежащие в «хвостах» этих распределений. У первого распределения нас будет интересовать один «хвост» (правый), у трех других — два «хвоста» (и правый, и левый). Все названные распределения непрерывны. Значит, для них бессмысленно говорить о вероятности встречаемости точечного значения. Рассмотрим для примера нормальное распределение. О вероятности «наткнуться» на конкретное значение/вы6 мы можем судить по одной из двух вероятностей: Р(/">/вы6) (если/выб > 0) или P(f вь|б) (если/вь1б< 0). Пока будем говорить о ситуации, когда/ы6> 0.

Итак, вычисляем значение/вы6 критерия /для нашей единственной выборки. Находим по таблице вероятность Р(/>/„ы6)-

Далее вступает в силу своеобразный принцип (уже затронутый нами в п.ЬЛ): маловероятное событие практически не может произойти. Другими словами, принимая управленческое решение, мы, узнав, что некоторое событие имеет малую вероятность, будем вести себя так, как если бы это событие не могло произойти. Если такое маловероятное событие встречается в наших теоретических рассуждениях, мы делаем вывод, что вероятность определялась нами неправильно, в действительности же рассматриваемое событие не маловероятно и, следовательно, мы должны пересмотреть те положения, которые привели нас к выводу о том, что вероятность его встречаемости мала.

Наше событие состоит в том, что критерий принял то или иное значение. Если вероятность этого события, т.е. P(f>/выб) очень мала, то в соответствии с приведенными рассуждениями мы полагаем, что неправильно ее определили. Встает вопрос о выяснении, что именно привело нас к ошибке. Вспоминаем, что мы определяли упомянутую вероятность в предположении справедливости проверяемой гипотезы. Именно это предположение и заставило нас считать вероятность встреченного значения очень малой. Поскольку опыт дает основание полагать, что в действительности вероятность не столь мала, остается опровергнуть нашу Н0.

Другими словами, если выборочная ситуация такова, что ее возникновение при справедливости в генеральной совокупности проверяемой гипотезы Н0 имеет очень малую вероятность, гипотеза отвергается. Мы проанализировали выборку (вычислили статистику/) и увидели, что произошло событие, которое при условии справедливости /У0 можно считать маловероятным (статистика приняла маловероятное значение). Поскольку в соответствии с обсуждаемым принципом полагаем, что подобное событие произойти не может, то вынуждены допустить, что неверно условие, при выполнении которого это событие маловероятно, т.е. неверна наша Н0. Другими словами, мы отвергаем нашу гипотезу

Если же вероятность P(f>/выб) достаточно велика, чтобы значение /выб могло встретиться практически, мы полагаем, что у нас нет оснований сомневаться в справедливости проверяемой гипотезы. Мы принимаем последнюю, считаем, что она справедлива для генеральной совокупности.

Другими словами, если анализируемая нами выборочная статистика приняла значение, вероятность появления которого при условии справедливости И0 достаточно велика, то полагаем, что выборочная ситуация не противоречит проверяемой гипотезе. Эту гипотезу мы принимаем.

Таким образом, право именоваться критерием функция/обретает в силу того, что именно величина ее значения играет определяющую роль в выборе одной из двух альтернатив: принятия или отвержения ее гипотезы Я0.

Правда, здесь опять возни кает субъективный момент, связанный с неясностью того, какую вероятность мы назовем малой. Где граница между «малой» и «достаточно большой» вероятностью? Эта граница должна быть равна такому значению вероятности, относительно которого мы могли бы считать, что событие с такой (или с меньшей) вероятностью практически не может случиться — «не может быть, потому что не может быть никогда». Это значение называется уровнем значимости принятия (отвержения) проверяемой гипотезы и обозначается греческой буквой а.

Итак, если вероятность P(f>/вы6) > а, мы гипотезу принимаем на уровне значимости а, если P(f>/оы6) < а — отвергаем на том же уровне значимости.

Иногда используется немного другая логика проверки. Мы задаемся уровнем значимости а и заранее ишем то значение критерия, обозначаемое обычно символом f (критическое) или/1а6л (табличное), для которого имеет место соотношение P(f> f ) < а, и, вычислив^,., сравниваем его сf : если/>ы6 >/криг, проверяемая гипотеза отвергается, если/оыб

И ногда будем использовать обозначен ие f(f ) в знак того, что речь идет о том табличном (критическом) значении, которое отвечает именно уровню значимости а.

Математическая статистика не дает нам правил определения а. Помочь установить уровень значимости может только практика. Обычно полагают, что

В основе такого выбора не лежит теория. Единственное его «оправдание» состоит в том, что, как показывает практика, если при проверке гипотез пользоваться таким уровнем значимости, то решения, принимаемые на основе проверки рассматриваемой гипотезы, как правило, оправдываются.

Однако при проверке конкретных гипотез соответствующий уровень зачастую целесообразно связывать с содержанием задачи. Он дол жен обусловливаться тем, насколько социально значимым может быть принятие ложной или отвержение истинной гипотезы (процесс проверки любой статистической гипотезы всегда сопряжен с риском совершить одну из упомянутых ошибок; ниже этот вопрос будет рассмотрен подробнее). Если большие затраты (материальные или духовные) связаны с отвержением гипотезы, мы будем стремиться сделать а как можно меньше, чтобы максимально уменьшить вероятность отвержения нуль-гипотезы, являющейся в действительности верной.

 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>