Полная версия

Главная arrow Статистика arrow МАТЕМАТИЧЕСКАЯ СТАТИСТИКА ДЛЯ СОЦИОЛОГОВ

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Модель однофакторного дисперсионного анализа

Прежде, чем говорить о строгом способе решения поставленной задачи, необходимо четко описать модель, которая лежит в основе всех формальных построений. Модель кажется очень простой. Но, перейдя к рассмотрению двухфакторного дисперсионного анализа, увидим, что подобные модели могут быть более сложными и неочевидными. Научиться же строить подобные модели надо. Причин тому, по крайней мере, две.

Во-первых, подобного рода модели используются очень часто: в регрессионном, логлинейном и других видах анализа данных.

Во-вторых, понимание смысла подобных моделей, на наш взгляд, может способствовать усвоению очень актуального методологического принципа — прежде, чем собирать данные, необходимо сформировать систему «аксиом», четко обрисовывающих априорное представление социолога о том, что он изучает. При всей очевидности это положение на практике часто не выполняется. В результате используются анкеты, в которые включены вопросы, не имеющие отношения к делу, а необходимые вопросы не включены и т.д.

Методы анализа данных опираются на такие априорные аксиомы. Они и составляют суть модели, заложенной в том или ином методе. Привычка пользоваться методами, как нам представляется, должна способствовать выработке состоятельного с методологической точки зрения подхода к планированию социологического исследования. Иначе говоря, математика может научить социолога методологической грамотности.

В данном случае имеется в виду одна «аксиома» — четкая формулировка того, от чего зависит основной интересующий исследователя признак К Предположение о том, из чего для каждого конкретного респондента формируется уровень признака К, выглядит следующим образом:

где р — некий средний уровень, на фоне которого изучается действие фактора X на признак К; X* — вклад в формирование значения зависимого признакау-го уровня фактора Х г. — добавка, отражающая специфические характеристики именно того (неповторимого) респондента, который включен ву-ю ячейку и имеет в ней номер /.

Сделаем несколько замечаний по поводу отдельных членов модели.

Сущность р поясним на примере: наверное, этот уровень будет один для выпускников московских школ, другой—для выпускников деревенских школ Иркутской области и третий — для молодежи Центрально-африканской республики. Модельдействительна на генеральной совокупности. Выборочной оценкой среднего уровня р служит Кв.

По поводу Xх можно сказать, что это главный интересующий нас элемент, центральное звено модели. Размер именно этой величины и говорит о гом, насколько./'-я форма обучен и я детерминирует уровень полученных студентом знаний. Выборочной оценкой этого показателя служит разность (К.у - К.).

е. — это некоторый поправочный элемент, корректирующий основную часть модели, выраженную суммой (р + >.*). Коррекция требуется потому, что, как бы хорошо ни моделировалась величина К этой суммой (а мы ищем именно такой фактор, чтобы равенство

Y.. = (р + Xх.) по возможности отражало реальность), последняя никогда не сможет учесть специфические особенности отдельного человека. Точным равенство К = (р + Xх) не будет никогда. Номы все же будем считать его приемлемым, если величины е. в среднем равны нулю, независимы и как бы погашают друг друга. Например, если у /-го респондента изу-й группы е.. окажется большим по абсолютной величине и отрицательным (из-за того, что этот респондент много болел, когда проводился эксперимент; это привело к тому, что успехи студента оказались ниже, чем следовало бы ожидать при рассматриваемом среднем уровне и воздействии соответствующей формы обучения), то в той же группе найдется такой к-й респондент, у которого е^. будет примерно таким же по модулю, но положительным (из-за того, что этот респондент весь год усиленно занимался дополнительно с преподавателем). Обычно предполагается, что величины е. имеют нормальное распределение с нулевым математическим ожиданием.

Если окажется, что е довольно велики и практически у всех респондентов положительны, значит, мы не учли действие какого-то общего для всех респондентов фактора. И нам надо или заменить фактор Xдругим, или перейти к двухфакторному дисперсионному анализу. Величины е.. называются остатками, и математическая статистика обычно предоставляет исследователю возможность проанализировать эти остатки (имеет место не только для дисперсионного анализа).

Выборочной оценкой величины е. служит разность К. - Y ..

Все три элемента модели могут быть расценены как вклады в вариацию признака Yи как источники такой вариации.

 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>