Полная версия

Главная arrow Статистика arrow МАТЕМАТИЧЕСКАЯ СТАТИСТИКА ДЛЯ СОЦИОЛОГОВ

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Некоторые замечания о терминах, использующихся в западной литературе

Терминология, использующаяся в отечественной и западной литературе по интересующей нас теме (мы имеем в виду в первую очередь американские учебники по так называемой статистике), в определенной мере различна[1]. И за этим различием зачастую стоят разные методологические позиции. Представляется, что анализ соответствующих методологических аспектов имеет непосредственное отношение к практике использования социологом достижений математической статистики.

Итак, мы разделили все рассматриваемые статистические показатели на две большие группы — параметры распределений, т.е. как бы «истинные», генеральные характеристики случайных величин, и статистики — выборочные оценки «истинных» параметров. Процедура поиска параметров может иметь разную степень сложности. Одни параметры просто говорят об описании совокупности. Это, скажем, математическое ожидание и дисперсия. Поиск их сравнительно прост. Другие — позволяют изучать причинно-следственные отношения. Это, например, коэффициент корреляции. Его найти уже сложнее, соответствующая процедура включает, в частности, расчет математических ожиданий и средних квадратических отклонений. Третьи параметры дают возможность прогнозировать ситуацию. Это делает, например, регрессионный анализ (коэффициенты уравнения регрессии — это тоже набор параметров, характеризующих распределение случайной величины). Построение уравнения регрессии — еще более сложная процедура, включающая, в частности, расчет разного рода коэффициентов корреляции. Выбор рассчитываемых параметров определяется решаемой содержательной задачей. Здесь можно указать на три класса задач, обычно выделяемые в методологии науки как основные, отвечающие целям любой наукой — описание, объяснение, предсказание. Первую задачу обычно связывают с термином «описательная (дескриптивная) статистика», называя таким образом и совокупность простейших параметров распределения, таких, как математическое ожидание и дисперсия (или их выборочные оценки), и ветвь статистики (как науки), позволяющую эти характеристики найти. Наверное, можно было бы вводить термины «объяснительная статистика», «предсказательная статистика» и т.д. Но этого не делается, поскольку слишком много методов могут «объяснять» или «предсказывать» изучаемые явления, слишком трудно провести границу между теми и другими задачами.

Подчеркнем, что какие бы параметры мы ни рассчитывали (и, соответственно, какую бы задачу ни решали), всегда сначала будем находить соответствующие выборочные статистики, а потом «соображать», с какой вероятностью в генеральной совокупности будет иметь место та или иная ситуация с параметрами изучаемых распределений. И всегда за нашими действиями будет стоять определенная модель, в наличии которой мы должны давать себе отчет. Модель стоит даже за самыми простейшими параметрами. Например, выбирая для оценки средней тенденции математическое ожидание, моду или медиану, мы по-разному понимаем смысл этой самой средней тенденции (а ведь бывают и другие меры средней тенденции — например, среднее геометрическое, среднее гармоническое, да и квантили тоже можно считать своеобразными средними). То же можно сказать о разных мерах разброса, которых тоже немало[2] [3].

В западной литературе вся статистика обычно делится на описательную (<descriptive) и «выводимую» (inferential).

В дескриптивной (описательной) статистике1* исследователь пытается описать ситуацию, определенным образом собирая данные, рассчитывая определенные средние величины и проценты и представляя собранную информацию в наглядном виде, используя диаграммы, графики, таблицы. Типичный пример использования описательной статистики — перепись населения.

Трудно возразить против описанного термина, если не попытаться уточнить его смысл путем сопоставления понятия «описательная статистика» с понятием, ему противопоставляемым, — «выводимой статистикой»[4].

Работая в рамках выводимой статистики, исследователь пытается перенести результаты с выборки (sample) на генеральную совокупность (population) путем проверки статистических гипотез. Но этим цели выводимой статистики (как науки) не ограничиваются. В нее еще входит изучение соотношений между переменными и осуществление предсказаний.

На наш взгляд, некорректно объединять в одну группу проверку статистических гипотез и, скажем, изучение связей между переменными. Остается неясным основание выделения такой группы. Сомнительным выглядит и противопоставление этой группы методам дескриптивной статистики. Приведем причины наших сомнений.

Во-первых, проверка статистических гипотез требуется абсолютно для всех методов — и для описательной статистики, и для разного рода коэффициентов связи, и для прогнозных алгоритмов..

Во-вторых, четкой границы между методами описательной статистики и методами изучения отношений переменных нет. Так, коэффициенты корреляции нередко используются в чисто описательных целях.

В-третьих, методы описательной статистики не менее «выводимы», чем методы изучения связей между переменными и методы прогнозирования. Собирая данные, мы используем иногда совсем не очевидные модели: именно так, а не иначе измеряем переменные (а в каждом методе измерения заложена своя модель); разбиваем диапазон изменения признака на интервалы (это — в значительной мерс субъективная процедура, а от нее зависит и характер получаемого описания, и величина коэффициентов связи и т.д.); выбираем то или иное понимание средней тенденции или разброса и т.д.

Более адекватной представляется нам терминология, которую мы ввели и которая соответствует традициям отечественной школы.

Отметим, что описанная выше точка зрения отвечает взглядам и современных русских ученых, и российских исследователей начала XX в. Например, известный математик-социолог А.А. Чупров называл «вероятностным априори» то, для обозначения чего мы используем словосочетание «генеральные параметры», и говорил о необходимости отчетливого и выдержанного разграничения априорных искомых и эмпирических данных статистического исследования. В частности, он полагал, что именно смешение указанных объектов изучения приводит к «сбивчивости» в трудах представителей известной английской статистической школы, возглавляемой К. Пирсоном (1857—1936). «Сбивчивость», по мнению Чупрова, затрудняла усвоение работ этой школы (которую Чупров ценил очень высоко; результаты, полученные Пирсоном и окружающими его исследователями, он активно пропагандировал в своих работах).

А.А. Чупров был воспитан на трудах крупнейших русских математиков — П.Л. Чебышева (1821 — 1894), А.М. Ляпунова (1857—1918), А.А. Маркова(1856— 1922),занимаюшихлидирующие позиции вмиро- вой математической статистике второй половины XIX — начала XX в.

  • [1] Под различием терминологии мы имеем в виду не то, что для обозначенияодного и того же понятия можно использовать разные (с точностью до перевода)слова. Это непринципиально (как говорится, назови хоть горшком, да не сажай впечку). Речь идет о том, какие именно понятия «удостаиваются» введения отдельных терминов и о том, какую связь между этими понятиями терминология отражает. Различие таких аспектов может быть весьма принципиальным.
  • [2] О содержательном смысле некоторых мер средней тенденции и разброса см.:Толстова Ю.Н. Анализ социологических данных: Descriptive statistics consists of thecollections, organizations, summarizations. and presentations of data.
  • [3] ,K «Descriptive statistics consists of the collections, organizations, summarizations,and presentations of date». Bluman A.G. Elementary Statistics. A Step by Step. McGraw-Hill Companies, 2001. P. 5.
  • [4] «Inferential statistics consists of generalizing from samples to population, performinghypothesis tests, determining relationships among variables, and making predictions*. Тамже. С. 7.
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>