Полная версия

Главная arrow Статистика arrow МАТЕМАТИЧЕСКАЯ СТАТИСТИКА ДЛЯ СОЦИОЛОГОВ

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Повторение отдельных фрагментов курса по теории вероятностей

  • 1. Функция плотности одномерного распределения и функция распределения для одномерных непрерывных и дискретных распределений; связь этих функций друг с другом; основные параметры любого[1] одномерного распределения — математическое ожидание, мода, медиана и другие квантили, дисперсия.
  • 2. Площадь под кривой функции плотности как оценка вероятности попадания значения случайной величины в соответствующий отрезок.
  • 3. Выборочное представление функции плотности распределения признака (непрерывного и дискретного): частотная таблица, полигон, гистограмма (в том числе с неравными интервалами). Различие стоящих за выбором полигона и гистограммы предположений о распределении признака внутри каждого интервала. Анализ моделей, заложенных в указанных способах выборочного представления случайной величины, их различие: при использовании полигона предполагаем, что все попавшие в интервал значения сосредоточены водной точке (важно, что при построении графика на оси* может быть выбрана любая точка интервала, т.е. что выбор такой точки — тоже модельное предположение); при использовании гистограммы считаем, что распределение в каждом интервале равномерно; гистограмму имеет смысл рассчитывать только для непрерывного признака. Проблема построения выборочной функции плотности для непрерывного признака: разбиение диапазона изменения признака на интервалы, отнесение «стыка» соседних интервалов к одному из концов, пропущенные данные. Цели заполнения пропусков. Способы такого заполнения: средним арифметическим (может быть, с учетом значений других признаков) или другими средними, равномерно по всем градациям, пропорционально получившимся частотам. Модели, стоящие за каждым названным подходом к заполнению пропущенных значений.
  • 4. Выборочное представление функции распределения (кумулята): частотная таблица, полигон и гистограмма.
  • 5. Статистики, отвечающие основным параметрам одномерного распределения: среднее арифметическое, дисперсия, мода, медиана и другие квантили. Медиану необходимо уметь считать двумя способами: как середину вариационного ряда и с помощью кумуляты. То же для других квантилей. Снова обратить внимание на модель, заложенную в методе.

Напомним основные формулы для расчета медианы и моды[2]:

где jc0 — начало (нижняя граница) медианного интервала; 6 — величина медианного интервала; п — объем выборки (или 100%, либо 1); пм частота (или относительная частота в процентах, либо в долях), накопленная до медианного интервала; пЫе — частота (относительная частота либо в процентах, либо в долях) медианного интервала;

где х0 — начало (нижняя граница) модального интервала; 6 — величина модального интервала; пМп — частота модального интервала; п~ — частота интервала, предшествующего модальному; п4 — частота интервала, следующего за модальным. Частоты, как и выше, везде могут быть заменены на относительные частоты, выраженные либо в процентах, либо в долях.

  • 6. Функция плотности и функция распределения двумерных случайных величин. Основной параметр двумерного распределения — коэффициент корреляции.
  • 7. Выборочное представление функции плотности двумерной случайной величины (частотная таблица, или таблица сопряженности). Маргинальные частоты, их связь с одномерными распределениями рассматриваемых признаков. Статистика, отвечающая генеральному коэффициенту корреляции.

Напомним формулу для вычисления последней названной статистики:

Кроме того, напомним важное свойство коэффициента корреляции: он измеряет только линейную связь. Это означает, что если он равен I или —1, отвечающие нашим объектам точки рассматриваемого двумерного признакового пространства лежат на прямой линии, т.е. между признаками имеется точная линейная связь (прямая или обратная). А вот если г — 0, то это означает не отсутствие связи вообще, а только отсутствие линейной связи. Нелинейная же связь при этом может быть и весьма сильной.

8. Понятие случайной выборки. Ее построение с помощью таблицы случайных чисел.

  • [1] На самом деле, не совсем любого, поскольку существуют распределения,не имеющие конечных моментов (напомним, что математическое ожидание — этопервый момент распределения, дисперсия — второй и т.д.).
  • [2] Рабочая книга социолога/отв. ред. Г.В. Осипов. М.: Наука, 1983. С. 161—162.(Мы при водим только те формулы, которые обычно не даются в курсе теории вероятностей.)
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>