Ошибки репрезентативности (выборки)

При выборочном обследовании отдельной задачей является учет специфических ошибок выборки, относящихся не к отдельным признакам Xi} а к выборочным средним X, поскольку они, как правило, не совпадают с генеральной средней Хо. Систематические ошибки выборки приводят к смещению выборочных оценок по отношению к параметрам генеральной совокупности и должны быть исключены, что обеспечивается равной возможностью попадания единиц в выборку. И при соблюдении правил отбора случайные различия Х-Хо неизбежны, поскольку выборка никогда не отражает в точности генеральную совокупность. Следует различать конкретную, среднюю и предельную ошибки выборки.

Конкретная ошибка выборки е = X-XQ это случайное отклонение выборочной средней по данной конкретной выборке от генеральной средней. Поскольку величина Хо, как правило, неизвестна, и именно для ее оценки рассчитывается выборочная средняя, определить величину конкретной ошибки отдельной случайно сформированной выборки невозможно. При проведении повторной выборки численностью п из генеральной совокупности N число возможных значений выборочных средних будет определяться числом сочетаний п единиц из общего числа N, т. е. Cft. При большом N число сочетаний (а значит, и возможных средних) почти бесконечно. Но при случайном отборе достаточно большого числа единиц п начинает действовать закон больших чисел, и распределение всех возможных выборочных средних приближается к нормальному.

Средняя ошибка выборки т представляет собой среднее отклонение всех возможных случайных выборочных средних Xj от генеральной средней Хо. Численно она равна среднему взвешенному квадратическому отклонению выборочных средних Xj с различной частотой J- от генеральной средней:

S/,(X;-Xo)2 SA

, где X/j — общее число всех возможных

случайных выборок. Если определена вероятность появления отдельных средних как ?? то средняя ошибка является О IjZJjCJlJDJnLJDlzv VСуДггтТл JtvClJtv lJ _ у 1U Х-^СуДггутут UlllJrl vJJlvCI уаХэЛуаС X x~yjLj

по существу, вероятной ошибкой m = yJpjQXj -X0)2 из конкретных ошибок ?j = Xj - Xo, t. e.m = pjSj.

Как известно из теории вероятностей, при нормальном распределении вероятность появления конкретных ошибок различной величины неодинакова. Чаще всего в выборках формируются средние Xj, близкие к генеральной средней Хо или слабо отклоняющиеся от нее, т. е. вероятность Pj появления малых конкретных ошибок е;- = Xj -Хо бывает наибольшей. Большие отклонения менее вероятны. Их величина будет наибольшей, если в выборку случайно попадут только значения признаков генеральной совокупности, близкие к минимальным Xmin или максимальным Хтах, что случается крайне редко.

Отношение конкретных ошибок к средней ошибке пред-

ставляет собой нормированное отклонение t = — = —----. Его

т т

величина при большой выборке почти всегда находится в пределах ±3,0 и оказывается функционально связанной с вероятностью р. Так, вероятность получения конкретных ошибок со значением от нуля до одной средней ошибки т (т. е. с t = ±1) составляет 0,68, со значением, не превышающим двойную среднюю ошибку (t — ±2), — 0,955, тройную среднюю ошибку — 0,997, четырехкратную — 0,99994.

Используя закономерную связь нормированного отклонения t и вероятности р, можно определить значение предельной ошибки выборки Епред — tm. Это максимально возможная при данном уровне вероятности величина конкретной ошибки е = Х-Хо. Так, при р = 0,955 нормированное отклонение равно 2,0 и предельная ошибка выборки составит е095 = 2т. Это значит, что 95 % всех возможных случайных выборочных средних Xj будут отклоняться от неизвестной генеральной Хо не больше чем на Епред. На практике же имеется лишь одна выборочная средняя с неизвестной конкретной ошибкой е,-, которую надо оценить. Если отнести эту выборку к подавляющему большинству, к 95 % всех возможных случайных выборок, можно утверждать, что ошибка данной конкретной выборки находится в пределах предельной. Если всегда поступать так, то в 5 % оставшихся случаев ошибка выборки может быть и больше.

Среднюю ошибку выборки т практически определяют по данным какой-нибудь конкретной выборки. В математической

статистике доказывается, что гп = —т=, где 3 = J----------—

yjn V п-1

несмещенное среднее квадратическое отклонение признака Х( в выборочной совокупности; п — численность выборки. Конкретный алгоритм расчета средней и предельной ошибок зависит, как известно, от способа проведения выборки и от ее размера, что следует учитывать при оценке выборочных данных. Расчет необходимой численности выборки также основан на взаимосвязи предельной ошибки с нормированным отклонением t и средней ошибкой выборки = -^=. Так как пре-уп

< S 2 t2S2

дельная ошибка Епред = tm* = t—j=, отсюда получаем Епред =----,

уп п

t2S2 X

а п = ——. Эта формула используется при случайном повтор-^пред

„ t2S2N

ном отборе, а при бесповторном п = —-----—где N — чис-

^пред "Ь t 5

ленность единиц генеральной совокупности. Для типического отбора, где в расчетах используется внутригрупповая вариация, которая меньше общей, численность выборки бывает наименьшей.

Определение выборочных средних и их ошибок имеет самостоятельное значение для оценки уровня признаков изучаемых явлений, а также для определения объемов явлений в генеральной совокупности путем распространения на нее данных выборки. Чаще всего объем явления в генеральной совокупно-N

сти W = '?Xi определяют напрямую, путем умножения выбо-i=l

рочной средней на численность генеральной совокупности: W = XN. При этом обязательно учитывают ошибку выборочной средней епред и используют ее оценку для генеральной совокупности X ± епред. Соответственно, объем явления в генеральной совокупности составит: W = (Х ± ЕпредЖ ИЛИ (X - 8пред)М < W < <(Х + ЕпредЖ

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >