Полная версия

Главная arrow Информатика arrow Имитационное моделирование

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Интервальное оценивание параметров распределения

Всякая точечная оценка является приближенной. С уменьшением объема выборки ее точность падает, и встает вопрос определения «надежности» оценки. Для этого используют понятие доверительного интервала.

Доверительным интервалом [Э^, 0„2)] для параметра 0 называется такой интервал, относительно которого с любой выбранной вероятностью (3 = 1 - а можно утверждать, что он содержит неизвестное значение параметра 0, т. е.

Чем меньше для выбранной вероятности длина интервала 1а = 0^2) -0^, тем точнее оценка неизвестного параметра 0. Так как концы интервала зависят от выборки, т. е. ею определяются, то значения б^, 0® случайны. Вероятность (3 = 1 - а принято называть доверительной вероятностью, число а —уровнем значимости.

Перейдем к вопросу о нахождении доверительных границ ё?ё®. Пусть имеется несмещенная оценка 0*. Если бы мы знали ее закон распределения/(0"), то нашли бы границы из условия

по где =0* -е; 0[,2) =0* + е. Однако закон распределения Д0") зависит от закона распределения генеральной совокупности и, следовательно, от его неизвестных параметров, в том числе от параметра 0, который мы определяем.

Рассмотрим, как можно «обойти» эту трудность на конкретных примерах [16].

1. Построение доверительного интервала для оценки математического ожидания. В качестве оценки математического ожидания т* используется средняя величина

Поскольку — независимые и одинаково распределенные случайные величины, то на основании центральной предельной теоремы их сумма распределена нормально с математическим ожиданием ц и дисперсией а2 = а2[х]. Перейдем к нормированной случайной величине

Эта величина распределена по нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице. Таким образом, мы «обходим» указанную трудность переходом к некоторой функции от исследуемой величины, такой что ее параметры не зависят от этой величины.

Функция распределения случайной величины t имеет вид

где Ф*(х) — функция Лапласа. Для того чтобы выполнялось условие

должно выполняться условие Р{ t < е(3 / а} = (3. Это условие записывается через функцию Лапласа следующим образом:

откуда находим

Учитывая, что а = g^, обозначая обратную функцию

уп

arg Ф I I = tp, получим окончательное выражение для доверительного интервала оценки математического ожидания:

Заметим, что расчет по этому соотношению возможен только в том случае, когда известна дисперсия ст2[х]. Если она неизвестна, приходится использовать ее оценку

Доказано, что при нормальном распределении величины

X случайная величина t = Vn подчиняется закону распреде-

V s2

ления Стъюдента с (л - 1)-й степенью свободы[1]. Поэтому в соотношении (4.9) в качестве величины ф следует использовать соответствующую квантиль распределения Стьюдента. Это распределение зависит от числа степеней свободы. Ниже приводится в качестве примера оценка различия между нормальным распределением и распределением Стьюдента для (3 = 0,95. Нормальное распределение дает величину 1,96; распределение Стьюдента сведено в ряд:

п

5

15

20

30

50

100

^0,95 (П)

2,78

2,15

2,093

2,045

2,09

1,984

Видно, что при увеличении п распределение Стьюдента сходится к нормальному.

2. Построение доверительного интервала для оценки дисперсии. Рассмотрим несмещенную оценку дисперсии

и выразим случайную величину s через величину V = (п- l)s2 / D, имеющую распределение у2. Закон распределения величины V несимметричен. Условимся выбирать доверительный интервал так, чтобы вероятности выхода величины V за пределы интервала вправо и влево были одинаковы и равны а / 2 = (1 - (3) / 2.

Чтобы построить интервал с такими свойствами, следует воспользоваться таблицей распределения у}. При этом нужно учитывать, что в таблице обычно приводятся числа у}, такие что

для величины V, имеющей ^-распределение с г степенями свободы. В данном случае г = п - 1. Зафиксируем г = п - 1 и найдем в соответствующей строке таблицы два значения у} одно, отвечающее вероятности - а / 2, и другое — вероятности р2 1 - а / 2. Обозначим эти значения yf и у%. Доверительный интервал имеет у своим левым, а у? — правым концом. Неравенства V < xl и V > у выполняются с вероятностью (3, и они равносильны неравенствам

откуда следует, что границами доверительного интервала для дисперсии служат величины (n-l)s2 /%2 и (rz-l)s2 / у%.

Оценка вероятности по частоте. Когда величины пр и п(1 -р) = щ больше четырех, можно считать, что частота события р распределена по нормальному закону с параметрами М[р"] = р и D[p"] = pq / п. Тогда с вероятностью (3 можно утверждать, что

При малом числе опытов (а также если вероятность р очень велика или очень мала) доверительный интервал строят, исходя из точного — биномиального — закона распределения оценки частоты.

При вычислении оценок моментов по бесповторным выборкам (это, в частности, имеет место при расчете стационарных критериев) необходимо учитывать статистическую связь между реализациями. Например, при вычислении среднего значения

где у (г At) — значение случайной величины у в момент г At интервала стационарности, точность оценки

где К — корреляционная функция.

Практически среднее значение определяется так: диапазон стационарности Тс разбивается на тп участков длительностью At: m = Тс / At и оценка вычисляется как среднее значение:

Для нестационарных критериев находят оценки, разбивая интервал времени (О, Т) на части с постоянным шагом At. Накапливая значения y^t) реализаций случайного процесса 7(0 для фиксированных моментов времени tit можно вычислить оценки для математического ожидания по формуле

  • [1] Числом степеней свободы называется разность между числом экспериментальных точек и числом связей, ограничивающих свободу измененияслучайных величин.
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>