Полная версия

Главная arrow Информатика arrow Имитационное моделирование

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

ОБРАБОТКА РЕЗУЛЬТАТОВ МОДЕЛИРОВАНИЯ

В общем случае критерием интерпретации результатов моделирования является нестационарный л-мерный случайный процесс у(t), t0 < t < tk. О его свойствах судят по свойствам R-мерного вектора

Работа системы моделируется N-кратно (см. рис. 1.1). Когда свойства системы определяются значением критерия y(t) в определенный момент времени, например tk, то обработка сводится к оценке распределения л-мерного вектора у (tk) по независимым реализациям у, (t^), i = 1, 2, N. Если в системе начиная с момента tc устанавливается стационарный режим, о котором можно судить по одной достаточно длинной реализации у2(t) процесса — критерия y(t), стационарного и эргодического на интервале (tc, tk), то обработке подлежит бесповторная выборка статистически зависимых реализаций уг (/At), tc k.

При анализе результатов моделирования приходится решать следующие наиболее распространенные задачи:

  • — определение эмпирических моментов критерия у (t);
  • — нахождение функциональных зависимостей критерия от переменных, определяющих параметры системы;
  • — проверка гипотез о законах распределения и их параметрах.

Рассмотрим основные методы, применяемые для решения

этих задач.

Точечное оценивание параметров распределения

Наиболее общей характеристикой случайной величины ?, является ее закон распределения, задаваемый функцией распределения F^(x) или плотностью вероятностей Д(х). В обоих случаях должен быть определен вид функциональной зависимости и набор параметров

Если вид функциональной зависимости известен или он не интересует исследователя, то возникает задача: анализируя выборку, оценить значения неизвестных параметров ос, Р, Y, ... .

При точечном оценивании в качестве оценки неизвестного параметра 0 используется некоторая статистика 9*.

Оценка 0: для параметра 0 была бы идеальной, если бы каждое вычисление от выборки к выборке давало бы в результате истинное значение 0. Однако при ограниченной выборке это невозможно; приблизиться к идеалу можно лишь при п —» °о. Таким свойством должна обладать статистика 0". Его можно записать в виде сходимости по вероятности:

Это свойство называется состоятельностью оценки, а оценка, удовлетворяющая этому условию, называется состоятельной.

При одном и том же законе распределения /(х, 0) для одного и того же параметра 0 существует бесконечное множество оценок, являющихся состоятельными. Например, если 0* есть состоятельная оценка для 0, то, очевидно, состоятельной оценкой будет и g„0*, если limg,7 = 1 при п —> Чтобы исключить

многозначность состоятельных оценок, надо их нормировать так, чтобы устранить в них систематические погрешности. Это требование представляется в виде М[0*] = 0. Оценка, удовлетворяющая этому условию, называется несмещенной.

Если есть семейство состоятельных несмещенных оценок, то лучшей является такая, которая при любом объеме выборки п имеет минимальное возможное рассеяние. В качестве меры рассеяния выбирают дисперсию

При самых общих предположениях показано, что при любых 0 и п имеет место неравенство, известное как неравенство Рао — Крамера:

юз

Если существует несмещенная оценка, для которой достигается знак равенства, то она будет наилучшей возможной; ее называют эффективной. Для других оценок вводят коэффициент эффективности, определяя его как отношение е(0*) = = Do[0] / D[0*]. Предел ео(0 ) = lime(0*) при п —> °° есть асимптотическая эффективность оценки 0*. Оценка, у которой ео(0") = 1, называется асимптотически эффективной.

Каждая асимптотически эффективная оценка является состоятельной.

Итак, будем решать следующую задачу [16, 19]. Пусть известен закон распределения случайной величины, но неизвестны его параметры. Задача заключается в том, чтобы по выборке получить количественные оценки этих параметров. Подчеркнем, что в общем случае нельзя отождествлять параметры закона распределения с его моментами. В некоторых частных случаях параметры являются моментами (например, для нормального распределения N(a, b) параметр а — это момент первого порядка — математическое ожидание ц15 параметр b — это центральный момент второго порядка ц2 = <^2; однако в общем случае моменты есть функции параметров. Так, например, начальный момент первого порядка и центральный момент второго порядка гамма-распределения, плотность которого описывается функцией

где Г (а) = J" ta-1e-tdt — гамма-функция, равны соответственно о

а Да, Ь) — т - а / Ъ, р2(а, Ь) = а2 = а / Ь2.

Известны и применяются следующие приемы точечного оценивания.

1. Метод моментов. В основе этого метода лежит следующая теорема.

Теорема. Пусть случайные величины рДи), ..., г|г(п) сходятся по вероятности при п —> °о к некоторым постоянным сь с2, ..., сг соответственно. Тогда для любой непрерывной функции

(pCxj, ...,xr) случайная величина 2,(n) = фСп-^п), ..., rr(n)) сходится по вероятности к величине ф(с1? сг).

Суть метода основана на том, что теоретические моменты ц, (i = 1, к) являются функциями от параметров 01}

Qk и обратно:

а на основании приведенной выше теоремы можно утверждать, что эмпирические моменты связаны с параметрами такими же функциональными зависимостями, как и теоретические, поскольку сходимость оценок к моментам составляет содержание обобщенной теоремы Чебышева. Поскольку оценки моментов /Л], т2, ..., тк зависят от наблюденных значений хь х2, ..., хп, то будем иметь:

Приближенное равенство есть следствие сходимости по вероятности эмпирических моментов к теоретическим на основании теоремы Чебышёва.

Пример. Методом моментов найти оценки неизвестных параметров а и Ъ для гамма-распределения.

Для нахождения оценок параметров а и b методом моментов воспользуемся указанными выше начальным моментом первого порядка и центральным моментом второго порядка:

По выборке X], ..., хп из генеральной совокупности, имеющей Г-распределение, находим значения соответствующих выборочных моментов:

Приравнивая (4.1) и (4.3), (4.2) и (4.4) соответственно, получаем следующую систему уравнений:

(х)^ ~ X

решая которую, находим: d = ——,Ь = —Г. Остается только под-

Dx Dx

ставить соответствующие значения (4.3) и (4.4), полученные по выборке.

Видно, что для работы метода нужно иметь оценки моментов. Рассмотрим оценки основных моментов.

Оценка вероятности следует из теоремы Бернулли: в качестве оценки используется относительная частота к / п, и эта оценка состоятельна. Для анализа смещенности найдем:

Следовательно, оценка не смещена.

Для анализа эффективности имеем

т. е. оценка асимптотически эффективна.

Оценка математического ожидания следует из теоремы Чебышёва: в качестве ее используется средняя арифметическая, и эта оценка состоятельна.

Для анализа смещенности рассмотрим:

Можно показать, что эта оценка эффективна в случае нормального распределения.

Оценка дисперсии следует из теоремы Чебышёва:

В последнем соотношении первый член сходится по вероятности ко второму начальному моменту а2[Х], второй член сходится по вероятности к ц2, вся величина сходится по вероятности к а2И - ц2 = D[X].

Проверим несмещенность. Для этого преобразуем последний член правой части уравнения (4.5):

Найдем математическое ожидание M[s2]. Учтем, что дисперсия не зависит от того, в какой точке выбрать начало координат. Поэтому выберем его в точке математического ожидания. Тогда математическое ожидание суммы в первом слагаемом будет равно nD[X]; математическое ожидание суммы во втором слагаемом — смешанный момент независимых случайных величин — равно нулю. Следовательно, M[s2] — [(п - 1) / n]D[X], т. е. оценка смещена: имеет место систематическая погрешность. Для ее устранения нужно ввести поправку п / (п - 1). Сделаем следующие практически важные замечания:

  • 1) поскольку при п —> °° величина п / (п- 1) —> 1, то новая оценка также состоятельна;
  • 2) поправку имеет смысл вводить только тогда, когда п > 50;
  • 1 п _
  • 3) новая оценка s2 =-?(х,- ~х)2 эффективна лишь при

п-lt=l

нормальном распределении и при п —> °о; в то же время оценка 1 п

s2= — ^(Xj-p)2 — несмещенная, состоятельная и эффективна

ная;

4) для вычислений удобно использовать преобразованную формулу:

5) из того факта, что s2 — несмещенная оценка для а2, не следует, что s — несмещенная оценка для а. Можно показать: при выборке из нормальной совокупности

а при известном математическом ожидании ц

Приведем значения кп для некоторых значений п:

п

4

5

10

15

30

к

1,1294

1,0640

1,0280

1,0181

1,0087

Полученные методом моментов оценки являются состоятельными; их эффективность не гарантируется.

2. Метод максимального правдоподобия. Этот метод — один из наиболее распространенных. Пусть X — непрерывная случайная величина с плотностью распределения fx(x, 0), зависящей от неизвестного параметра 0, значение которого требуется оценить по выборке объемом п. Плотность распределения выборочного вектора ь ..., Хп) можно записать в виде

Соотношение (4.6) следует из того, что по определению плотностью распределения системы п непрерывных случайных величин называется n-я смешанная частная производная функции F(xl3 х2,..., хп), взятая один раз по каждому аргументу:

Если случайные величины независимы, то плотность распределения (4.7) распадается на произведение плотностей распределения отдельных величин, и мы приходим к формуле (4.6).

Пусть хг,..., хп — выборка наблюдений случайной величины X, по которой находится оценка неизвестного параметра.

Функцией правдоподобия L(0) выборки объемом п называется плотность выборочного вектора (4.6), рассматриваемая при фиксированных значениях переменныххь ..., хп. Функция правдоподобия является, таким образом, функцией только неизвестного параметра 0, т. е.

Аналогично определяется функция правдоподобия выборки дискретной случайной величины X. Пусть X — дискретная случайная величина, причем вероятность Р{Х = х} = р(х, 0) есть функция неизвестного параметра 0. Положим, что для оценки параметра 0 получена конкретная выборка наблюдений случайной величины X объемом п: х1} ..., хп. Функция правдоподобия 1(0) выборки объемом п равна вероятности того, что компоненты выборочного вектора ь ...,Хп) примут фиксированные значения, т. е.

Метод максимального правдоподобия состоит в том, что в качестве оценки неизвестного параметра 0 принимается значение 0, доставляющее максимум функции правдоподобия. Такую оценку называют МП-оценкой. В случае дискретного распределения наблюдаемой случайной величины X МП-оценка неизвестного параметра 0 есть такое значение 0, при котором вероятность появления данной конкретной выборки максимальна. Аналогичную интерпретацию МП-оценки можно дать и в случае оценки параметра распределения непрерывной случайной величины.

Можно предложить еще одну трактовку идеи этого метода. Если зафиксировать выборку х, положив ее равной наблюдаемым значениям, а аргументом считать вектор оцениваемых параметров 0, то полученная функция L(0 / х) = /(х / 0) при каждом фиксированном значении 0 будет характеризовать вероятность того, что данная реализация х получена при наблюдении за случайной величиной, параметры распределения которой равны 0.

Для упрощения вычислений, связанных с получением МП- оценок, в некоторых случаях удобно использовать логарифмическую функцию правдоподобия, т. е. In L(0).

При выполнении некоторых достаточно общих условий МП- оценки состоятельны, эффективны и асимптотически нормально распределены.

Пример. Найти МП-оценку параметра X распределения Пуассона.

Пусть xv ..., хп — выборка наблюдений случайной величиныX, имеющей распределение Пуассона с неизвестным параметром А., т. е.

где х принимает неотрицательные целочисленные значения, х = О, 1, 2, ... . Функция правдоподобия 1(0) выборки объемом п определяется по формуле

Найдем логарифмическую функцию правдоподобия:

Используя необходимое условие экстремума, получим уравнение для определения МП-оценки:

Отсюда следует, что X -—= х.

п

 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>