Определение функций распределения по опытным данным (проверка гипотезы о законе распределения)

В результате наблюдений или измерений случайной величины X, имеющей функцию распределения в общем случае неизвестную, получается выборкахь х2, ...,xN. Статистический аналог распределения Fx (или эмпирическая функция распределения выборки F^(x)) является ступенчатой функцией: F^(x) = N(x) / N, где N(x) — число наблюдений, в которых X < х.

При больших значениях N строить F^(x) затруднительно, поэтому выборку подвергают группировке. Для этого весь диапазон наблюденных значений X делят на непересекающиеся интервалы (разряды) Axj (j = 1, 2, ..., m) и считают количество значений Nj величины X, попавших в j-й разряд.

Величина

является статистическим аналогом плотности распределения (ее график называют гистограммой).

При выборе ширины интервала Дх; при фиксированном N необходимо по возможности учитывать следующие рекомендации [4]:

  • 1) Дх; = const (j = 1, 2, ..., m);
  • 2) 6 < т < 20, причем в зависимости от величины N можно использовать следующие соотношения:

На практике обычно стараются выбрать такую ширину интервалов, чтобы каждый из них содержал хотя бы пять наблюденных значений.

Критерии согласия Пирсона и Колмогорова.

Предположим, что проведено п независимых опытов, в каждом из которых случайная величина X приняла определенное значение. Результаты опытов сведены в к разрядов и оформлены в виде статистического ряда:

Интервал

хьх2

*2>х3

хк> -Чс+1

Частота р*

Рг

Р2

Рк

Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина X имеет данный закон распределения F(x).

Зная теоретический закон F(x), найдем теоретические вероятности рг, р2, ..., рк. В качестве меры расхождения можно выбрать сумму квадратов отклонений, взятых с некоторыми весами с{.

Веса вводятся для того, чтобы уравнять абсолютные величины отклонений: ведь они могут быть большими, когда вероятности велики, и малыми, когда они малы. Естественно взять с( обратно пропорциональными величинам р(.

К. Пирсон показал, что если положить с( = п / рг, то при больших п закон распределения U практически не зависит от F(x) и от числа опытов п, а зависит только от к; при увеличении п этот закон приближается к распределению х2 (так же обозначается и сама мера расхождения):

Эту формулу обычно приводят к виду

где т; — число значений в i-м разряде. Случайная величина, представляющая собой сумму квадратов к независимых случайных величин, каждая из которых подчиняется нормальному закону распределения iV(0, 1), распределена по закону %2 с к степенями свободы. Величина 1.—- распределена нормально

VFP;

при npi > 5. Чтобы обеспечить это, иногда приходится объединять интервалы. Число степеней свободы учитывает число связей, накладываемых на оцениваемые величины, и уменьшается при их увеличении. Обычно существующая связь — равенство

к

YjPI =1- Если параметры закона распределения оцениваются

i=i

по выборке, то это накладывает дополнительные связи. Так, если неизвестно математическое ожидание, то оно заменяется выборочной средней, и это уменьшает число степеней свободы на 1. Если к тому же неизвестна теоретическая дисперсия и она определяется через эмпирическую дисперсию, то число степеней свободы уменьшается еще на 1 и т. д.

Общая схема применения критерия у2 сводится к следующей:

  • 1) по выборке определяются неизвестные параметры предполагаемого в гипотезе закона распределения;
  • 2) вычисляется мера расхождения у2;
  • 3) определяется число степеней свободы г = к - s, где s — число наложенных связей;
  • 4) по величинам у} и г из таблицы ^-распределения выбирается вероятность того, что вычисленная по результатам эксперимента величина у} с г степенями свободы превышает данное значение у} (обычно именно так строятся таблицы Х2-распределения). Если эта вероятность а достаточно мала, гипотеза отбрасывается как неправдоподобная.

Можно изменить эту схему: на четвертом шаге задать некоторую достаточно малую величину а и найти по таблице соответствующее значение у2(г), после чего сравнить его с вычисленным. Если табличное значение %2(г) > у2, то гипотезу Н0 можно принять.

Для оценки согласованности выборочного К (х) и теоретического Fx распределений можно также применять критерий согласия Колмогорова с мерой расхождения

Схема его применения аналогична рассмотренной выше.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >