Некоторые сведения из теории вероятностей

Одним из основных понятий теории вероятностей является случайное событие. Случайным событием называется событие, которое должно либо произойти, либо не произойти при выполнении некоторого комплекса условий.

В качестве синонимов понятий «выполнение некоторого комплекса условий» и «случайное событие» будем рассматривать собственно понятия «произведено испытание», «результат испытания» и «событие».

Укажем некоторые соотношения между событиями.

  • Произведением событий А и В называется такое событие АВ, которое заключается в совместном наступлении этих событий.
  • Суммой событий А и В называется такое событие А + В, которое заключается в наступлении, по крайней мере, одного из этих событий.
  • • Событие U называется достоверным, если оно обязательно должно произойти при каждом испытании. Событие V называется невозможным, если оно не может произойти ни при каком испытании.
  • • Событие А называется противоположным событию А (и наоборот), если для них одновременно выполняются неравенства

• События А и В называются несовместимыми, если их совместное наступление неосуществимо, т.е. если

• События Av А2,..., Ап образуют полную группу попарно несовместимых событий, если события At и А-} при г Ф] несовместимы и хотя бы одно из событий Ах, А Ап непременно должно произойти. Иными словами, полная группа попарно несовместимых событий А А2п удовлетворяет двум условиям:

Степень возможности появления события определяет его вероятность.

Известны классическое и статистическое определения вероятности, отражающих два разных подхода к этому понятию. Основное различие между ними связано с моментом вычисления вероятности. Классический подход предполагает предварительное вычисление вероятности, т.е. до наступления каких-либо событий. При статистическом подходе вероятность вычисляют после проведения множества испытаний.

Согласно классическому определению, под вероятностью события А понимают отношение числа благоприятных исходов М к общему числу N равновозможных элементарных исходов, т.е. Р(А) = M/N.

Например, вероятность появления цифры 5 при подбрасывании игральной кости равна 1/6. Так как игральная кость это куб, имеющий шесть оцифрованных граней 1, 2, 3, 4, 5, 6, то N = 6, причем только одна грань содержит цифру 5 и М = 1.

Число благоприятных исходов для невозможного события А равно нулю (М = 0), а отсюда равна нулю и вероятность Р(А) = 0.

Например, к числу невозможных относится и событие, заключающееся в появлении цифры семь при подбрасывании игральной кости.

Число благоприятных исходов для достоверного события А равно общему числу возможных элементарных исходов (М = N) и вероятность равна единице Р(А) = 1.

Например, достоверным является событие, заключающееся в том, что число очков при подбрасывании игральной кости будет меньше 7. Очевидно, что для этого события М= 6, а вероятность равна единице.

Таким образом, вероятность события А меняется от 0 до 1, т.е. 0 < Р(А) < 1, причем для случайного события А вероятность находится в интервале 0 < Р(А) < 1.

Классическое определение вероятности имеет то ограничение, что в практических задачах далеко не всегда удается выделить равновозможные элементарные события.

Например, при бросании игральной кости классическое определение вероятности применимо, если только принять, что вероятности появления одной из цифр 1, 2,..., 6 равны. При этом предполагается, что кость имеет форму куба и сделана из однородного материала. В этом случае центр тяжести игральной кости совпадает с центром куба. Если центр тяжести смещен относительно центра куба, то вероятность отдельных исходов (цифр 1, 2, 3, 4, 5 или 6) можно найти, используя только статистическое определение вероятности.

1 /77

Статистически вероятность определяется как отношение —, полу-

п

ченное при неограниченном увеличении числа испытаний п, в которых событие А наступило т раз. Величина т называется частотой появления события А.

Покажем на примере, насколько согласуются вероятности события, полученные на основании классического и статистического определения вероятности.

Пусть испытание состоит в подбрасывании монеты, а событием является появление герба. В табл. П. 2.1. приведены результаты трех серий испытаний, проведенных известными статистиками Бюффоном и Пирсоном.

( 777 N

Как видно из таблицы, относительные частоты — незначительно

п)

отличаются от вероятности Р(А) = 0,5, вычисленной на основании классического определения вероятности, причем по мере роста числа наблюдений расхождение уменьшается.

Таблица П. 2.1

Результаты подбрасывания монеты

Число наблюдений п

Частота события т

Относительная частота —

п

4040 12 000 24 000

2048 6019 12 012

  • 0,5080
  • 0,5016
  • 0,5005

В практической деятельности приходится иметь дело как со случайными событиями, так и со случайными величинами.

Случайной называют величину Ху в результате испытания принимающую одно из возможных значений, заранее неизвестное и зависящее от многих причин, учесть которые мы не в состоянии.

Различают дискретные и непрерывные случайные величины.

Например, число очков, выпавших при бросании игральной кости, есть дискретная случайная величина X с шестью возможными значениями 1, 2, 3, 4, 5, 6. Причем одно возможное отличается от другого на величину, не меньшую единицы.

Интервал времени между двумя последовательными появлениями автобуса на остановке — пример непрерывной случайной величины X, так как один интервал времени может отличаться от другого на любую сколь угодно малую величину.

Случайная величина X полностью характеризуется законом распределения вероятностей, который определяет соотношение между возможными значениями случайной величины и соответствующими вероятностями.

Если обозначить возможные значения дискретной случайной величины X через хь х2, ..., хп, а через р, = Р(Х = х,) вероятность появления значения xt, то закон распределения вероятностей этой величины представлен в табл. П.2.2.

Таблица П.2.2

Закон распределения вероятностей дискретной случайной величины X

х

х2

хп

Р

Р

Р'1

Рп

Поскольку в табл. П.2.1 рассмотрены все возможные значения случайной величины X, то вероятности р, обладают следующим свойством:

Например, если X — число очков, появляющихся при бросании игральной кости, то закон распределения вероятностей этой случайной величины можно представить в виде табл. П.2.3.

Закон распределения вероятностей

*1

1

2

3

4

5

6

1

1

1

1

1

1

Pi

6

6

6

6

6

6

b 1

Из табл. П.2.3 следует, что = 6- — = 1.

г=1 6

Закон распределения вероятностей случайной величины X может быть задан функцией распределения F(x) и плотностью распределения f(x) — для непрерывных случайных величин.

Функцией распределения F(x) случайной величины X называется вероятность того, что величина X примет значения, меньшее х:

Для дискретной случайной величины формула F(x) вычисляется по формуле

где суммирование ведется по всем значениям г, для которых х, <х.

Например, из табл. П. 2.3 следует, что вероятность того, что при броса-

нии игральной кости выпадает число очков, меньшее х = 4, равна —, г.е.

6

Щ)=Р +Р2+Рз = У6-

График функции распределения для непрерывной случайной величины X представлен на рис. П.2.1.

П.2.1. График функции распределения непрерывной величины X

Рис. П.2.1. График функции распределения непрерывной величины X

Из рисунка видно, что F(x) — неубывающая функция, меняющаяся от 0 до 1. По мере возрастания X функция F(x) стремится к единице (при х —> °°, F(x) —> 1), а по мере уменьшения X функция F(x) приближается к 0 (при х —> -°°, F(x) —> 0). При этом вероятность попадания случайной величины в интервал от до х2 определяется формулой:

Справедливость формулы следует из определения функции распределения F(x) = Р(Х < х).

Закон распределения непрерывной случайной величины X может быть задан функцией плотности f(x), которая определяется как первая производная функции распределения F(x):

График функции плотности представлен на рис. П.2.2.

П.2.2. График функции плотности

Рис. П.2.2. График функции плотности

Из приведенного определения вытекают следующие свойства функции распределения:

  • • плотность есть неотрицательная функция, т.е. /(х) > 0;
  • • вероятность попадания случайной величины X в интервал Xj х2
  • v2

равна Р(х, < X < х2) = J f(x)dx, т.е. площади, ограниченной сверху графи-

Ч

ком плотности f(x)dx на интервале Х] + х2(рис. П.2.З.);

• подынтегральное выражение f(x)dx называется элементом вероятности. Оно определяет вероятность попадания случайной величины в интервал х -s- х + dx, где dx — бесконечно малая величина.

П.2.3. Вероятность Р(х

Рис. П.2.3. Вероятность Р(х{ <Х< х2) попадания X в интервал от ж, до х2

Площадь, ограниченная графиком плотности на всем интервале возможных значений X, равна единице (см. рис. П.2.2.), т.е. j f(x)dx = 1.

Числовые характеристики случайной величины

Для практического применения не всегда необходимо иметь полное представление о случайной величине, заложенное в законе распределения

вероятностей, а достаточно знать некоторые ее числовые характеристики, дающие представление об отдельных свойствах случайной величины.

К таким характеристикам, прежде всего, относится математическое ожидание MX и дисперсия DX случайной величины X.

Математическое ожидание MX характеризует среднее значение, центр, вокруг которого группируются возможные значения величины X.

Для дискретной случайной величины X с п возможными значениями хг и соответствующими вероятностями рх математическое ожидание определяется по формуле

Рассмотрим свойства математического ожидания, которые нам будут полезны для дальнейших статистических исследований.

• Математическое ожидание постоянной величины равно этой постоянной, т.е. М(с) = с.

Пусть X = с, где с — постоянная, тогда М(с) = с.

• Если ко всем возможным значениям величины X прибавить постоянную с, то математическое ожидание изменится на эту постоянную:

• Постоянный множитель с можно вынести за закон математического ожидания:

• Математическое ожидание суммы случайных величин Xv Х2, Хп равно сумме математических ожиданий этих величин:

Дисперсией DX называется математическое ожидание квадрата отклонения случайной величины X от ее математического ожидания MX:

Дисперсия DX характеризует средний разброс, рассеяние значений случайной величины X около математического ожидания.

Положительный корень из дисперсии yjDX называют средним квадратическим отклонением.

Для дискретной случайной величины X с п возможными значениями хх и соответствующими вероятностями pv где i = 1,2, ..., п, дисперсия определяется по формуле

Рассмотрим основные свойства дисперсии, которые достаточно просто выводятся с учетом свойств математического ожидания.

• Дисперсия постоянной величины равна нулю.

В самом деле, если X = С, то согласно свойству (II.2.1) МС = С, тогда

• Дисперсия не изменится, если все значения случайной величины X изменить на постоянную С:

• Постоянную величину С можно вынести за знак дисперсии, предварительно возведя ее в квадрат:

• Дисперсия суммы независимых случайных величин Xv Хъ ..., Хп равна сумме дисперсий этих величин:

Моменты случайной величины

Для характеристики случайной величины, кроме математического ожидания и дисперсии, применяются и моменты.

Моментом ^-порядка называется математическое ожидание k-и степени отклонения случайной величины X от некоторой постоянной с.

Если в качестве с берется нуль, моменты называют начальными, т.е.

Если с = М(Х), то моменты называются центральными, т.е.

В формулах, определяющих начальные и центральные моменты, нижние индексы указывают порядок момента.

С помощью свойств математического ожидания легко показать, что

Формула D(x) = р2 = v2 - употребляется для вычисления дисперсии.

Мерой скошенности графика плотности относительно математического ожидания служит коэффициент асимметрии

который для симметричных законов распределения равен нулю.

Нормальный закон распределения

Нормальное распределение — наиболее часто встречающийся вид распределения. С ним приходится сталкиваться при анализе погрешностей измерений, контроле технологических процессов и режимов, а также при анализе и прогнозировании различных явлений в экономике, социологии, демографии и других областях знаний.

Главная особенность нормального распределения состоит в том, что оно является предельным, к которому приближаются многие другие распределения.

Непрерывная случайная величина X подчиняется нормальному закону распределения, если ее функция плотности вероятности имеет вид:

Нормальный закон распределения зависит от двух параметров: р = MX — математического ожидания величины X и а2 = DX — дисперсии величины X. Отсюда следует, что о — среднее квадратичное отклонение величины X, которая, как и дисперсия, характеризует рассеяние значений X около математического ожидания р. В этом случае говорят, что X подчиняется нормальному закону с параметрами р, а, т.е. X е N(p, а).

Функция плотности нормального распределения /(х):

  • • симметрична относительно математического ожидания р;
  • 1
  • • достигает своего максимума при х - р, который равен —=?;

cw 2п

  • • стремится к нулю по мере отдаления х от р (х —> -<» и х —> +°°);
  • • положительна, т.е. f(x) > 0.

Площадь, ограниченная сверху графиком плотности/(х), равна единице.

Из указанных свойств следует, что график функции нормального распределения /(х) представляет собой колоколобразную кривую (рис. П.2.4).

График плотности нормального распределения

Рис. 11.2.4. График плотности нормального распределения

X е N(i; с)

Для построения таблиц нормального распределения переходят от случайной величины X, имеющей нормальное распределение с параметрами р и а, т.е. X е iV(p; а), к нормальной (стандартизированной) случайной величине

имеющей нормированное нормальное распределение с математическим ожиданием, равным нулю (МТ = 0) и дисперсией, равней единице (DT = 1), т.е. Те N(0; 1).

Воспользовавшись свойствами математического ожидания, покажем, что а на основании свойств дисперсии, что

Плотность нормированного нормального распределения описывается функцией

Эта функция симметрична относительно начала координат. Имеются таблицы плотности нормированного нормального распределения /(?) (см. табл. II.1.7) и интегральной функции Лапласа Ф(?) (см. табл. II.1.1). Интегральная функция Лапласа определяет вероятность попадания случайной величины Т в интервале —t 1

Графическое представление интегральной функции Лапласа дано на рис. 11.2.5.

П.2.5. Графическое представление функции Ф(?)

Рис. П.2.5. Графическое представление функции Ф(?)

Плотность нормированного нормального распределения является четной функцией, т.е. /(-?) = f(t), а интегральная функция Лапласа — нечетной, т.е. Ф(—0 = —Ф(?).

Таблица интегральной функции Лапласа (см. табл. П.1.1) позволяет достаточно просто решать задачи нахождения вероятности попадания нормальной случайной величины в заданный интервал.

В частности, из табл. П.1.1 следует, что:

При t- Ф(?=1) = 0,6827;

При t=2 Ф(? =2) = 0,9545;

При ? = 3 Ф(? = 3) = 0,9973.

Таким образом, вероятность того, что случайная величина Т, имеющая нормальное распределение, отклонится от своего математического ожидания (МТ = 0) на величину, не превышающую одно (/ = 1) среднее квадратическое отклонение а( = 1 равна 0,6827; два (t - 2) средних квадратичных отклонения равна 0,9545 и три (t = 3) — 0,9973.

Отсюда следует правило трех сигм (За), согласно которому практически равна нулю вероятность (0,0027) того, что нормальная случайная величина отклонится от своего математического ожидания на величину, превышающую За.

Вероятность попадания нормированной нормальной величины Т в интервал f, + t2 определяется по формуле

В справедливости этой формулы достаточно просто можно убедиться на рис П.2.6.

П.2.6. Определение вероятности P(t

Рис. П.2.6. Определение вероятности P(t{ 2)

Так как /(?) симметрична относительно начала координат, то Р( 0 < Т < ?,) = = — Ф(?,). Тогда согласно рис. П. 2.6 получим

что и требовалось доказать.

Вероятность попадания случайной величины X, имеющей нормальное распределение с параметрами р, а, т.е. X е N(p, а), в интервал хх2 определяется по формуле

х, - и х~ — U

где t, = -1—- и L = —— а а

Для симметричного относительно р интервала (р-5; р + 8) вероятность попадания в него случайной величины X определяется формулой:

где 8 = to.

Известно, что среднедушевой доход жителей города за месяц есть случайная величина, имеющая нормальное распределение со средним значением и = 876 руб. и средним квадратическим отклонением а = 150 руб. Определите, какая часть жителей города имеет среднедушевой доход: а) от 580 руб. до 1200 руб.; б) ниже 580 руб.

Таким образом, требуется рассчитать вероятность того, что случайная величина X, имеющая нормальное распределение, попадет в интервал лг, = 580 + х2 = 1200 руб., будет меньше 580 руб., т.е. попадает в интервал 0—580 руб. и от р - 150 до р + 150 руб.

Решение

а) определим вероятность Р(580 < X < 1200).

Имеем

* *,-(•* 580-876 4fV7 , *2-р 1200-876 плс

где t. = —-=-= —1,97; и t., = —-=-= 2,16.

1 а 150 2 ст 150

По табл. П.1.1 для Ct = -1,973 найдем Ф(?,) =-Ф( 1,973) =-0,9512, а для t2 = 2,16 — Ф(/2) = 0,9692. Тогда искомая вероятность

Таким образом, 96,02% жителей города имеют среднедушевой доход в месяц от 580 до 1200 руб.;

б) определим теперь долю жителей, доход которых в месяц меньше 580 руб., т.е. вероятность того, что

* 0-876 _я/ , 580-876 .

где t, =-= -5,84 и t,=---== -1,97.

1 150 2 150

По табл. П. 1.1 для г,= -5,84 найдем -Ф(5,84) = -1, а для t2 = -1,973 найдем Ф(-1,973) = -0,9512. Тогда искомая вероятность равна

Таким образом, 2,44% жителей города имеют в месяц доход ниже 580 руб.

Результаты решения примера П.2.2 представлены на рис. П.2.7.

П.2.7. Определение вероятностей

Рис. П.2.7. Определение вероятностей

Биноминальный закон распределения

Биноминальный закон представляет собой распределение вероятностей возможных чисел т появления события А при п независимых испытаний, в каждом из которых событие А может осуществиться с одной и той же вероятностью Р(А) - р - const. Кроме события А может произойти также противоположное событие А, вероятность которого Р(А) = 1 - р = q.

Вероятность осуществления события А - т раз при п независимых испытаниях с одинаковой вероятностью р можно рассчитать по формуле Бернулли, которая и определяет биноминальный закон распределения:

п I

где Ст =--число сочетаний из п элементов по т элементов,

" т(п- т)

а факториал п = п-(п-1) -... - 3 - 2 -1.

Из формулы Бернулли следует, что биноминальный закон распределения зависит от двух параметров пир.

Математическое ожидание частоты т появления события А при п независимых ожиданий:

дисперсия частоты т появления события А:

а среднее квадратическое отклонение:

При достаточно большом числе наблюдений (п > 100) биноминальное распределение сходится к нормальному распределению с математическим ожиданием М{т) = пр и средним квадратическим отклонением

о(т) = yjnpq, где q = 1 - р, т.е. т ~ N(np; yjnpq).

В этом случае вероятность того, что в п испытаниях событие А наступит т раз определяется с помощью локальной функции Лапласа

где /(?) — плотность нормированной нормальной случайной величины, определяется по табл. П.1.7 и t = т

yjnpq

При п > 100 вероятность того, что в п независимых испытаниях событие А наступит от тх до т2 раза определяется с помощью интегральной функции Лапласа

777. - Пр 777.. - Пр

где tx = *- wt2= *- .

yjnpq yjnpq

Значения Ф(?) определяются по табл. П. 1.1.

С учетом свойств математического ожидания и дисперсии следует, что

При достаточно большом числе испытаний п (п > 100) относительная частота (о = т/п имеет нормальное распределение. Поэтому вероятность того, что относительная частота со попадает в интервал coj со2, определяется по формуле

со. - р (091р ч

где t. = ,—— и L = — значение Ф(п определяется

р(1-р) р(1-р)

V п V п

по табл. П. 1.1. по рассчитанному значению ?.

Давно было замечено, что результаты отдельных наблюдений (экономических, демографических, социальных или иных наблюдений), хотя и произведенных в относительно однородных условиях, колеблются сильно, в то время как средние из большого числа наблюдений обнаруживают замечательную устойчивость.

Математическим основанием этого факта служат различные формы так называемого закона больших чисел.

Законом больших чисел можно назвать общий принцип, в силу которого совокупное действие большого числа случайных факторов приводит при некоторых весьма общих условиях к результату, почти не зависящему от случая.

Также хорошо известен «принцип практической невозможности», заключающийся в том, что маловероятные события на практике рассматриваются как невозможные.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >