Полная версия

Главная

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ   >>

1.3.3. Основные числовые характеристики одномерных количественных данных

Для того чтобы изучать какие-то количественные переменные и сравнивать их между собой, необходимо уметь рассчитывать основные числовые характеристики признаков.

Для проведения дальнейших вычислений, как правило, интервальный вариационный ряд заменяется на дискретный. С этой целью все значения признака в пределах каждого интервала приравниваются к его срединному значению

Характеристики центра группирования данных

Средние величины. Средние представляют собой обобщающие показатели, характеризующие центр группирования данных. Обычно рассматривают средние: арифметическую, гармоническую и геометрическую.

Вид средней выбирается согласно следующему свойству: значение определяющей функции не изменится, если исходные данные заменить средней.

Вывод средних рассмотрим на конкретных примерах.

Средняя арифметическая (arithmetic mean, mean, average).

Средняя арифметическая (сумма всех имеющихся наблюдений, деленная на их количество) – одна из основных числовых статистических характеристик, отражающая среднее от значений имеющихся наблюдений.

Фонд оплаты труда п работников можно представить как и как , где – средняя заработная плата п работников. Тогда

и получаем среднюю арифметическую

(1.2)

Если данные сгруппированы, причем заработную платуполучаютработников, где , т.е. имеем

то получается средняя арифметическая взвешенная:

(1.3)

Средняя гармоническая (garmonic mean).

Пример 1.21

В единицу времени п рабочих изготавливают соответственно изделий.

Требуется определить среднюю производительность труда п рабочих.

Суммарное время изготовления п изделий п рабочими равно

Определяющее правило: суммарное время изготовления рабочими п изделий не изменится, если все х, заменить на х.

Отсюда получается средняя гармоническая

(1.4)

Пример 1.22

Пусть за время пути автомобиль /и, километров проехал со скоростью, где !. Требуется определить среднюю скорость автомобиля за все время пути.

Определяющее правило: общее время в пути не изменится, если фактическую скоростьзаменить на среднюю.

Из определяющей функции следует, что суммарное время равно Тогда получается средняя гармоническая взвешенная:

(1.5)

Средняя геометрическая (geometric mean).

Пример 1.23

Пусть – темпы роста объема производства за п лет. Требуется определить средний темп роста.

Определяющее правило: произведение темпов роста не изменится, если все х,.л'2,.... заменить на средний теми роста Тгсом, т.е. выполняется условие , тогда имеет место средняя геометрическая:

(1.6)

Если данные сгруппированы и лг,- – i-e значение признака – наблюдалось т, раз. где i = 1,2, …, к, причем , то получается средняя геометрическая взвешенная:

(1.7)

Средние геометрические используют часто при анализе временных данных.

Свойства средней арифметической

Из рассмотренных средних наибольшее распространение на практике имеет средняя арифметическая (1.2). Рассмотрим подробнее ее свойства.

1. Средняя арифметическая постоянной величины равна самой постоянной.

Пусть х{ = с для всех 1 = 1,2 п. Тогда, подставив с вместо х{ в формулу средней, легко получим х = с.

2. Если ко всем значениям xi прибавить постоянную с, то средняя арифметическая изменится на эту постоянную, т.е.

В самом деле:

  • 3. Если все значения хi умножить на постоянную с, то средняя арифметическая изменится в с раз, т.е.
  • 4. Средняя арифметическая от линейной функции равна линейной функции от средней арифметической:

где а и с – постоянные величины. В самом деле:

Пример 1.24

На раскрой каждого из восьми костюмов на фабрике затрачено соответственно 60, 55, 50, 52, 45, 49, 58 и 46 мин. Необходимо определить среднюю арифметическую затраченного времени.

Средняя арифметическая для несгруппированных данных вычисляется по формуле (1.2):

Таким образом, среднее время, затрачиваемое на раскрой одного костюма, составляет около 52 мин.

Пример 1.25

На основе интервального вариационного ряда объемов производства предприятий легкой промышленности, представленного в таблице, требуется вычислить среднюю арифметическую этих объемов.

Объем производства, уст. ед.

102-104

104-106

106-108

108-110

110-112

Количество предприятий

7

14

13

9

7

Средняя арифметическая для сгруппированных данных – интервального ряда – вычисляется по формуле (1.3):

Другие характеристики центра группирования

Медиана (median) – значение признака, приходящего на середину вариационного (ранжированного) ряда наблюдений.

Для несгруппированных данных:

• если число наблюдений нечетное,, гдето

• если число наблюдений четное,

Например, при п = 5 имеем и при п = 6 имеем

Для интервального вариационного ряда медианным называют первый и нтервал , для которого накопленная частота впервые превышает половину объема наблюдений (или равна ей), т.е. , а , где

Медиана для интервального вариационного ряда вычисляется по формуле

(1.8)

где – нижняя граница медианного интервала;– накопленная частота интервала, предшествующего медианному;– частота медианного интервала;– ширина интервала группирования.

Свойство медианы: сумма абсолютных отклонений признака от Me меньше, чем от любой другой величины:

Мода (mode) – наиболее часто встречаемое значение признака – для интервального сгруппированного вариационного одномодального ряда равна

(1.9)

где – нижняя граница модального интервала (интервала с наибольшей частотой) (рис. 1.22); – частота модального интервала; – частота интервала, предшествующего модальному; – частота интервала, следующего за модальным.

Модальный интервал (выделен штриховкой)

Рис. 1.22. Модальный интервал (выделен штриховкой)

Все основные формулы для расчета характеристик центра группирования данных сведем в обобщающую таблицу (табл. 1.13).

Таблица 1.13

Формулы для расчета показателей центра группирования признака

Числовая характеристика

По несгруппированным данным д ,, лг2, •••> хп> п – число наблюдений

По сгруппированным данням – вариационному ряду (дискретному или непрерывному)

xi – значение признака (для дискретного ряда) или середина интервала (для непрерывного);

mi – частота значения xi;

– число наблюдений

Формула

Функция MS Excel

Средняя арифметическая

Средняя гармоническая

Средняя геометрическая

Медиана

Мода

Пример 1.26

На раскрой каждого из восьми костюмов на фабрике затрачено соответственно 60, 55, 50, 52, 45, 49, 58 и 46 мин. Необходимо определить медиану.

Решение

Данные не сгруппированы. Для определения медианы построим вариационный ряд:

xi

60

55

50

52

45

49

58

46

Вариационный ряд

45

46

49

50

52

55

58

60

Число наблюдений четно, поэтому медиана находится как среднее арифметическое двух средних значений:

Пример 1.27

На основе интервального вариационного объемов производства предприятий легкой промышленности, представленного в таблице примера 1.25, требуется вычислить моду и медиану.

Решение

Выпишем частоты и накопленные частоты:

Объем производства, усл. ед.

102-104

104-106

модаль

ный

106-108

медиан

ный

108-110

110-112

Количество предприятий (частота) т,

7

14

13

9

7

Накопленная частота /и-п)

7

21

34

43

50

Модальный интервал (интервал с наибольшей частотой) здесь – второй интервал (104–106),;. По вариационному ряду мода определяется по формуле (1.9):

Для нахождения медианного интервала рассмотрим накопленные частоты. Впервые половина выборки (наблюдений) превышается на третьем интервале (106–108), следовательно, этот интервал является медианным. Значение медианы вычислим по формуле (1.8):

Показатели вариации и моменты распределения

Показатели вариации характеризуют величину разброса наблюдаемых значенийотносительно среднего значения.

Дисперсия (variation) – средняя арифметическая квадрата отклонения наблюдаемых значенийот средней арифметической

(1.10)

Если данные сгруппированы иi-e значение признака – наблюдалось т, раз, где, причем, то получим взвешенную формулу дисперсии

(1.11)

Рассмотрим свойства дисперсии.

1. Дисперсия постоянной величины равна нулю:

Пусть с = const и Xj = с для всех i = 1,2,п, тогда, учитывая свойства средней арифметической и подставляя в формулу (1.10) с вместо .г,, получим

2. Если ко всем х, прибавить с, где с = const, то дисперсия не изменится.

Пусть с = const, тогда, учитывая формулу (1.9) и свойства средней арифметической, получим

3. Если все х, умножить на с, где с = const, то дисперсия увеличится в с2 раз.

Пусть где с = const, тогда

4. Пустьдля всех i = 1,2,..., п и b, с – const. Тогда

Иногда в качестве оценки дисперсии используют ее несмещенную оценку [10, 28] – так называемую исправленную выборочную дисперсию:

Из формул (1.10) и (1.11) следует, что дисперсия имеет размерность, равную квадрату размерности признака. Таким образом, если признак х измеряется в рублях, то размерность дисперсии – [руб.2], что представляется неудобным во многих задачах. Для этого была введена еще одна статистическая характеристика разброса, лишенная этого недостатка.

Среднее квадратическое (стандартное) отклонение (standard deviation) S, равное положительному корню из дисперсии, имеет ту же размерность, что и х.

Среднее квадратическое отклонение равно

(1.12)

Размах вариации (range) равен разности между максимальным и минимальным значениями признака:

где– максимальное, а– минимальное значение признака.

Размах вариации и среднее квадратическое отклонение связаны примерным соотношением

Квартили (от лат. quarto – четыре или quarto – четверть) – это такие значения изучаемого признака, левее (нижний квартиль) или правее (верхний квартиль) которых находится четверть всех наблюдений.

– эторанжированное наблюдение – первый (нижний) квартиль

[56] – значение вариационного ряда данных, левее которого находится четверть (25%) всех наблюдений (см. рис. 1.22);

– это-ранжированное наблюдение – третий (верхний) квартиль – значение вариационного ряда данных, правее которого находится четверть (25%) всех наблюдений.

Например, если п = 15, то

Имеем , левее и правее этих значений в ранжированном ряду находится по четверти всех наблюдений.

Второй квартиль– это рассмотренная ранее медиана Me, левее и правее которой находится половина всех значений (в данном примере это восьмое значение в ранжированном ряду).

Таким образом, три квартиляделят всю совокупность изучаемого признака на четыре равные по количеству наблюдений части (рис. 1.23).

Иитерквартильпый размах (interquartile range) отражает среднюю половину (50%) данных – различия между первым и третьим квартилем (см. рис. 1.23):

Коэффициент вариации (coefficient of variation) является единственным безразмерным показателем вариации:

но чаще используется его представление в процентах:

(1.13)

Квартили и интерквартильный размах

Рис. 1.23. Квартили и интерквартильный размах

Было отобрано по 10 корпусов каждого вида, т.е., у которых измерены

диаметры корпусов. Сравним точность обработки диаметра корпусов двух видов. Решение

По результатам измерения получено Отсюда коэффициенты вариации для корпусов двух видов равны

Таким образом, точность изготовления деталей второго вида значительно выше.

Моменты распределения

Моментом к-го порядка называют среднюю арифметическую k-ii степени отклонения наблюдаемых значенийот постоянной с, т.е.

(1.14)

При с = 0 имеем начальный момент k-ro порядка:

(1.15)

При имеем

При имеем , т.е. средняя арифметическая есть начальный момент первого порядка.

Приначальный момент второго порядкаесть средняя арифметическая квадрата значения признака.

Обычно рассматривают моменты до четвертого порядка включительно, т.е..

При с = х имеем центральные моменты k-го порядка:

(1.16)

При k = 0 центральный момент нулевого порядка равен единице:

Центральный момент первого порядка (к = 1) всегда равен нулю:

В самом деле:

Центральный момент второго порядкаесть дисперсия:

Легко показать, что начальные и центральные моменты связаны соотношениями

(1.17)

Центральные моменты третьего и четвертого порядков обычно используются не сами но себе, а для расчета коэффициентов асимметрии и эксцесса.

Коэффициент асимметрии (skewness) характеризует степень асимметричности, скошенности распределения данных и находится по формуле

(1.18)

где – центральный момент третьего порядка: S – среднее квадратическое отклонение.

Коэффициент асимметрии был впервые введен Карлом Пирсоном в 1895 г.

Из формулы (1.18) следует, что при Ас>0 имеет место правосторонняя асимметрия (на графике более пологий спуск справа); при Лс<0 – левосторонняя асимметрия (на графике более пологий спуск слева); при Лс = 0 – идеально симметричное распределение (рис. 1.24).

Если, то асимметрия существенна.

Коэффициент эксцесса (kurtosis) – показатель, служащий мерой крутости (плосковершинности или островершинности) графика вариационного ряда в сравнении с кривой нормального распределения (см. гл. 2, учебники по теории вероятностей и математической статистике [10, 28]), определяемый по формуле

(1.19)

где– центральный момент четвертого порядка; S – среднее квадратическое отклонение.

Гистограммы симметричного распределения (а) и распределений с правосторонней (б) и левосторонней (в) асимметрией

Рис. 1.24. Гистограммы симметричного распределения (а) и распределений с правосторонней (б) и левосторонней (в) асимметрией

Если Ek> 0, то график ряда распределения является островершинным (рис. 1.25), если Ek < 0 – плосковершинным по сравнению с нормальным (у нормального распределения коэффициент эксцесса равен нулю).

Коэффициент эксцесса был впервые введен Карлом Пирсоном в 1905 г.[1] Также он ввел термины островершинности (leptokurtic), плосковершинности (platykurtic) и mesokurtic (примерно такая же, как у нормальной кривой, вершина). Позже известный статистик Уильям Сили Госсет (William Sealy Gosset, работавший под псевдонимом Стьюдент) в своей работе[2] привел забавные картинки, показывающие смысл и разницу "хвостов" у распределений с разными коэффициентами эксцесса (рис. 1.26).

Сравнение кривых трех распределений с различными коэффициентами эксцесса

Рис. 1.25. Сравнение кривых трех распределений с различными коэффициентами эксцесса

Картинки Стьюдента (У. Госсета), иллюстрирующие разницу плосковершинных (слева) и островершинных (справа) распределений

Рис. 1.26. Картинки Стьюдента (У. Госсета), иллюстрирующие разницу плосковершинных (слева) и островершинных (справа) распределений

Замечание 1.1. В некоторых источниках коэффициент эксцесса считают как отношение центрального момента четвертого порядка к квадрату дисперсии (не вычитая 3, как в формуле (1.19)).

В табл. 1.14 сведены основные формулы для расчета характеристик вариации данных.

Замечание 1.2. В MS Excel коэффициенты асимметрии и эксцесса считаются по другим формулам несмещенных оценок (см. описание функций и формулы в MS Excel, более подробное теоретическое обоснование можно почитать в книге: Крамер Г. Математические методы статистики: пер. с англ. М.: Мир, 1975). Поэтому результаты расчетов будут различны.

Таблица 1.14

Формулы для расчета показателей вариации и моментов распределения

Числовая

характеристика

По несгруппированным данным х{, дг2,Д'„. п – число наблюдений

По сгруппированным данным – вариационному ряду' (дискретному или непрерывному)

щ | от, | т2 | ... | /и, | ... | щ

Xt значение признака (для дискретного ряда) или середина интервала (для непрерывного); т, – частота значения х;, л = X от, – число наблюдений

Формула

Функция MS Excel

Дисперсия

Среднее квадратическое отклонение

Коэффициент

вариации

Начальные моменты k-то порядка

I Антральные моменты k-ro порядка

Коэффициент

асимметрии

Коэффициент

эксцесса

Пример 1.29

На изготовление каждой) из четырех электродвигателей затрачено соответственно 51, 49, 52 и 48 мин. Требуется найти:

  • а) среднее арифметическое, дисперсию и среднее квадратическое отклонение;
  • б) центральные моменты третьего и четвертого порядков;
  • в) коэффициенты асимметрии, эксцесса и вариации.

Решение

Для расчета числовых характеристик признака, данные по которому не сгруппированы, проведем дополнительные расчеты и сведем их в таблицу (табл. 1.15).

Таблица 1.15

Расчеты для примера 1.29

Номер

наблюдения i

1

2

3

4

Сумма значений в строке

Среднее значение в строке

Значение наблюдения

51

49

52

48

Отклонение от среднего

1

-1

2

-2

Квадрат отклонения от среднего

1

1

4

4

Куб отклонения от среднего

1

-1

8

-8

Четвертая степень отклонения от среднего

1

1

16

16

Теперь проведем расчеты по указанным формулам.

а) Среднее арифметическое по формуле (1.2):

Дисперсия по формуле (1.10) равна , среднее квадратическое отклонение (по формуле (1.12)):

б) Центральные моменты третьего и четвертого порядков равны согласно формуле (1-16)

в) Воспользуемся результатами расчетов пунктов а) и 6).

Коэффициент асимметрии по формуле (1.18) равен(рас

пределение симметрично).

Коэффициент эксцесса но формуле (1.19) равен

Коэффициент вариации по формуле (1.13) равен

Пример 1.30

Поданным примера 1.19 вычислим по исходным данным и интервальному вариационному ряду, построенному в ходе его решения:

  • • характеристики центра положения:
    • – средние: арифметическую, гармоническую и геометрическую:
    • – медиану;
    • – моду:
  • • характеристики вариации (разброса данных):
  • – дисперсию:
  • – среднее квадратическое отклонение;
  • – коэффициент вариации;
  • – центральные моменты первого, второго, третьего, четвертого порядков;
  • – коэффициент асимметрии;
  • – коэффициент эксцесса.

Решение

Все расчеты согласно заданию будем производить как для исходных несгруппированных данных (100 наблюдений) (по формуле и с помощью функций MS Excel) и для сгруппированных данных – интервального вариационного ряда, используя формулы, представленные в табл. 1.13 и 1.14.

Исходные несгруппированные данные xi (100 наблюдений)

Интервальный вариационный ряд (.гi – середина интервалов)

По формуле

С помощью функции MS Excel

k – число интервалов

5,449

5,449

5,464

По исходным данным:

По интервальному ряду дополним табл. 1.12 серединами интервалов (табл. 1.16) и дополнительными расчетами произведений середин интервалов на частоту.

Таблица 1.16

Интервальный вариационный ряд распределения объемов основных фондов 100 предприятий

Границы интервалов

Середина интервала xi

Частота mi

Накопленная частота тш

нижняя ai

верхняя bi

4.98

5,09

5,04

2

2

10,07

25,09

5,20

5,15

3

5

15,435

55.20

5,31

5,26

12

17

63,06

5,31

5,42

5,37

19

36

101,935

5,42

5,53

5,48

29

65

158,775

5,53

5,64

5,59

18

83

139,625

5,64

5,75

5,70

12

95

28,475

5,75

5,86

5,81

5

100

29,025

Сумма

100

546,40

В нашем примере .7 = 5,449 млн руб. по исходным данным и 7 = 5,464 млн руб. по интервальному ряду и характеризует среднее положение наблюдаемых значений, объем основных фондов (млн руб.) предприятий промышленности. Результаты расчетов но несгруппированным исходным данным и интервальному ряду всегда, как правило, немного различаются, так как при любой группировке происходит некоторое искажение данных и результаты получается приближенными.

Аналогично рассчитываем средние гармоническую и геометрическую.

Медиана (варианта, которая находится в середине ранжированного ряда) по формуле для несгруппированных данных рассчитывается как

Полученный результат показывает, что у половины предприятий средний объем основных фондов меньше 5,43 млн руб., а у половины предприятий – больше.

Медианный интервал у полученного интервального ряда – интервал, на котором впервые превышена накопленная частота, равная половине числа наблюдений (п/2 = 50 в нашем исследовании), – это пятый интервал в табл. 1.16 (5,42–5,53). Его накопленная частота, а у предыдущего интервала. Тогда

Мода (значение во множестве наблюдений, которое встречается наиболее часто) но формуле для несгруппированных данных рассчитывается как

В данном случае значение 5,43 встречается наиболее часто (15 раз) среди представленных данных.

Модальный интервал у полученного интервального ряда – интервал, имеющий наибольшую частоту встречаемости –– совпадает с медианным – это пятый интервал в табл. 1.16 (5,42–5,53). Тогда

Показатели вариации рассчитываются совершенно аналогично, поэтому сведем все полученные результаты в итоговую таблицу (табл. 1.17).

Таблица 1.17

Основные числовые характеристики распределения объемов основных фондов 100 промышленных предприятий

Характеристика

По исходным данным

По интервальному ряду

по формуле

MS Excel

Характеристики центра группирования

Средняя арифметическая

5,449

5,449

5,464

Средняя гармоническая

5,444

5,444

5,459

Средняя геометрическая

5,447

5,447

5,462

Медиана

5,430

5,430

5,473

Мода

5,430

5,430

5.472

Показатели вариации

Дисперсия

0,028

0,028

0,026

Среднее квадратическое отклонение

0,168

-

0,161

Коэффициент вариации, %

3,082

2.952

Центральный момент первого порядка

-2,82 • 10-5

-

5,51 • 10-16

Центральный момент второго порядка

0,028

0,026

Центральный момент третьего порядка

-0,0002033

-

-0,000791

Центральный момент четвертого порядка

0,0024

-

0,0021

Коэффициент асимметрии

-0,043

-0,044

-0,188

Коэффициент эксцесса

-0,017

-0,045

0,114

По табл. 1.17 можно сделать еще следующие комментарии. Полученные значения центрального момента первого порядка (он всегда равен нулю согласно формулам расчета) совсем немного отличаются от нуля вследствие промежуточных округлений в ячейках при вычислениях в MS Excel.

В данном случае коэффициент асимметрии Ас < 0, следовательно, имеет место левосторонняя несущественная асимметрия, так как коэффициент не превышает по модулю 0,5 и близок по модулю к нулю – т.е. распределение очень близко к симметричному (что мы и предполагали при анализе гистограммы на рис. 1.18).

Эксцесс отрицательный, это говорит о том, что график распределения имеет немного более плоскую вершину, чем нормальное распределение, но плосковершинность несущественна, так как коэффициент не превышает по модулю 0,5 и близок к нулю. По поводу получившейся разницы в расчетах по формуле и при использовании функции MS Excel см. замечание 1.2.

Диаграммы "ящик с усами"

Статистические пакеты позволяют строить еще один полезный и информативный вид графиков, объединяющий характеристики и центра группирования, и разброса, – так называемые диаграммы "ящик с усами" (ящичковые диаграммы) Вох& Whisker Plot [55, 56].

Их отличительной особенностью является то, что они графически отображают три характеристики данных:

  • • центральная точка показывает центр группирования данных, центральную тенденцию;
  • • "ящик" (box) отражает разброс вокруг центра;
  • • "усы" (whiskers) характеризуют размах наблюдений.

При этом возможны различные варианты построения таких графиков gо выбору исследователя. Например, статистический пакет STATISTICA (StatSoft) строит для одномерных данных четыре вида таких диаграмм (аналогичные графики можно построить в IBM SPSS Statistics и других статистических пакетах):

  • • медиана – квартили – размах (рис. 1.27 для данных примеров 1.19,1.30);
  • • среднее – стандартная ошибка среднего – стандартное отклонение;
  • • среднее – стандартное отклонение – 1,96 • стандартное отклонение (95%-ный нормальный доверительный интервал [10, 28] для наблюдений вокруг среднего);
  • • среднее – стандартная ошибка среднего – 1,96 • стандартная ошибка среднего (95%-ный нормальный доверительный интервал для генерального среднего) (рис. 1.28 для тех же данных).

Диаграмма

Рис. 1.27. Диаграмма "ящик с усами" вида "медиана – квартили – размах" для данных примера 1.19

Диаграмма

Рис. 1.28. Диаграмма "ящик с усами" вида "среднее – стандартная ошибка среднего – 95%-ный нормальный доверительный интервал для генерального среднего" для данных примера 1.19

Как следует из рис. 1.27 и 1.28, такие графики позволяют быстро оценить основные характеристики дескриптивной статистики, проанализировать центральную тенденцию и степень разброса данных и даже получить доверительные интервалы.

Представленные диаграммы являются хорошим способом анализа совокупности данных на аномальные наблюдения – выбросы (outliers) и экстремальные наблюдения (extremes). Например, на рис. 1.29 представлены данные по регионам России, отражающие количество автомобилей в регионе (см. пример 1.11) (построена в пакете STATISTICA [9] (StatSoft)).

Диаграмма

Рис. 1.29. Диаграмма "ящик с усами" вида "медиана – интерквартильный размах – размах" для данных по количеству автомобилей в регионе но регионам России

Рисунок 1.29 позволяет получить множество характеристик представленной совокупности – медиану распределения (половина регионов имеет количество автомобилей, не превышающее 278 460 шт.), интерквартильный размах – при этом 25% регионов имеет менее 160 980 автомобилей, а 25% – более 590 220 автомобилей. На графике сразу видны аномальные наблюдения (Свердловская обл. с 1 311 200 автомобилями) и экстремальные наблюдения – Санкт-Петербург, Краснодарский край, Московская обл. и Москва, число автомобилей в которых существенно превышает значения в остальных регионах. Кроме того, ящик и расположение в нем медианы показывают, что распределение обладает существенной правосторонней асимметрией (смещение вверх, в область высоких значений), в чем можно убедиться, построив гистограмму распределения (рис. 1.30).

Гистограмма распределения количества автомобилей в регионе по регионам России

Рис. 1.30. Гистограмма распределения количества автомобилей в регионе по регионам России

  • [1] Pearson К. Das fehlergesetz und seine verallgemeinerungen durch Fechner und Pearson. A Rejoinder // Biometrika. 1905. Vol. 4. P. 169–212.
  • [2] Student. Errors of routine analysis // Biometrika. 1927. Vol. 19. P. 151 – 164.
 
<<   СОДЕРЖАНИЕ   >>