Полная версия

Главная

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ

Методология применения моделей AR1MA

На практике часто встречаются нестационарные временные ряды, к которым сразу не могут быть применены модели, рассмотренные в предыдущем подпараграфе. Если случайный остаток, полученный вычитанием из исходного ряда его неслучайной составляющей f(t), представляет собой стационарный временной ряд, то исходный ряд называется нестационарным однородным [3].

Для описания таких рядов можно использовать модели авторегрессиипроинтегрированного скользящего среднего АРПСС.(р, d, q), или в англоязычном варианте – ARIMAfp, d, q) (autoregressive integrated moving average model). Эти модели также называют моделями Бокса – Дженкинса, по имени авторов[1], разработавших методологию их построения.

Данный подход опирается на идею преобразования с помощью процедур последовательных разностей нестационарных временных рядов в стационарные, динамика которых в дальнейшем может быть описана с помощью моделей ARMA(p, q).

В экономической практике наиболее распространены модели ARIMA(p, d, q) с небольшими значениями параметров, определяющих соответственно порядок авторегрессионной составляющей (/>), порядок скользящего среднего (q), а также порядок разности или дискретной производной (d).

Модель ARIMA применима к исходному временному ряду, если после дифференцирования k-го порядка (взятия последовательных разностей) временной ряд стал стационарным и его можно описать с помощью модели ARMA(p, q):

где k-я последовательная разность.

В дальнейшем с помощью модели для ряда разностей Δку, можно будет получить модель для исходного временного ряда. Например, в случае использования модели ARMA(p, q) для ряда разностей первого порядка () это можно сделать, опираясь на выражение; разностей второго порядка () – с помощью выражения

Подход к построению модели ARIMA ее авторы представили в виде трехступенчатой итеративной процедуры, включающей следующие этапы (ступени) [7]:

  • • идентификация пробной модели;
  • • оценивание параметров модели;
  • • диагностическая проверка адекватности модели.

В дальнейшем происходило развитие подхода к построению этих моделей, сопровождавшееся совершенствованием их программных реализаций в современных пакетах прикладных программ. Перечисленные укрупненные этапы, в свою очередь, можно разделить на последовательно реализуемые шаги при построении моделей ARIMA.

Первый шаг связан с получением стационарного ряда. При анализе стационарности используется графический анализ исходных данных, проводится исследование поведения коэффициентов автокорреляции, а также применяются получившие распространение в последнее время статистические тесты на наличие единичного корня (например, тест Дики – Фуллера, расширенный тест Дики – Фуллера и др.) [16, 26, 42].

Для перехода к стационарному ряду, как правило, применяют взятие последовательных разностей (процедуру дискретного дифференцирования).

На втором шаге после перехода к стационарному ряду выдвигаются гипотезы о значениях параметров р и q, определяющих соответственно порядок авторегрессии и скользящего среднего. При этом опираются на характерные черты в поведении коэффициентов выборочных АКФ и ЧАКФ. В результате может быть сформирован базовый набор моделей (включающий одну, две или большее число моделей).

Таким образом, процесс идентификации пробной модели предполагает определение порядка разности () для исходного ряда с целью обеспечения стационарности, а также выдвижение гипотез о значениях параметров р и q модели ARMA(p, q).

На третьем шаге происходит оценивание параметров моделей, причем в современных пакетах прикладных программ используются разные подходы (МПК, нелинейный МНК, метод максимального правдоподобия (ММП)). Как отмечают специалисты [26), все эти оценки асимптотически эквивалентны при больших объемах выборок.

На следующем, четвертом шаге анализируется ряд остатков, делаются выводы об адекватности модели. Остатки адекватной модели должны быть похожими на белый шум, при этом выборочные коэффициенты автокорреляции остатков не должны существенно отличаться от нуля.

Возможны подходы, связанные с проверкой значимости каждого коэффициента автокорреляции остатков отдельно, а также множества коэффициентов автокорреляции как группы [7, 26].

В первом случае, если выборочный коэффициент автокорреляции выходит за интервал , где определяется с помощью нормального закона распределения для заданного уровня доверительной вероятности, то нулевая гипотеза о равенстве нулю коэффициента рк отвергается.

Второй подход, связанный с проверкой значимости τ первых значений АКФ остатков, опирается на статистику Бокса – Пирса (Q) или ее модификацию – статистику Бокса – Льюнга (). Предложенная Боксом и Лыонгом модифицированная статистика имеет вид

(8.31)

где п – длина временного рядаостатков;– выборочный коэффициент автокорреляции при лаге

В отличие от статистики Бокса – Пирса модифицированная статистикапридает меньший вес "далеким" коэффициентам автокорреляции (с большим лагом), при этом, как отмечается в работе [26], для конечных выборок ее распределение ближе к, что делает более предпочтительным ее применение на практике.

При нулевой гипотезе об отсутствии автокорреляции статистика имеет распределение степенями свободы, где р, q – параметры ARMA-модели.

Если, то как группа первые τ коэффициентов автокорреляции значимы (т.е. не всеравны нулю).

Пример 8.10

Продемонстрируем использование критерия (8.31) для анализа адекватности модели ARIMA(0.1. 1), примененной к временному ряду с числом наблюдений п = 65. В табл. 8.21 приведены первые 18 значений коэффициентов автокорреляции.

Таблица 8.21

Значения коэффициентов автокорреляции гк остатков модели ARIMA(0, 1, 1) для лагов k = 1, 2,18

к

п

к

п

к

Гк

1

-0,091

7

0,212

13

-0,048

2

0,065

8

-0,056

14

0,046

3

0,107

9

-0,150

15

-0.060

4

0,170

10

0,140

16

-0.190

5

0,076

11

-0.120

17

0,081

6

-0,080

12

0,037

18

-0,174

Согласно формуле (8.32)

Расчетное значение, составившее 20,1, уступает табличному значениюс 17 степенями свободы (например,).

Таким образом, результаты применения критерия Бокса – Лыонга свидетельствуют об адекватности модели. В рассмотренном примере полученный вывод был ожидаемым, так как представленные в таблице коэффициенты автокорреляции невелики и уступают по модулю значению

В статистических пакетах для удобства пользователя не только указывается расчетное значение, но и приводится вероятность, обозначаемая р или sig. (significance). Соответственно, если она мала, например не превышает 0,1, это указывает на то, что как группа первые τ коэффициентов автокорреляции значимы.

При окончательном выборе модели существенную помощь могут оказать гак называемые информационные критерии, учитывающие два требования: повышение точности модели и уменьшение числа ее параметров (коэффициентов).

На практике получил распространение информационный критерий Акайке (Akaike Information Criterion, AIC), определяемый формулой

где– уровни ряда остатков.

Разработанный Г. Шварцем (G. Schwarz) байесовский информационный критерий (Bayesian Information Criterion, BIC) носит аналогичный характер:

(8.32)

Сравнение этих критериев показывает, что в формуле (8.32) усиливается требование к простоте модели, уменьшению числа ее параметров. Очевидно, что выбор следует сделать в пользу модели с меньшим значением информационного критерия.

Эти критерии помогают исследователю при окончательном выборе модели, однако не заменяют этап тщательного анализа ее качества, причем на практике результаты, опирающиеся на значения критериев AIC и BIC, могут быть различными.

Следует отметить, что в случае выявления несоответствия, неадекватности моделей исходным данным возникает необходимость повторения всего итеративного цикла, включающего идентификацию, оценивание параметров и диагностическую проверку пробных моделей.

Сезонная модель БоксаДженкинса может быть представлена в виде

где к параметрам модели р, d, q добавлены– сезонный параметр авторегрессии; – сезонный параметр скользящего среднего;– параметр, определяющий порядок сезонной разности (сезонной производной).

При наличии ярко выраженной сезонной компоненты целесообразно включение в модель сезонного дифференцирования. Например, при наличии сезонности в квартальных данных используется разность для периода, равного четырем:; ежемесячных данных – для периода, равного 12:

Однако при решении практических экономических задач не рекомендуется использовать сезонные производные больше первого порядка.

Анализ АКФ и ЧАКФ также полезен при определении значений параметровсезонной авторегрессии SAR(Ps) и сезонного скользящего среднего SMA(). Однако теперь внимание исследователя привлекают сезонные лаги, так как все типичные проявления, всплески будут удалены друг от друга на величину лага S, где 5 – период сезонности.

При построении сезонной модели AR1MA(jj, d, q)() часто сначала обращаются к процедуре логарифмирования исходных данных (для снижения дисперсии процесса), затем берут одну несезонную и одну сезонную разности (дифференцирование для несезонной части может и не потребоваться). Для полученного производного ряда определяются значения АКФ и ЧАКФ, анализируется их характер.

Пример 8.11

Рассмотрим применение описанного подхода для прогнозирования временного ряда ежемесячном динамики производства электроэнергии в Российской Федерации, обладающего ярко выраженными сезонными колебаниями. Длина временного ряда п = 132, исходные данные охватывали период с января 2002 г. по декабрь 2012 г.

В результате логарифмирования исходного ряда, а также применения процедуры дифференцирования (взятия как сезонной, так и несезонной разности) был осуществлен переход к уровням временного ряда:

(8.33)

Очевидно, что при этом были потеряны первые 13 уровней. Анализ характера поведения АКФ и ЧАКФ для временного ряда, полученного в результате указанных преобразовании, показал наличие всплеска на 12-м сезонном лаге в ЧАКФ и затухающих всплесков на сезонных лагах в АКФ. Это позволило выдвинуть предположение о целесообразности включения в модель в качестве составляющей сезонной авторегрессии.

В качестве лучшей по значению байесовского информационного критерия была выбрана модель ARIMA(0, 1, 1)(1. 1. 0). что также хорошо согласуется с поведением АКФ и ЧАКФ. Оценки коэффициентов модели, полученные в пакете IBM SPSS Statistics, показаны в табл. 8.22. Последняя графа таблицы свидетельствует о значимости коэффициентов, так же как и высокие по модулю значения t-статистики.

Таблица 8.22

Оценки параметров модели ARIMA(0,1,1)(1,1, 0), полученные с использованием пакета IBM SPSS Statistics

Оценка

Стандартная

ошибка

t

Знач.

Натуральный

логарифм

Дифференцирование

1

сс

Лаг 1

0,331

0.087

3,794

0,000

АР, сезонная

Лаг 1

-0,539

0,084

-6,451

0,000

Сезонное дифференцирование

1

Полученная модель может быть представлена в виде

где взаимосвязь wtc уровнями исходного ряда определяется выражением (8.34).

Результаты моделирования представлены на рис. 8.26, пунктиром показаны расчетные уровни, в том числе прогнозные оценки производства на первое полугодие 2013 г. Модель достаточно хорошо описывает динамику временного ряда. Средняя относительная ошибка по модулю – 1,6%, анализ остатков указывает на случайный характер их колебаний около нуля и отсутствие значимой автокорреляции.

Следует отметить, что развитие современного аналитического программного обеспечения существенно упрощает процесс обработки временных данных, предоставляя пользователю широкий спектр моделей, а также средств для их диагностической проверки.

  • [1] Подход Бокса – Дженкинса (Box -Jenkins approach) связан с именами ученых Дж. Бокса (G. Е. Р. Box) и Г. Дженкинса (G. М. Jenkins), разработавших методологию построения моделей ARIMA.
 
<<   СОДЕРЖАНИЕ