В таблице 6.10 представлены как фактические, так и теоретические значения коррелограммы остатков, полученных после решения уравнения регрессии log(USDollar) = с + а × log(USDollar(—1)) + МА(1). В таблице представлены значения автокорреляционной и частной автокорреляционной функций (т. е. автокорреляция между двумя лагами без учета влияния других промежуточных временных лагов). Как вычисляются коэффициенты автокорреляции и частной автокорреляции, можно уточнить в формулах (3.7–3.9).
Важной особенностью коррелограммы остатков, полученных по стационарным моделям, является то, что с увеличением величины лага значения автокорреляционной функции медленно, но с завидным постоянством убывают к нулю, в то время как частная автокорреляционная функция начинает колебаться около нуля уже со второго лага, при этом то немного вырастая, то убывая.
Стационарная модель считается хорошо построенной, если фактические значения коррелограммы окажутся близкими к ее теоретическим значениям. Как видим, в этом случае у нас это получилось.
Близость между фактическими и теоретическими значениями коррелограммы наглядно представлена на рис. 6.8. При этом теоретические значения коррелограммы с целью большей наглядности обозначены на рисунке горизонтальной линией, а фактические значения вертикальными линиями.
6.4. Оценка стабильности стационарной модели авторегрессии со скользящей средней
На основе данных за период с июня 1992 г. по июнь 2010 г. необходимо с помощью модели log(USDollar) = с + а × log(USDollar(-1)) + МА(1) составить точечный и интервальный прогнозы по курсу доллара на июль 2010 г. Однако прежде проведем анализ стандартных и стьюдентизированных остатков, полученных в этой модели, на предмет наличия выбросов, причем особое внимание будем обращать на наличие выбросов в последних наблюдениях, которые в большей степени могут повлиять на точность текущего прогнозирования. Для расчета стандартных и стьюдентизированных остатков следует воспользоваться алгоритмами действий № 16 и 17.
В результате у нас получилась табл. 6.11, а также диаграмма стьюдентизированных остатков на рис. 6.9. Если эту таблицу сравнить с табл. 5.9, то выяснится следующее важное обстоятельство. В статистической модели log(USDollar) = с + а × log(USDollar(-l)) + МА(1)из 11 выбросов, выявленных с помощью стандартных и стьюдентизированных остатков, шесть выбросов приходятся на период 1992–1993 гг., т. е. имели место в период самых первых наблюдений. В свою очередь остальные четыре выброса произошли с августа по ноябрь 1998 г., в период после дефолта. В то же время в период глобального финансового кризиса в остатках этой модели обнаруживается лишь один выброс, относящийся к январю 2009 г.
Для справки заметим, что в остатках, получившихся после решения уравнения регрессии USDOLLAR = а × USDOLLAR(-l) + b × USDOLLAR(-2), имели место девять выбросов. Причем до августа 1998 г. в этой модели выбросы не выявлены, но зато было пять выбросов после августовского дефолта — с августа по декабрь 1998 г. и четыре выброса в период глобального финансового кризиса — в январе, феврале, марте и мае 2009 г. Таким образом, в последние годы стационарная модель log(USDollar) = с + а × log(USDollar(-l)) + МА(1) демонстрирует гораздо большую стабильность, чем нестационарная модель USDOLLAR = а × USDOLLAR(-l) + b × USDOLLAR(-2).
На рисунке 6.9 приведена диаграмма, из которой хорошо видно, что, за исключением одного уже упомянутого случая, выбросы в стационарной модели после 1998 г. уже не наблюдались.
В главе 4 уже говорилось, что тест Чоу на точность прогноза хорошо подходит для анализа стабильности статистической модели относительно последнего наблюдения. Поэтому мы воспользовались этим тестом, чтобы еще раз убедиться в стабильности модели log(USDollar) = с + а × log(USDollar(-l)) + МА(1) относительно июня 2010 г. (см. алгоритм действий № 19). В результате у нас получилась табл. 6.12. Судя по уровню значимости F-критерия (F-statistic) и логарифма правдоподобия (Log likelihood ratio), можно сделать вывод, что нулевая гипотеза о структурной стабильности статистической модели относительно последнего наблюдения подтверждается с большим уровнем надежности. Отметим еще раз, что нулевая гипотеза может быть отвергнута, если уровень значимости (Probability) F-критерия и логарифма правдоподобия будет ниже 0,05.
6.5. Оценка точности стационарной модели ARMA
Поскольку мы уже убедились в относительной стабильности стационарной модели log(USDollar) = с + а × log(USDollar(-l)) + МА(1), то теперь можем сделать точечный прогноз на июль 2010 г. на основе данных за период с июня 1992 г. по июнь 2010 г. (см. алгоритм действий № 11 «Как в EViews построить точечный прогноз»). При этом следует иметь в виду, что составление прогнозов по логарифмическому временному ряду имеет некоторую специфику. По умолчанию диалоговое мини-окно FORECAST (прогноз) при работе с логарифмическим рядом в опции SERIES ТО FORECAST (ряд для прогноза) указывает на файл с данными для исходного временного ряда USDOLLAR (рис. 6.10). В этом случае прогнозы будут даваться не в логарифмическом, а в исходном виде, т. е. в том виде, который обычно необходим для прогноза по валютному рынку. Однако при необходимости пользователь может самостоятельно поставить «галочку» у файла LOG(USDOLLAR) и получить прогнозы в логарифмическом виде.
В результате мы получили табл. 6.13, в которой наряду с оценкой точности стационарной прогностической модели log(USDollar) = с + а × log(USDollar(-1)) + МА(1) поместили и оценку точности нестационарной статистической модели USDOLLAR = а × USDOLLAR(-l) + а × USDOLLAR(-2) за период с июня 1992 г. по июнь 2010 г.
О содержательной интерпретации параметров, представленных в табл. 6.13, мы уже говорили (см. алгоритм действий № 8 «Как оценить точность статистической модели в EViews»).
Нетрудно заметить, что хотя в целом по уровню точности обе модели имеют довольно близкие оценки, тем не менее стационарная модель по ряду показателей уступает нестационарной модели. Так, довольно существенным кажется отклонение по величине средней ошибки по модулю (Mean Absolute Error) и по величине средней ошибки по модулю в процентах (Mean Absolute Percentage Error). Например, в целом за весь период средняя ошибка по модулю для стационарной модели оказалась на 2,45 процентного пункта выше, чем у нестационарной, а по величине средней ошибки по модулю в процентах — почти на 0,46 пункта.