Глава 3
Уравнения авторегрессии и авторегрессии со скользящим средним
3.1. Специфика уравнений авторегрессии (AR)
Во главе 2 мы убедились, что использование фактора времени для прогноза курса доллара не дает достаточно точного результата, поэтому необходимо найти более подходящую независимую переменную (или переменные). Как известно, согласно теории эффективного рынка, наиболее полную информацию для прогноза будущей стоимости какого-либо финансового актива в момент времени t можно извлечь из его цены в момент времени t-1. Причем точность прогноза уменьшается по мере того, как прогноз делается в моменты времени t-2, t-3 и т. д. Исходя из этого вполне очевидного постулата можно прийти к выводу, что наиболее полную информацию о курсе доллара на момент времени t содержит его курс на момент времени t-1. Следовательно, наиболее точный прогноз курса американской валюты можно рассчитать на основе уравнения регрессии, включив в него в качестве независимой переменной курс доллара с лагом t-1. Такого рода уравнения регрессии, в которых значения результативного признака прогнозируются на основе его предыдущих значений, в статистической литературе называют уравнениями авторегрессии.
Правда, в отличие от прогностической модели, в которой в качестве независимой переменной используется фактор времени, а потому горизонт для прогноза практически безграничен, прогноз по авторегрессионной модели имеет небольшой временной горизонт для прогноза, равный длине лага. В частности, модель авторегрессии с лагом в один месяц способна давать прогноз с упреждением в один месяц.
Помимо относительно небольшого временного горизонта для прогноза в процессе построения моделей авторегрессии возникает еще одна серьезная проблема. Дело в том, что наличие лаговых значений зависимой переменной в правой части уравнения приводит к нарушению одной из важнейших предпосылок метода наименьших квадратов (МНК) — об отсутствии связи между зависимой (результативной) и независимой (факторной) переменными. Если перейти к языку формул, то теоретически эта проблема может быть изложена следующим образом:
Yt= c + bYt-1 + e, (3.1)
где с — свободный член (константа) уравнения;
Yt — зависимая (результативная) переменная;
Yt-1 — независимая (факторная) переменная с лагом в один месяц;
b — соответствующий коэффициент при Yt-1,
еt — отклонение прогноза от фактического курса доллара (остаток) в текущем месяце t.
Таким образом, из формулы (3.1) следует, что в уравнении авторегрессии может иметь место, во-первых, зависимость между et и еt-1, т. е. может быть нарушена предпосылка МНК об отсутствии автокорреляция в остатках; во-вторых, может появиться зависимость между факторной переменной Y, и остатками et, т. е. будет нарушена предпосылка МНК о гомоскедастичности[9] остатков.
Наличие автокорреляции в остатках означает определенную связь (корреляцию) между остатками текущих и предыдущих наблюдений. При наличии такой зависимости остатки могут содержать определенную тенденцию либо какие-то циклические колебания. В этом случае делается вывод, что отклонения от прогноза не могут иметь случайный характер. При наличии автокорреляции в остатках оценки коэффициентов уравнения регрессии нельзя назвать состоятельными и эффективными.
Гомоскедастичность остатков означает, что дисперсия остатков Et не изменяется в зависимости от величины факторной переменной Yt_. Если это не так, то возникает гетероскедастичностъ остатков, что так же, как и в случае автокорреляции в остатках, влияет на состоятельность оценки коэффициентов уравнения регрессии.
Для справки заметим, что состоятельными называются такие оценки, чья точность повышается по мере роста объема выборки, объема данных, на основе которых строится уравнение регрессии. В свою очередь эффективными называются такие оценки, которые имеют наименьшую дисперсию.
Несмотря на высказанные опасения, многие авторитетные специалисты полагают, что в случае больших выборок уравнения авторегрессии позволяют получать состоятельные и эффективные оценки. Вот как, например, оценивает авторегрессионные модели профессор статистики Стэнфордского университета Т. Андерсон: «Модель авторегрессии обладает рядом преимуществ по сравнению с моделью скользящего среднего и процессом авторегрессии с остатками в виде скользящего среднего, хотя последние в определенных случаях могут хорошо описывать образование наблюдаемых временных рядов. Оценки коэффициентов процесса авторегрессии легко вычисляются. Статистические процедуры для такого процесса, основывающиеся на теории больших выборок, легко выполнимы, поскольку они соответствуют обычной технике наименьших квадратов. Во многих случаях коэффициенты процесса авторегрессии допускают непосредственную интерпретацию, а линейные функции от запаздывающих переменных могут быть использованы для прогнозирования»[10].
Следует заметить, что в зависимости от того, сколько предыдущих значений временного ряда будет включено в уравнение авторегрессии в качестве лаговых (факторных) переменных, принято различать авторегрессионные процессы разного порядка. Так, в формуле (3.1) представлен авторегрессионный процесс 1-го порядка, который в англоязычной литературе обычно называется словосочетанием Auto Regressive и кратко обозначается как AR(1).
Например, в том случае, когда в авторегрессию 1-го порядка добавляются лаговые переменные Yt-2 и Yt-3, его принято обозначать как AR(3), т. е. как авторегрессионный процесс 3-го порядка. При этом уравнение для AR(3) примет следующий вид:
Yt = с+b1Yt-1 +b2Yt-2+b3Yt-3 +et, (3.2)
где Yt-1, Yt-2 и Yt-3 — независимые (факторные) переменные с лагом в один, два и три месяца;
b1, b2 и b3 — соответствующие коэффициенты регрессии при лаговых переменных.
3.2. Специфика уравнений авторегрессии со скользящим средним (ARMA)