Регрессионная модель с ошибками ARIMA имеет следующий общий вид (t = 1,...,T)
| Ls) ut = b (L) B (L) αt, | (1) |
t = 1,...,T.
yt - серия ответов.
Xt - строка t X, которая является матрицей векторов данных конкатенированного предиктора. То есть Xt - это наблюдение t каждой серии предикторов.
c - перехват регрессионной модели.
β - коэффициент регрессии.
ut - серия возмущений.
δ t - серия инноваций.
− j.
− apLp), который является степенью p, несезонным авторегрессионным многочленом.
ApsLps), что является степенью ps, сезонным авторегрессионным многочленом.
D, который представляет собой степень D, несезонный полином интегрирования.
), который представляет собой степень s, сезонный полином интегрирования.
+ bqLq), который является степенью q, несезонным скользящим средним многочленом.
BqsLqs), который является степенью qs, сезонным скользящим средним многочленом.
Если указано, что D = s = 0 (т.е. сезонная или несезонная интеграция не указывается), то каждый параметр идентифицируется. Другими словами, объективная функция правдоподобия чувствительна к изменению параметра, учитывая данные.
Если указано, что D > 0 или s > 0, и требуется оценить пересечение, c, то c не идентифицируется.
Вы можете показать, что это правда.
Рассмотрим уравнение 1. Решите для ut во втором уравнении и подставьте его в первое.
L)
где
L) (1 − Ls).
B (L).
Функция правдоподобия основана на распределении αt. Разгадать за αt.
(L) Η (L) Xtβ.
Заметим, что Ljc = c. Постоянный член способствует вероятности следующим образом.
(L) (1−L) D (c−c) =0
или
(L) (1−Ls) (1−L) D−1 (c−c) =0.
Следовательно, когда модель ошибок ARIMA интегрирована, целевая функция правдоподобия, основанная на распределении δ t, инвариантна значению c.
В общем, эффективная константа в эквивалентном представлении ARIMAX регрессионной модели с ошибками ARIMA является функцией составных авторегрессионных коэффициентов и исходного пересечения c и включает нелинейное ограничение. Это ограничение легко включается в такие приложения, как моделирование Монте-Карло интегрированных моделей с ненулевыми перехватами. Однако для оценки модель ARIMAX не способна идентифицировать константу в присутствии интегрированного полинома, и это приводит к ложным или необычным оценкам параметров.
В большинстве приложений следует исключить перехват из интегрированных моделей.
В качестве иллюстрации рассмотрим регрессионную модель с ошибками ARIMA (2,1,1) без предикторов
| ut = (1 + 0 .3L) αt, | (2) |
| ut = (1 + 0 .3L) αt. | (3) |
Можно переписать уравнение 3 с помощью подстановки и некоторых манипуляций
0,4 yt − 3 + αt + 0,3αt − 1.
Обратите внимание, что
Следовательно, регрессионная модель с ошибками ARIMA (2,1,1) в уравнении 3 имеет представление модели ARIMA (2,1,1).
+ αt + 0,3xpt − 1.
Можно видеть, что константа отсутствует в модели (что подразумевает, что ее значение равно 0), даже если значение регрессионной модели с перехватом ошибок ARIMA равно 0,5.
Можно также смоделировать это поведение. Начните с задания регрессионной модели с ошибками ARIMA (2,1,1) в уравнении 3.
Mdl0 = regARIMA('D',1,'AR',{0.8 -0.4},'MA',0.3,... 'Intercept',0.5,'Variance', 0.2);
Смоделировать 1000 наблюдений.
rng(1); T = 1000; y = simulate(Mdl0, T);
Подгонка Mdl к данным.
Mdl = regARIMA('ARLags',1:2,'MALags',1,'D',1);... % "Empty" model to pass into estimate [EstMdl,EstParamCov] = estimate(Mdl,y,'Display','params');
Warning: When ARIMA error model is integrated, the intercept is unidentifiable and cannot be estimated; a NaN is returned.
ARIMA(2,1,1) Error Model (Gaussian Distribution):
Value StandardError TStatistic PValue
________ _____________ __________ ___________
Intercept NaN NaN NaN NaN
AR{1} 0.89647 0.048507 18.481 2.9207e-76
AR{2} -0.45102 0.038916 -11.59 4.6573e-31
MA{1} 0.18804 0.054505 3.45 0.00056069
Variance 0.19789 0.0083512 23.696 3.9373e-124
estimate отображает предупреждение, информирующее о том, что перехват не идентифицируется, и устанавливает для его оценки, стандартной ошибки и t-статистики значение NaN.
Постройте график вероятности профиля для перехвата.
c = linspace(Mdl0.Intercept - 50,... Mdl0.Intercept + 50,100); % Grid of intercepts logL = nan(numel(c),1); % For preallocation for i = 1:numel(logL) EstMdl.Intercept = c(i); [~,~,~,logL(i)] = infer(EstMdl,y); end figure plot(c,logL) title('Profile Log-Likelihood with Respect to the Intercept') xlabel('Intercept') ylabel('Loglikelihood')

Логический результат не изменяется по сетке значений перехвата. Небольшое колебание является результатом численной процедуры, используемой infer.