exponenta event banner

Идентификация перехвата в регрессионных моделях с ошибками ARIMA

Идентификация перехвата

Регрессионная модель с ошибками ARIMA имеет следующий общий вид (t = 1,...,T)

yt = c + Xtβ + uta (L) A (L) (1 L) D (1 Ls) ut = b (L) B (L) αt,(1)
где

  • t = 1,...,T.

  • yt - серия ответов.

  • Xt - строка t X, которая является матрицей векторов данных конкатенированного предиктора. То есть Xt - это наблюдение t каждой серии предикторов.

  • c - перехват регрессионной модели.

  • β - коэффициент регрессии.

  • ut - серия возмущений.

  • δ t - серия инноваций.

  • Ljyt = yt − j.

  • a (L) = (1 a1L ... − apLp), который является степенью p, несезонным авторегрессионным многочленом.

  • A (L) = (1 A1L ... ApsLps), что является степенью ps, сезонным авторегрессионным многочленом.

  • (1 L) D, который представляет собой степень D, несезонный полином интегрирования.

  • (1 Ls), который представляет собой степень s, сезонный полином интегрирования.

  • b (L) = (1 + b1L +... + bqLq), который является степенью q, несезонным скользящим средним многочленом.

  • B (L) = (1 + B1L +... + BqsLqs), который является степенью qs, сезонным скользящим средним многочленом.

  • Если указано, что D = s = 0 (т.е. сезонная или несезонная интеграция не указывается), то каждый параметр идентифицируется. Другими словами, объективная функция правдоподобия чувствительна к изменению параметра, учитывая данные.

  • Если указано, что D > 0 или s > 0, и требуется оценить пересечение, c, то c не идентифицируется.

Вы можете показать, что это правда.

  • Рассмотрим уравнение 1. Решите для ut во втором уравнении и подставьте его в первое.

    yt = c + Xtβ + Start− 1 (L)

    где

    • Start( L) = a (L) (1 L) DA (L) (1 − Ls).

    • (L) = b (L) B (L).

  • Функция правдоподобия основана на распределении αt. Разгадать за αt.

    εt =Ν−1 (L) Η (L) yt +Ν−1 (L) Η (L) c +Ν−1 (L) Η (L) Xtβ.

  • Заметим, что Ljc = c. Постоянный член способствует вероятности следующим образом.

    Ν−1 (L) Η (L) c =Ν−1 (L) (L) (L) (1−L) D (1−Ls) c =Ν−1 (L) (L) (L) (1−L) D (c−c) =0

    или

    Ν−1 (L) Η (L) c =Ν−1 (L) (L) (L) (1−Ls) (1−L) Dc =Ν−1 (L) (L) (L) (1−Ls) (1−L) D−1 (1−L) c =Ν−1 (L) (L) (L) (1−Ls) (1−L) D−1 (c−c) =0.

Следовательно, когда модель ошибок ARIMA интегрирована, целевая функция правдоподобия, основанная на распределении δ t, инвариантна значению c.

В общем, эффективная константа в эквивалентном представлении ARIMAX регрессионной модели с ошибками ARIMA является функцией составных авторегрессионных коэффициентов и исходного пересечения c и включает нелинейное ограничение. Это ограничение легко включается в такие приложения, как моделирование Монте-Карло интегрированных моделей с ненулевыми перехватами. Однако для оценки модель ARIMAX не способна идентифицировать константу в присутствии интегрированного полинома, и это приводит к ложным или необычным оценкам параметров.

В большинстве приложений следует исключить перехват из интегрированных моделей.

Иллюстрация идентификации перехвата

В качестве иллюстрации рассмотрим регрессионную модель с ошибками ARIMA (2,1,1) без предикторов

yt = 0,5 + ut (1 − 0 .8L + 0 .4L2) (1 L) ut = (1 + 0 .3L) αt,(2)
или
yt = 0,5 + ut (1 − 1 .8L + 1 .2L2 0 .4L3) ut = (1 + 0 .3L) αt.(3)

Можно переписать уравнение 3 с помощью подстановки и некоторых манипуляций

yt = (1 − 1,8 + 1,2 − 0,4) 0,5 + 1,8yt 1 1,2yt − 2 + 0,4 yt − 3 + αt + 0,3αt − 1.

Обратите внимание, что

(1−1.8+1.2−0.4)0.5=0(0.5)=0.

Следовательно, регрессионная модель с ошибками ARIMA (2,1,1) в  уравнении 3 имеет представление модели ARIMA (2,1,1).

yt = 1,8yt − 1 1,2yt 2 + 0,4yt 3 + αt + 0,3xpt − 1.

Можно видеть, что константа отсутствует в модели (что подразумевает, что ее значение равно 0), даже если значение регрессионной модели с перехватом ошибок ARIMA равно 0,5.

Можно также смоделировать это поведение. Начните с задания регрессионной модели с ошибками ARIMA (2,1,1) в  уравнении 3.

Mdl0 = regARIMA('D',1,'AR',{0.8 -0.4},'MA',0.3,...
    'Intercept',0.5,'Variance', 0.2);

Смоделировать 1000 наблюдений.

rng(1);
T = 1000;            
y = simulate(Mdl0, T);

Подгонка Mdl к данным.

Mdl = regARIMA('ARLags',1:2,'MALags',1,'D',1);...
    % "Empty" model to pass into estimate
[EstMdl,EstParamCov] = estimate(Mdl,y,'Display','params');
Warning: When ARIMA error model is integrated, the intercept is unidentifiable and cannot be estimated; a NaN is returned.
 
    ARIMA(2,1,1) Error Model (Gaussian Distribution):
 
                  Value      StandardError    TStatistic      PValue   
                 ________    _____________    __________    ___________

    Intercept         NaN            NaN           NaN              NaN
    AR{1}         0.89647       0.048507        18.481       2.9207e-76
    AR{2}        -0.45102       0.038916        -11.59       4.6573e-31
    MA{1}         0.18804       0.054505          3.45       0.00056069
    Variance      0.19789      0.0083512        23.696      3.9373e-124

estimate отображает предупреждение, информирующее о том, что перехват не идентифицируется, и устанавливает для его оценки, стандартной ошибки и t-статистики значение NaN.

Постройте график вероятности профиля для перехвата.

c = linspace(Mdl0.Intercept - 50,...
    Mdl0.Intercept + 50,100); % Grid of intercepts
logL = nan(numel(c),1); % For preallocation

for i = 1:numel(logL)
    EstMdl.Intercept = c(i);
    [~,~,~,logL(i)] = infer(EstMdl,y);
end

figure
plot(c,logL)
title('Profile Log-Likelihood with Respect to the Intercept')
xlabel('Intercept')
ylabel('Loglikelihood')

Figure contains an axes. The axes with title Profile Log-Likelihood with Respect to the Intercept contains an object of type line.

Логический результат не изменяется по сетке значений перехвата. Небольшое колебание является результатом численной процедуры, используемой infer.

Связанные темы