Идентификация перехвата в регрессионных моделях с ошибками ARIMA

Идентификация перехвата

Регрессионная модель с ошибками ARIMA имеет следующий общий вид (t = 1,...,T)

\begin{matrix} _{yt} = c_{} +_{} \\ Xtβ + uta {(L) A}^{} (L)^{(} 1_{-} L) D (1 -_{} \end{matrix}

Ls) ut = b (L) B (L) αt,

(1)

где

t = 1,...,T.
_yt - серия ответов.
_Xt - строка t X, которая является матрицей векторов данных конкатенированного предиктора. То есть _Xt - это наблюдение t каждой серии предикторов.
c - перехват регрессионной модели.
β - коэффициент регрессии.
_ut - серия возмущений.
_{δ t} - серия инноваций.
$^{}_{Ljyt} =_{yt}$ − j.
$a (L) = (_{1} - a1L_{-} .^{.} .$ − apLp), который является степенью p, несезонным авторегрессионным многочленом.
$A (L) = (_{1} - A1L_{-_{.}} .^{._{}} -$ ApsLps), что является _{степенью} ps, сезонным авторегрессионным многочленом.
${(1 -}^{L})$ D, который представляет собой степень D, несезонный полином интегрирования.
$(1 -^{} Ls$ ), который представляет собой степень s, сезонный полином интегрирования.
$b (L) = (_{1} + b1L_{+} .^{.} .$ + bqLq), который является степенью q, несезонным скользящим средним многочленом.
$B (L) = (_{1} + B1L_{+_{.}} .^{._{}} +$ BqsLqs), который является _{степенью} qs, сезонным скользящим средним многочленом.

Если указано, что D = s = 0 (т.е. сезонная или несезонная интеграция не указывается), то каждый параметр идентифицируется. Другими словами, объективная функция правдоподобия чувствительна к изменению параметра, учитывая данные.
Если указано, что D > 0 или s > 0, и требуется оценить пересечение, c, то c не идентифицируется.

Вы можете показать, что это правда.

Рассмотрим уравнение 1. Решите для _ut во втором уравнении и подставьте его в первое.

$_{yt} = c_{} +^{Xtβ} + Start− 1_{} ($ L)
где
- $Start(L) = a {(L)}^{(} 1 - L)^{DA} ($ L) (1 − Ls).
- $(L) = b (L)$ B (L).
Функция правдоподобия основана на распределении _αt. Разгадать за _αt.

$_{εt}^{=Ν−1} (L) Η_{} (L)^{yt} +Ν−1 (L) Η^{} (L) c {+Ν−1}_{}$ (L) Η (L) Xtβ.
Заметим, что ^Ljc = c. Постоянный член способствует вероятности следующим образом.

$\begin{matrix} ^{Ν−1} (L) Η {(L)}^{c} =Ν−1 (L)^{(L)} (L)^{} \\ {(1−L)}^{D} (1-Ls) c^{=Ν−1 (L)} \\ (L) \end{matrix}$ (L) (1−L) D (c−c) =0
или

$\begin{matrix} ^{Ν−1} (L) Η {(L)}^{c} =Ν−1 (L) (L)^{}^{(L)} \\ ^{(1-Ls)} (1-L) Dc =Ν-1^{(L)}^{(L)} (L) \\ ^{(1−Ls)} (1−L) D−1^{(1−L)} c^{=Ν-1} (L) \\ (L) \end{matrix}$ (L) (1−Ls) (1−L) D−1 (c−c) =0.

Следовательно, когда модель ошибок ARIMA интегрирована, целевая функция правдоподобия, основанная на распределении _{δ t}, инвариантна значению c.

В общем, эффективная константа в эквивалентном представлении ARIMAX регрессионной модели с ошибками ARIMA является функцией составных авторегрессионных коэффициентов и исходного пересечения c и включает нелинейное ограничение. Это ограничение легко включается в такие приложения, как моделирование Монте-Карло интегрированных моделей с ненулевыми перехватами. Однако для оценки модель ARIMAX не способна идентифицировать константу в присутствии интегрированного полинома, и это приводит к ложным или необычным оценкам параметров.

В большинстве приложений следует исключить перехват из интегрированных моделей.

Иллюстрация идентификации перехвата

В качестве иллюстрации рассмотрим регрессионную модель с ошибками ARIMA (2,1,1) без предикторов

\begin{matrix} _{yt} = {0,5}_{} \\ + ut (1 − 0^{.} 8L + 0_{.} 4L2) (1 -_{L}) \end{matrix}

ut = (1 + 0 .3L) αt,

(2)

или

\begin{matrix} _{yt} = {0,5}_{} \\ + ut (1 − 1^{.} 8L +^{1} ._{} 2L2 - 0 ._{4L3}) \end{matrix}

ut = (1 + 0 .3L) αt.

(3)

Можно переписать уравнение 3 с помощью подстановки и некоторых манипуляций

$_{yt} = (1 − 1,8 + 1,2 − 0,4)_{} 0,5 +_{} 1,8yt − 1_{-}_{} 1,2yt −_{2 +}$ 0,4 yt − 3 + αt + 0,3αt − 1.

Обратите внимание, что

$(1−1.8+1.2−0.4)0.5=0(0.5)=0.$

Следовательно, регрессионная модель с ошибками ARIMA (2,1,1) в уравнении 3 имеет представление модели ARIMA (2,1,1).

$_{yt} =_{1,8yt} − 1_{-} 1,2yt_{- 2} +_{} {0,4yt}_{-} 3$ + αt + 0,3xpt − 1.

Можно видеть, что константа отсутствует в модели (что подразумевает, что ее значение равно 0), даже если значение регрессионной модели с перехватом ошибок ARIMA равно 0,5.

Можно также смоделировать это поведение. Начните с задания регрессионной модели с ошибками ARIMA (2,1,1) в уравнении 3.

Mdl0 = regARIMA('D',1,'AR',{0.8 -0.4},'MA',0.3,...
    'Intercept',0.5,'Variance', 0.2);

Смоделировать 1000 наблюдений.

rng(1);
T = 1000;            
y = simulate(Mdl0, T);

Подгонка Mdl к данным.

Mdl = regARIMA('ARLags',1:2,'MALags',1,'D',1);...
    % "Empty" model to pass into estimate
[EstMdl,EstParamCov] = estimate(Mdl,y,'Display','params');

Warning: When ARIMA error model is integrated, the intercept is unidentifiable and cannot be estimated; a NaN is returned.

 
    ARIMA(2,1,1) Error Model (Gaussian Distribution):
 
                  Value      StandardError    TStatistic      PValue   
                 ________    _____________    __________    ___________

    Intercept         NaN            NaN           NaN              NaN
    AR{1}         0.89647       0.048507        18.481       2.9207e-76
    AR{2}        -0.45102       0.038916        -11.59       4.6573e-31
    MA{1}         0.18804       0.054505          3.45       0.00056069
    Variance      0.19789      0.0083512        23.696      3.9373e-124

estimate отображает предупреждение, информирующее о том, что перехват не идентифицируется, и устанавливает для его оценки, стандартной ошибки и t-статистики значение NaN.

Постройте график вероятности профиля для перехвата.

c = linspace(Mdl0.Intercept - 50,...
    Mdl0.Intercept + 50,100); % Grid of intercepts
logL = nan(numel(c),1); % For preallocation

for i = 1:numel(logL)
    EstMdl.Intercept = c(i);
    [~,~,~,logL(i)] = infer(EstMdl,y);
end

figure
plot(c,logL)
title('Profile Log-Likelihood with Respect to the Intercept')
xlabel('Intercept')
ylabel('Loglikelihood')

Figure contains an axes. The axes with title Profile Log-Likelihood with Respect to the Intercept contains an object of type line.

Логический результат не изменяется по сетке значений перехвата. Небольшое колебание является результатом численной процедуры, используемой infer.

Связанные темы

Оценка регрессионной модели с ошибками ARIMA

Документация