Идентификационная способность точки пересечения в регрессионных моделях с ошибками ARIMA

Точка пересечения

Регрессионная модель с ошибками ARIMA имеет следующую общую форму (t = 1,..., T)

\begin{matrix} y_{t} = c + X_{t} β + u_{t} \\ a (L) A (L) {(1 - L)}^{D} (1 - L^{s}) u_{t} = b (L) B (L) ε_{t}, \end{matrix}

(1)

где

t = 1..., T.
_yt - серия откликов.
_Xt - t строка X, которая является матрицей конкатенированных векторов данных предиктора. То есть _Xt является t наблюдения каждой серии предикторов.
c является регрессионной моделью точки пересечения.
β - коэффициент регрессии.
_ut - ряд нарушений порядка.
_εt - серия инноваций.
$L^{j} y_{t} = y_{t - j} .$
$a (L) = (1 - a_{1} L - ... - a_{p} L^{p}),$ который является p степени, несезональным авторегрессивным полиномом.
$A (L) = (1 - A_{1} L - ... - A_{p_{s}} L^{p_{s}}),$ который является _ps степени, сезонным авторегрессивным полиномом.
${(1 - L)}^{D},$ который является D степени, несезональным полиномом интегрирования.
$(1 - L^{s}),$ который является s степени, сезонным полиномом интегрирования.
$b (L) = (1 + b_{1} L + ... + b_{q} L^{q}),$ который является q степени, несезональным полиномом скользящего среднего значения.
$B (L) = (1 + B_{1} L + ... + B_{q_{s}} L^{q_{s}}),$ который является _qs степени, сезонным полиномом скользящего среднего значения.

Если вы задаете, что D = s = 0 (т.е. вы не указываете сезонное или несезонное интегрирование), то каждый параметр идентифицируется. Другими словами, целевая функция правдоподобия чувствительна к изменению параметра, учитывая данные.
Если вы задаете, что D > 0 или s > 0, и хотите оценить точку пересечения, c, то c не идентифицируется.

Можно показать, что это правда.

Рассмотрим уравнение 1. Решите для _ut во втором уравнении и замените его в первое.

$y_{t} = c + X_{t} β + Η^{- 1} (L) Ν (L) ε_{t},$
где
- $Η (L) = a (L) {(1 - L)}^{D} A (L) (1 - L^{s}) .$
- $Ν (L) = b (L) B (L) .$
Функция правдоподобия основана на распределении _εt. Решите для _εt.

$ε_{t} = Ν^{- 1} (L) Η (L) y_{t} + Ν^{- 1} (L) Η (L) c + Ν^{- 1} (L) Η (L) X_{t} β .$
Обратите внимание, что L^jc = c. Постоянный термин способствует вероятности следующим образом.

$\begin{matrix} Ν^{- 1} (L) Η (L) c = Ν^{- 1} (L) a (L) A (L) (^{1 - L) D} (1 - L^{s}) c \\ = Ν^{- 1} (L) a (L) A (L) (^{1 - L) D} (c - c) \\ = 0 \end{matrix}$
или

$\begin{matrix} Ν^{- 1} (L) Η (L) c = Ν^{- 1} (L) a (L) A (L) (1 - L^{s}) (^{1 - L) D} c \\ = Ν^{- 1} (L) a (L) A (L) (1 - L^{s}) (^{1 - L) D - 1} (1 - L) c \\ = Ν^{- 1} (L) a (L) A (L) (1 - L^{s}) (^{1 - L) D - 1} (c - c) \\ = 0. \end{matrix}$

Поэтому, когда модель ошибки ARIMA интегрирована, целевая функция правдоподобия, основанная на распределении _εt, инвариантна значению c.

В целом эффективная константа в эквивалентном представлении ARIMAX регрессионой модели с ошибками ARIMA является функцией составных авторегрессивных коэффициентов и исходной < reservedrangesplaceholder0 > точки пересечения и включает нелинейное ограничение. Это ограничение легко введено для таких приложений, как Симуляция Монте-Карло интегрированных моделей с ненулевыми точками пересечения. Однако для оценки модель ARIMAX не может идентифицировать константу в присутствии интегрированного полинома, и это приводит к ложным или необычным оценкам параметра.

Следует исключить точку пересечения из интегрированных моделей в большинстве приложений.

Рисунок идентифицируемости точки пересечения

В качестве иллюстрации рассмотрим регрессионую модель с ошибками ARIMA (2,1,1) без предикторов

\begin{matrix} y_{t} = 0.5 + u_{t} \\ (1 - 0.8 L + 0.4 L^{2}) (1 - L) u_{t} = (1 + 0.3 L) ε_{t}, \end{matrix}

(2)

или

\begin{matrix} y_{t} = 0.5 + u_{t} \\ (1 - 1.8 L + 1.2 L^{2} - 0.4 L^{3}) u_{t} = (1 + 0.3 L) ε_{t} . \end{matrix}

(3)

Вы можете переписать Уравнение 3 с помощью замены и некоторых манипуляций

$y_{t} = (1 - 1.8 + 1.2 - 0.4) 0.5 + 1.8 y_{t - 1} - 1.2 y_{t - 2} + 0.4 y_{t - 3} + ε_{t} + 0.3 ε_{t - 1} .$

Обратите внимание, что

$(1 - 1.8 + 1.2 - 0.4) 0.5 = 0 (0.5) = 0.$

Поэтому регрессионая модель с ошибками ARIMA (2,1,1) в уравнении 3 имеет представление модели ARIMA (2,1,1)

$y_{t} = 1.8 y_{t - 1} - 1.2 y_{t - 2} + 0.4 y_{t - 3} + ε_{t} + 0.3 ε_{t - 1} .$

Можно увидеть, что константа не присутствует в модели (что подразумевает ее значение 0), хотя значение регрессионой модели с точкой пересечения ошибок ARIMA составляет 0,5.

Можно также моделировать это поведение. Начните, задав регрессионую модель с ошибками ARIMA (2,1,1) в уравнении 3.

Mdl0 = regARIMA('D',1,'AR',{0.8 -0.4},'MA',0.3,...
    'Intercept',0.5,'Variance', 0.2);

Симулируйте 1000 наблюдений.

rng(1);
T = 1000;            
y = simulate(Mdl0, T);

Подгонка Mdl к данным.

Mdl = regARIMA('ARLags',1:2,'MALags',1,'D',1);...
    % "Empty" model to pass into estimate
[EstMdl,EstParamCov] = estimate(Mdl,y,'Display','params');

Warning: When ARIMA error model is integrated, the intercept is unidentifiable and cannot be estimated; a NaN is returned.

 
    ARIMA(2,1,1) Error Model (Gaussian Distribution):
 
                  Value      StandardError    TStatistic      PValue   
                 ________    _____________    __________    ___________

    Intercept         NaN            NaN           NaN              NaN
    AR{1}         0.89647       0.048507        18.481       2.9207e-76
    AR{2}        -0.45102       0.038916        -11.59       4.6573e-31
    MA{1}         0.18804       0.054505          3.45       0.00056069
    Variance      0.19789      0.0083512        23.696      3.9373e-124

estimate отображает предупреждение, чтобы сообщить вам, что точка пересечения не идентифицируется, и устанавливает его оценку, стандартную ошибку и t -статистическую на NaN.

Постройте график вероятности для точки пересечения.

c = linspace(Mdl0.Intercept - 50,...
    Mdl0.Intercept + 50,100); % Grid of intercepts
logL = nan(numel(c),1); % For preallocation

for i = 1:numel(logL)
    EstMdl.Intercept = c(i);
    [~,~,~,logL(i)] = infer(EstMdl,y);
end

figure
plot(c,logL)
title('Profile Log-Likelihood with Respect to the Intercept')
xlabel('Intercept')
ylabel('Loglikelihood')

Figure contains an axes. The axes with title Profile Log-Likelihood with Respect to the Intercept contains an object of type line.

Логарифмическая правдоподобность не меняется по сетке значений точки пересечения. Легкое колебание является результатом численной стандартной программы, используемой infer.

Документация