Прервите идентифицируемость в моделях регрессии с ошибками ARIMA

Прервите идентифицируемость

Модель регрессии с ошибками ARIMA имеет следующую общую форму (t = 1..., T)

\begin{matrix} y_{t} = c + X_{t} β + u_{t} \\ a (L) A (L) {(1 - L)}^{D} (1 - L^{s}) u_{t} = b (L) B (L) ε_{t}, \end{matrix}

(1)

где

t = 1..., T.
_yt является рядом ответа.
_Xt является строкой t X, который является матрицей конкатенированных векторов данных предиктора. Таким образом, _Xt является наблюдением t каждого ряда предиктора.
c является прерыванием модели регрессии.
β является коэффициентом регрессии.
_ut является рядом воздействия.
_εt является инновационным рядом.
$L^{j} y_{t} = y_{t - j} .$
$a (L) = (1 - a_{1} L - ... - a_{p} L^{p}),$ который является степенью p, несезонный авторегрессивный полином.
$A (L) = (1 - A_{1} L - ... - A_{p_{s}} L^{p_{s}}),$ который является степенью _ps, сезонный авторегрессивный полином.
${(1 - L)}^{D},$ который является степенью D, несезонный полином интегрирования.
$(1 - L^{s}),$ который является степенью s, сезонный полином интегрирования.
$b (L) = (1 + b_{1} L + ... + b_{q} L^{q}),$ который является степенью q, несезонный полином скользящего среднего значения.
$B (L) = (1 + B_{1} L + ... + B_{q_{s}} L^{q_{s}}),$ который является степенью _qs, сезонный полином скользящего среднего значения.

Если вы указываете, что D = s = 0 (т.е. вы не указываете на сезонное или несезонное интегрирование), то каждый параметр идентифицируется. Другими словами, целевая функция вероятности чувствительна к изменению в параметре, учитывая данные.
Если вы указываете, что D> 0 или s> 0, и хотите оценить прерывание, c, то c не идентифицируется.

Можно показать, что это верно.

Рассмотрите уравнение 1. Решите для _ut во втором уравнении и замените им в первое.

$y_{t} = c + X_{t} β + Η^{- 1} (L) Ν (L) ε_{t},$
где
- $Η (L) = a (L) {(1 - L)}^{D} A (L) (1 - L^{s}) .$
- $Ν (L) = b (L) B (L) .$
Функция правдоподобия основана на распределении _εt. Решите для _εt.

$ε_{t} = Ν^{- 1} (L) Η (L) y_{t} + Ν^{- 1} (L) Η (L) c + Ν^{- 1} (L) Η (L) X_{t} β .$
Обратите внимание на то, что ^Lj c = c. Постоянный термин способствует вероятности можно следующим образом.

$\begin{matrix} Ν^{- 1} (L) Η (L) c = Ν^{- 1} (L) a (L) A (L) (^{1 - L) D} (1 - L^{s}) c \\ = Ν^{- 1} (L) a (L) A (L) (^{1 - L) D} (c - c) \\ = 0 \end{matrix}$
или

$\begin{matrix} Ν^{- 1} (L) Η (L) c = Ν^{- 1} (L) a (L) A (L) (1 - L^{s}) (^{1 - L) D} c \\ = Ν^{- 1} (L) a (L) A (L) (1 - L^{s}) (^{1 - L) D - 1} (1 - L) c \\ = Ν^{- 1} (L) a (L) A (L) (1 - L^{s}) (^{1 - L) D - 1} (c - c) \\ = 0. \end{matrix}$

Поэтому, когда ошибочная модель ARIMA интегрирована, целевая функция вероятности на основе распределения _εt инвариантная к значению c.

В целом эффективная константа в эквивалентном представлении ARIMAX модели регрессии с ошибками ARIMA является функцией составных авторегрессивных коэффициентов и исходного прерывания c, и включает нелинейное ограничение. Это ограничение беспрепятственно включено для приложений, таких как симуляция Монте-Карло интегрированных моделей с ненулевыми прерываниями. Однако для оценки, модель ARIMAX не может идентифицировать константу в присутствии интегрированного полинома, и это приводит к побочным или необычным оценкам параметра.

Необходимо исключить прерывание из интегрированных моделей в большинстве приложений.

Прервите рисунок идентифицируемости

Как рисунок, рассмотрите модель регрессии с ARIMA (2,1,1) ошибки без предикторов

\begin{matrix} y_{t} = 0.5 + u_{t} \\ (1 - 0.8 L + 0.4 L^{2}) (1 - L) u_{t} = (1 + 0.3 L) ε_{t}, \end{matrix}

(2)

или

\begin{matrix} y_{t} = 0.5 + u_{t} \\ (1 - 1.8 L + 1.2 L^{2} - 0.4 L^{3}) u_{t} = (1 + 0.3 L) ε_{t} . \end{matrix}

(3)

Можно переписать уравнение 3 замены использования и некоторая манипуляция

$y_{t} = (1 - 1.8 + 1.2 - 0.4) 0.5 + 1.8 y_{t - 1} - 1.2 y_{t - 2} + 0.4 y_{t - 3} + ε_{t} + 0.3 ε_{t - 1} .$

Обратите внимание на то, что

$(1 - 1.8 + 1.2 - 0.4) 0.5 = 0 (0.5) = 0.$

Поэтому модель регрессии с ARIMA (2,1,1) ошибки в уравнении 3 имеет представление модели ARIMA (2,1,1)

$y_{t} = 1.8 y_{t - 1} - 1.2 y_{t - 2} + 0.4 y_{t - 3} + ε_{t} + 0.3 ε_{t - 1} .$

Вы видите, что константа не присутствует в модели (который подразумевает, что ее значение 0), даже при том, что значение модели регрессии с ошибочным прерыванием ARIMA 0.5.

Можно также моделировать это поведение. Запустите путем определения модели регрессии с ARIMA (2,1,1) ошибки в уравнении 3.

Mdl = regARIMA('D',1,'AR',{0.8 -0.4},'MA',0.3,...
    'Intercept',0.5,'Variance', 0.2);

Моделируйте 1 000 наблюдений.

rng(1);
T = 1000;            
y = simulate(Mdl, T);

Соответствуйте Mdl к данным.

ToEstMdl = regARIMA('ARLags',1:2,'MALags',1,'D',1);...
    % "Empty" model to pass into estimate
[EstMdl,EstParamCov] = estimate(ToEstMdl,y,'Display','params');

Warning: When ARIMA error model is integrated, the intercept is unidentifiable and cannot be estimated; a NaN is returned.

 
    ARIMA(2,1,1) Error Model (Gaussian Distribution):
 
                  Value      StandardError    TStatistic      PValue   
                 ________    _____________    __________    ___________

    Intercept         NaN            NaN           NaN              NaN
    AR{1}         0.89647       0.048507        18.481        2.921e-76
    AR{2}        -0.45101       0.038916        -11.59       4.6576e-31
    MA{1}         0.18804       0.054505          3.45       0.00056068
    Variance      0.19789      0.0083512        23.696      3.9373e-124

estimate выводит предупреждение, чтобы сообщить вам, что прерывание не идентифицируется, и устанавливает свою оценку, стандартную погрешность и t - статистическая величина к NaN.

Постройте вероятность профиля для прерывания.

c = linspace(Mdl.Intercept - 50,...
    Mdl.Intercept + 50,100); % Grid of intercepts
logL = nan(numel(c),1); % For preallocation

for i = 1:numel(logL)
    EstMdl.Intercept = c(i);
    [~,~,~,logL(i)] = infer(EstMdl,y);
end

figure
plot(c,logL)
title('Profile Log-Likelihood with Respect to the Intercept')
xlabel('Intercept')
ylabel('Loglikelihood')

loglikelihood не переключает сетку значений прерывания. Небольшое колебание является результатом числовой стандартной программы, используемой infer.

Документация