Альтернативные представления модели ARIMA

Преобразование модели regARIMA в ARIMAX

Модели ARIMAX и регрессионные модели с ошибками ARIMA тесно связаны между собой, и выбор того, что использовать, как правило, диктуется вашими целями для анализа. Если цель состоит в том, чтобы подогнать разборчивую модель к данным и ответам прогноза, то разница между этими двумя моделями очень мала.

Если вы больше заинтересованы в сохранении обычной интерпретации коэффициента регрессии как меры чувствительности, то есть влияния единичного изменения переменной предиктора на отклик, то используйте регрессионную модель с ошибками ARIMA. Коэффициенты регрессии в моделях ARIMAX не обладают такой интерпретацией из-за динамической зависимости от ответа [1].

Предположим, что имеются оценки параметров из регрессионной модели с ошибками ARIMA, и нужно увидеть, как структура модели сравнивается с моделью ARIMAX. Или, предположим, вы хотите получить некоторое представление об основных отношениях между двумя моделями.

Модель ARIMAX (t = 1,..., T):

Start(L)_{} yt =_{} c + {Xtβ}_{} +

(1)

где

_yt - одномерный ряд ответов.
_Xt - строка t из X, которая является матрицей конкатенированных рядов предикторов. То есть _Xt - это наблюдение t каждой серии предикторов.
β - коэффициент регрессии.
c - перехват регрессионной модели.
$Start(L) = (L)^{(} 1 - L)^{ДФ} (L)_{(} 1 -_{}^{Ls}) = 1_{-}^{}$ η1L − η2L2 −... - это многочлен оператора градусного P-запаздывания, который фиксирует комбинированный эффект сезонного и несезонного авторегрессивных многочленов, а также сезонного и несезонного полиномов интегрирования. Дополнительные сведения о нотации см. в разделе Мультипликативная модель ARIMA.
$Ν (L) = θ (L) Θ_{(L)}_{}^{} {=1 +ν1L +ν2L2}_{+}^{} ...$ + νQLQ, который является степенью Q, изолирует полиномиал оператора, который захватывает совместное воздействие сезонных и несезонных полиномиалов скользящего среднего значения.
_{δ t} - это инновационный процесс белого шума.

Регрессионная модель с ошибками ARIMA - (t = 1,...,T)

\begin{array}{l} _{yt} = c_{} +_{} \\ Xtβ +_{} utA (L)_{} ut \end{array}

= B (L) αt,

(2)

где

_ut - процесс безусловных нарушений.
$(L) = ϕ {(L)}^{} (1−L) DΦ^{} (L)_{} (1-Ls)_{}^{}_{}^{=1−a1L−a2L2−}$ ...−aPLP, который является степенью, P изолируют полиномиал оператора, который захватывает совместное воздействие сезонных и несезонных авторегрессивных полиномиалов и сезонных и несезонных полиномиалов интеграции.
$B (L) = start(L) (L)_{} =_{} 1^{} + b1L_{+}^{}$ b2L2 +... + bQLQ, который является полиномом оператора задержки степени Q, который фиксирует комбинированный эффект сезонного и несезонного многочленов скользящего среднего.

Значения переменных, определенных в уравнении 2, не обязательно эквивалентны значениям переменных в уравнении 1, даже если обозначение может быть аналогичным.

Иллюстрация преобразования модели regARIMA в ARIMAX

Рассмотрим уравнение 2, регрессионную модель с ошибками ARIMA. Используйте следующие операции для преобразования регрессионной модели с ошибками ARIMA в соответствующую модель ARIMAX.

Решить для _ut.

$\begin{array}{l} _{yt} = c_{} +_{} \\ {Xtβ}_{} + \frac{}{utut =} B_{} ( \end{array}$ L) A (L)
Подставить _ut в уравнение регрессии.

$\begin{matrix} _{yt} = c_{} + \frac{Xtβ}{+ B} (_{L} \\ ) A (_{L}) αtA (L) {yt}_{} = A (L)_{} c \end{matrix}$ + A (L) Xtβ + B (L) αt.
Решить для _yt.
$\begin{matrix} _{yt} = A (L) c +_{} A (_{L)}^{}_{}_{}_{} \\ Xtβ+\sumk=1Pakyt-k+B (L)_{} αt =_{A}^{(} L_{)}_{}_{} \end{matrix}$ c+ZtΓ+∑k=1Pakyt−k+B (L) αt. (3)
В уравнении 3,
- A (L) c = (1 - a1 - a2 -... _- aP) c. То есть константа в модели ARIMAX является пересечением в регрессионной модели с ошибками ARIMA с нелинейным ограничением. Хотя приложения, такие какsimulate, обработайте это ограничение, estimate не может включать такое ограничение. В последнем случае модели эквивалентны при фиксации пересечения и константы 0.
- В термине A (L) Xtβ полином оператора запаздывания A (L) фильтрует _вектор T-by-1 Xtβ, который является линейной комбинацией предикторов, взвешенных коэффициентами регрессии. Этот процесс фильтрации требует P предварительных наблюдений серии предикторов.
- arima конструирует матрицу _Zt следующим образом:
  - Каждый столбец _Zt соответствует каждому члену в A (L).
  - Первым столбцом _Zt является вектор _Xtβ.
  - Второй столбец _Zt представляет собой последовательность d2 NaNs (d2 - степень второго члена в A (L)), за которым следует продукт $^{_{}}_{}$ LdjXtβ. То есть программное обеспечение присоединяет _d2 NaNs в начале столбца T-by-1, прикрепляет _Xtβ после NaNs, но усекает конец этого произведения наблюдениями d2.
  - J-й столбец _Zt представляет собой последовательность _dj NaNs (_dj - степень j-го члена в A (L)), за которым следует продукт $^{_{}}_{}$ LdjXtβ. То есть программное обеспечение присоединяет _dj NaNs в начале столбца T-by-1, прикрепляет _Xtβ после NaNs, но усекает конец этого продукта наблюдениями _dj.
  .
- Γ = [1 -a1 -a2... -aP] '.
  arima преобразователь удаляет все нулевые авторегрессионные коэффициенты дифференциального уравнения. Впоследствии, arima преобразователь не связывает нулевые авторегрессивные коэффициенты со столбцами в _{Zt и} не включает соответствующие нулевые коэффициенты в Γ.
Переписать уравнение 3,

$_{yt} = (_{}^{}_{} 1−∑k=1Pak)_{}_{}^{}_{}_{}_{}^{}_{}_{}_{}_{}^{}_{}$ c+Xtβ−∑k=1PakXt−kβ+∑k=1Pakyt−k+εt+∑k=1Qεt−k.

Например, рассмотрим следующую регрессионную модель с ошибками ARMA (2,1):

\begin{matrix} _{yt} = 0,2 +_{0} ._{} \\ 5Xt + ut (1 -^{} 0_{.} 8L + 0 ._{4L2}) \end{matrix}

ut = (1 + 0 .3L) αt.

(4)

Эквивалентная модель ARMAX:

$\begin{matrix} _{yt} = 0,12 + (0,5 -^{0,4L} +_{} {0,2L2}_{)} Xt +_{} 0,8 yt − 1 −_{} \\ 0,4 yt − 2_{+} (1 +_{} 0,3L) {αt}_{=} 0,12 + {ZtΓ}_{} + \end{matrix}$ 0,8 yt − 1 − 0,4 yt − 2 + (1 + 0,3L) αt,

или

$(1 − 0 . 8L +^{} 0_{.} 4L2) {yt}_{} = 0,12 +_{ZtΓ}$ + (1 + 0 .3L) αt,

где Γ = [1 -0,8 0,4] 'и

$_{} \begin{matrix} _{} \\ _{} & _{} \\ _{} & _{} & _{} \\ _{} & _{} & _{Zt=0.5[x1NaNNaNx2x1NaNx3x2x1⋮⋮⋮xTxT−1xT−2} \end{matrix}].$

Эта модель не интегрирована, поскольку все собственные значения, связанные с полиномом AR, находятся в пределах единичной окружности, но предикторы могут повлиять на в противном случае стабильный процесс. Кроме того, необходимы предварительные данные предиктора, возвращающиеся, по крайней мере, на 2 периода назад, чтобы, например, привести модель в соответствие с данными.

Далее это можно проиллюстрировать с помощью моделирования и оценки.

Укажите регрессионную модель с ошибками ARIMA в уравнении 4.

MdlregARIMA0 = regARIMA('Intercept',0.2,'AR',{0.8 -0.4},...
               'MA',0.3,'Beta',[0.3 -0.2],'Variance',0.2);

Создание предварительных наблюдений и данных предиктора.

rng(1);   % For reproducibility
T = 100;
maxPQ = max(MdlregARIMA0.P,MdlregARIMA0.Q);
numObs  = T + maxPQ;...
    % Adjust number of observations to account for presample
XregARIMA = randn(numObs,2); % Simulate predictor data
u0 = randn(maxPQ,1);  % Presample unconditional disturbances u(t)
e0 = randn(maxPQ,1);  % Presample innovations e(t)

Моделирование данных из Mdl1.

Новообращенный Mdl1 в модель ARIMAX.

[MdlARIMAX0,XARIMAX] = arima(MdlregARIMA0,'X',XregARIMA);
MdlARIMAX0

MdlARIMAX0 = 
  arima with properties:

     Description: "ARIMAX(2,0,1) Model (Gaussian Distribution)"
    Distribution: Name = "Gaussian"
               P: 2
               D: 0
               Q: 1
        Constant: 0.12
              AR: {0.8 -0.4} at lags [1 2]
             SAR: {}
              MA: {0.3} at lag [1]
             SMA: {}
     Seasonality: 0
            Beta: [1 -0.8 0.4]
        Variance: 0.2

Создание предварительных ответов для модели ARIMAX для обеспечения согласованности с Mdl1. Моделирование данных из Mdl2.
```
y0 = MdlregARIMA0.Intercept + XregARIMA(1:maxPQ,:)*MdlregARIMA0.Beta' + u0;
rng(100)
y2 = simulate(MdlARIMAX0,T,'Y0',y0,'E0',e0,'X',XARIMAX);

figure
plot(y1,'LineWidth',3)
hold on
plot(y2,'r:','LineWidth',2.5)
hold off
title('{\bf Simulated Paths}')
legend('regARIMA Model','ARIMAX Model','Location','Best')
```
$Figure contains an axes. The axes with title {\bf Simulated Paths} contains 2 objects of type line. These objects represent regARIMA Model, ARIMAX Model.$
Моделируемые пути эквивалентны, поскольку arima преобразователь применяет нелинейное ограничение, когда преобразует пересечение регрессионной модели в константу модели ARIMAX.

Подгонка регрессионной модели с ошибками ARIMA к моделируемым данным.

MdlregARIMA = regARIMA('ARLags',[1 2],'MALags',1);
EstMdlregARIMA = estimate(MdlregARIMA,y1,'E0',e0,'U0',u0,'X',XregARIMA);

 
    Regression with ARMA(2,1) Error Model (Gaussian Distribution):
 
                  Value      StandardError    TStatistic      PValue  
                 ________    _____________    __________    __________

    Intercept     0.14074        0.1014         1.3879         0.16518
    AR{1}         0.83061        0.1375         6.0407      1.5349e-09
    AR{2}        -0.45402        0.1164        -3.9007      9.5927e-05
    MA{1}         0.42803       0.15145         2.8262       0.0047109
    Beta(1)       0.29552      0.022938         12.883       5.597e-38
    Beta(2)      -0.17601      0.030607        -5.7506      8.8941e-09
    Variance      0.18231      0.027765         6.5663      5.1569e-11

Подгонка модели ARIMAX к моделируемым данным.

MdlARIMAX = arima('ARLags',[1 2],'MALags',1);
EstMdlARIMAX = estimate(MdlARIMAX,y2,'E0',e0,'Y0',...
    y0,'X',XARIMAX);

 
    ARIMAX(2,0,1) Model (Gaussian Distribution):
 
                 Value      StandardError    TStatistic      PValue  
                ________    _____________    __________    __________

    Constant    0.084996      0.064217         1.3236         0.18564
    AR{1}        0.83136       0.13634         6.0975      1.0775e-09
    AR{2}       -0.45599       0.11788        -3.8683       0.0001096
    MA{1}          0.426       0.15753         2.7043       0.0068446
    Beta(1)        1.053       0.13685         7.6949      1.4166e-14
    Beta(2)      -0.6904       0.19262        -3.5843      0.00033796
    Beta(3)      0.45399       0.15352         2.9572       0.0031047
    Variance     0.18112      0.028836          6.281      3.3634e-10

Новообращенный EstMdl1 в модель ARIMAX.
Расчетная константа модели ARIMAX не эквивалентна константе модели ARIMAX, преобразованной из регрессионной модели с ошибками ARIMA. Другими словами, EstMdl2.Constant = 0.0849961 и ConvertedMdl2.Constant = 0.087737. Это потому, что estimate не применяет нелинейное ограничение, arima преобразователь принудительно. В результате другие оценки также не эквивалентны, хотя и близки.

Ссылки

[1] Хайндман, Р. Дж. (2010, октябрь). «Путаница моделей ARIMAX». Роб Дж. Хайндман. Получено 4 мая 2017 г. из https://robjhyndman.com/hyndsight/arimax/.

См. также

arima | estimate | estimate

Связанные темы

Оценка регрессионной модели с ошибками ARIMA

Документация