exponenta event banner

Альтернативные представления модели ARIMA

Преобразование модели regARIMA в ARIMAX

Модели ARIMAX и регрессионные модели с ошибками ARIMA тесно связаны между собой, и выбор того, что использовать, как правило, диктуется вашими целями для анализа. Если цель состоит в том, чтобы подогнать разборчивую модель к данным и ответам прогноза, то разница между этими двумя моделями очень мала.

Если вы больше заинтересованы в сохранении обычной интерпретации коэффициента регрессии как меры чувствительности, то есть влияния единичного изменения переменной предиктора на отклик, то используйте регрессионную модель с ошибками ARIMA. Коэффициенты регрессии в моделях ARIMAX не обладают такой интерпретацией из-за динамической зависимости от ответа [1].

Предположим, что имеются оценки параметров из регрессионной модели с ошибками ARIMA, и нужно увидеть, как структура модели сравнивается с моделью ARIMAX. Или, предположим, вы хотите получить некоторое представление об основных отношениях между двумя моделями.

Модель ARIMAX (t = 1,..., T):

Start( L) yt = c + Xtβ +(1)
где

  • yt - одномерный ряд ответов.

  • Xt - строка t из X, которая является матрицей конкатенированных рядов предикторов. То есть Xt - это наблюдение t каждой серии предикторов.

  • β - коэффициент регрессии.

  • c - перехват регрессионной модели.

  • Start( L) = (L) (1 L) ДФ (L) (1 Ls) = 1 η1L − η2L2 −... - это многочлен оператора градусного P-запаздывания, который фиксирует комбинированный эффект сезонного и несезонного авторегрессивных многочленов, а также сезонного и несезонного полиномов интегрирования. Дополнительные сведения о нотации см. в разделе Мультипликативная модель ARIMA.

  • Ν (L) = θ (L) Θ (L) =1 +ν1L +ν2L2 +... + νQLQ, который является степенью Q, изолирует полиномиал оператора, который захватывает совместное воздействие сезонных и несезонных полиномиалов скользящего среднего значения.

  • δ t - это инновационный процесс белого шума.

Регрессионная модель с ошибками ARIMA - (t = 1,...,T)

yt = c + Xtβ + utA (L) ut = B (L) αt,(2)
где

  • ut - процесс безусловных нарушений.

  • (L) = ϕ (L) (1−L) (L) (1−Ls) =1−a1L−a2L2−...−aPLP, который является степенью, P изолируют полиномиал оператора, который захватывает совместное воздействие сезонных и несезонных авторегрессивных полиномиалов и сезонных и несезонных полиномиалов интеграции.

  • B (L) = start( L) (L) = 1 + b1L + b2L2 +... + bQLQ, который является полиномом оператора задержки степени Q, который фиксирует комбинированный эффект сезонного и несезонного многочленов скользящего среднего.

Значения переменных, определенных в уравнении 2, не обязательно эквивалентны значениям переменных в уравнении 1, даже если обозначение может быть аналогичным.

Иллюстрация преобразования модели regARIMA в ARIMAX

Рассмотрим уравнение 2, регрессионную модель с ошибками ARIMA. Используйте следующие операции для преобразования регрессионной модели с ошибками ARIMA в соответствующую модель ARIMAX.

  1. Решить для ut.

    yt = c + Xtβ + utut = B (L) A (L)

  2. Подставить ut в уравнение регрессии.

    yt = c + Xtβ + B (L) A (L) αtA (L) yt = A (L) c + A (L) Xtβ + B (L) αt.

  3. Решить для yt.

    yt = A (L) c + A (L) Xtβ+∑k=1Pakyt−k+B (L) αt = A (L) c+ZtΓ+∑k=1Pakyt−k+B (L) αt.(3)
    В уравнении 3,

    • A (L) c = (1 - a1 - a2 -... - aP) c. То есть константа в модели ARIMAX является пересечением в регрессионной модели с ошибками ARIMA с нелинейным ограничением. Хотя приложения, такие какsimulate, обработайте это ограничение, estimate не может включать такое ограничение. В последнем случае модели эквивалентны при фиксации пересечения и константы 0.

    • В термине A (L) Xtβ полином оператора запаздывания A (L) фильтрует вектор T-by-1 Xtβ, который является линейной комбинацией предикторов, взвешенных коэффициентами регрессии. Этот процесс фильтрации требует P предварительных наблюдений серии предикторов.

    • arima конструирует матрицу Zt следующим образом:

      • Каждый столбец Zt соответствует каждому члену в A (L).

      • Первым столбцом Zt является вектор Xtβ.

      • Второй столбец Zt представляет собой последовательность d2 NaNs (d2 - степень второго члена в A (L)), за которым следует продукт LdjXtβ. То есть программное обеспечение присоединяет d2 NaNs в начале столбца T-by-1, прикрепляет Xtβ после NaNs, но усекает конец этого произведения наблюдениями d2.

      • J-й столбец Zt представляет собой последовательность dj NaNs (dj - степень j-го члена в A (L)), за которым следует продукт LdjXtβ. То есть программное обеспечение присоединяет dj NaNs в начале столбца T-by-1, прикрепляет Xtβ после NaNs, но усекает конец этого продукта наблюдениями dj.

      .

    • Γ = [1 -a1 -a2... -aP] '.

      arima преобразователь удаляет все нулевые авторегрессионные коэффициенты дифференциального уравнения. Впоследствии, arima преобразователь не связывает нулевые авторегрессивные коэффициенты со столбцами в Zt и не включает соответствующие нулевые коэффициенты в Γ.

  4. Переписать уравнение 3,

    yt = (1−∑k=1Pak) c+Xtβ−∑k=1PakXt−kβ+∑k=1Pakyt−k+εt+∑k=1Qεt−k.

Например, рассмотрим следующую регрессионную модель с ошибками ARMA (2,1):

yt = 0,2 + 0 .5Xt + ut (1 0 .8L + 0 .4L2) ut = (1 + 0 .3L) αt.(4)
Эквивалентная модель ARMAX:

yt = 0,12 + (0,5 0,4L + 0,2L2) Xt + 0,8 yt 1 − 0,4 yt − 2 + (1 + 0,3L) αt = 0,12 + ZtΓ + 0,8 yt − 1 − 0,4 yt − 2 + (1 + 0,3L) αt,

или

(1 − 0 .8L + 0 .4L2) yt = 0,12 + ZtΓ + (1 + 0 .3L) αt,

где Γ = [1 -0,8 0,4] 'и

Zt=0.5[x1NaNNaNx2x1NaNx3x2x1⋮⋮⋮xTxT−1xT−2].

Эта модель не интегрирована, поскольку все собственные значения, связанные с полиномом AR, находятся в пределах единичной окружности, но предикторы могут повлиять на в противном случае стабильный процесс. Кроме того, необходимы предварительные данные предиктора, возвращающиеся, по крайней мере, на 2 периода назад, чтобы, например, привести модель в соответствие с данными.

Далее это можно проиллюстрировать с помощью моделирования и оценки.

  1. Укажите регрессионную модель с ошибками ARIMA в уравнении 4.

    MdlregARIMA0 = regARIMA('Intercept',0.2,'AR',{0.8 -0.4},...
                   'MA',0.3,'Beta',[0.3 -0.2],'Variance',0.2);
  2. Создание предварительных наблюдений и данных предиктора.

    rng(1);   % For reproducibility
    T = 100;
    maxPQ = max(MdlregARIMA0.P,MdlregARIMA0.Q);
    numObs  = T + maxPQ;...
        % Adjust number of observations to account for presample
    XregARIMA = randn(numObs,2); % Simulate predictor data
    u0 = randn(maxPQ,1);  % Presample unconditional disturbances u(t)
    e0 = randn(maxPQ,1);  % Presample innovations e(t)
  3. Моделирование данных из Mdl1.

  4. Новообращенный Mdl1 в модель ARIMAX.

    [MdlARIMAX0,XARIMAX] = arima(MdlregARIMA0,'X',XregARIMA);
    MdlARIMAX0
    MdlARIMAX0 = 
      arima with properties:
    
         Description: "ARIMAX(2,0,1) Model (Gaussian Distribution)"
        Distribution: Name = "Gaussian"
                   P: 2
                   D: 0
                   Q: 1
            Constant: 0.12
                  AR: {0.8 -0.4} at lags [1 2]
                 SAR: {}
                  MA: {0.3} at lag [1]
                 SMA: {}
         Seasonality: 0
                Beta: [1 -0.8 0.4]
            Variance: 0.2
    
  5. Создание предварительных ответов для модели ARIMAX для обеспечения согласованности с Mdl1. Моделирование данных из Mdl2.

    y0 = MdlregARIMA0.Intercept + XregARIMA(1:maxPQ,:)*MdlregARIMA0.Beta' + u0;
    rng(100)
    y2 = simulate(MdlARIMAX0,T,'Y0',y0,'E0',e0,'X',XARIMAX);
    
    figure
    plot(y1,'LineWidth',3)
    hold on
    plot(y2,'r:','LineWidth',2.5)
    hold off
    title('{\bf Simulated Paths}')
    legend('regARIMA Model','ARIMAX Model','Location','Best')

    Figure contains an axes. The axes with title {\bf Simulated Paths} contains 2 objects of type line. These objects represent regARIMA Model, ARIMAX Model.

    Моделируемые пути эквивалентны, поскольку arima преобразователь применяет нелинейное ограничение, когда преобразует пересечение регрессионной модели в константу модели ARIMAX.

  6. Подгонка регрессионной модели с ошибками ARIMA к моделируемым данным.

    MdlregARIMA = regARIMA('ARLags',[1 2],'MALags',1);
    EstMdlregARIMA = estimate(MdlregARIMA,y1,'E0',e0,'U0',u0,'X',XregARIMA);
     
        Regression with ARMA(2,1) Error Model (Gaussian Distribution):
     
                      Value      StandardError    TStatistic      PValue  
                     ________    _____________    __________    __________
    
        Intercept     0.14074        0.1014         1.3879         0.16518
        AR{1}         0.83061        0.1375         6.0407      1.5349e-09
        AR{2}        -0.45402        0.1164        -3.9007      9.5927e-05
        MA{1}         0.42803       0.15145         2.8262       0.0047109
        Beta(1)       0.29552      0.022938         12.883       5.597e-38
        Beta(2)      -0.17601      0.030607        -5.7506      8.8941e-09
        Variance      0.18231      0.027765         6.5663      5.1569e-11
    
  7. Подгонка модели ARIMAX к моделируемым данным.

    MdlARIMAX = arima('ARLags',[1 2],'MALags',1);
    EstMdlARIMAX = estimate(MdlARIMAX,y2,'E0',e0,'Y0',...
        y0,'X',XARIMAX);
     
        ARIMAX(2,0,1) Model (Gaussian Distribution):
     
                     Value      StandardError    TStatistic      PValue  
                    ________    _____________    __________    __________
    
        Constant    0.084996      0.064217         1.3236         0.18564
        AR{1}        0.83136       0.13634         6.0975      1.0775e-09
        AR{2}       -0.45599       0.11788        -3.8683       0.0001096
        MA{1}          0.426       0.15753         2.7043       0.0068446
        Beta(1)        1.053       0.13685         7.6949      1.4166e-14
        Beta(2)      -0.6904       0.19262        -3.5843      0.00033796
        Beta(3)      0.45399       0.15352         2.9572       0.0031047
        Variance     0.18112      0.028836          6.281      3.3634e-10
    
  8. Новообращенный EstMdl1 в модель ARIMAX.

    Расчетная константа модели ARIMAX не эквивалентна константе модели ARIMAX, преобразованной из регрессионной модели с ошибками ARIMA. Другими словами, EstMdl2.Constant = 0.0849961 и ConvertedMdl2.Constant = 0.087737. Это потому, что estimate не применяет нелинейное ограничение, arima преобразователь принудительно. В результате другие оценки также не эквивалентны, хотя и близки.

Ссылки

[1] Хайндман, Р. Дж. (2010, октябрь). «Путаница моделей ARIMAX». Роб Дж. Хайндман. Получено 4 мая 2017 г. из https://robjhyndman.com/hyndsight/arimax/.

См. также

| |

Связанные темы