Определение инновационного распределения модели ошибок ARIMA

Об инновационном процессе

Регрессионная модель с ошибками ARIMA имеет следующую общую форму:

\begin{matrix} _{yt} = c_{} +_{} \\ Xtβ + uta {(L) A}^{} (L)^{(} 1_{-} L) D (1 -_{} \end{matrix}

Ls) ut = b (L) B (L) αt,

(1)

где

t = 1,...,T.
_yt - серия ответов.
_Xt - строка t X, которая является матрицей векторов данных конкатенированного предиктора. То есть _Xt - это наблюдение t каждой серии предикторов.
c - перехват регрессионной модели.
β - коэффициент регрессии.
_ut - серия возмущений.
_{δ t} - серия инноваций.
$^{}_{Ljyt} =_{yt}$ − j.
$a (L) = (_{1} - a1L_{-} .^{.} .$ − apLp), который является степенью p, несезонным авторегрессионным многочленом.
$A (L) = (_{1} - A1L_{-_{.}} .^{._{}} -$ ApsLps), что является _{степенью} ps, сезонным авторегрессионным многочленом.
${(1 -}^{L})$ D, который представляет собой степень D, несезонный полином интегрирования.
$(1 -^{} Ls$ ), который представляет собой степень s, сезонный полином интегрирования.
$b (L) = (_{1} + b1L_{+} .^{.} .$ + bqLq), который является степенью q, несезонным скользящим средним многочленом.
$B (L) = (_{1} + B1L_{+_{.}} .^{._{}} +$ BqsLqs), который является _{степенью} qs, сезонным скользящим средним многочленом.

Предположим, что ряд безусловных возмущений (_ut) является стационарными стохастическими процессами. Затем можно выразить второе уравнение в уравнении 1 как

$_{ut} =^{a} - 1^{(} L) {A - 1}^{(} {L) (^{1}}^{-} L) - D (1_{} - Ls)_{-}$ 1b (L) B (L) (L)

где Start( L) - многочлен оператора бесконечной степени запаздывания [2].

Инновационный процесс (_αt) является независимым и одинаково распределенным (iid), означает 0 процесс с известным распределением. Эконометрика Toolbox™ обобщает инновационный процесс до _αt = _startzt, где _zt - ряд iid случайных величин со средним 0 и дисперсией 1, а start2 - постоянная дисперсия _αt.

regARIMA модели содержат два свойства, описывающих распределение _{δ t}:

Variance хранит start2.
Distribution сохраняет параметрическую форму _zt.

Варианты распространения инноваций

Значение по умолчанию Variance является NaN, что означает, что инновационная дисперсия неизвестна. Можно назначить положительный скаляр Variance при указании модели с помощью аргумента пара имя-значение 'Variance',sigma2 (где sigma2 = start2) или путем изменения существующей модели с использованием точечной нотации. Кроме того, можно оценить Variance использование estimate.
Можно задать следующие распределения для _zt (используя аргументы пары имя-значение или точечную нотацию):
- Стандартный гауссовский
- Стандартизированный Стьюдент t со степенями свободы start> 2. В частности,
  
  $_{zt} =_{} \sqrt{\frac{T}{}}$
  где _Tν - t распределение Студента со степенями свободы ν> 2.
Распределение t полезно для моделирования инноваций, которые являются более экстремальными, чем ожидалось при распределении по Гауссу. Такие инновационные процессы имеют избыточный куртоз, более пиковое (или более тяжелое хвостатое) распределение, чем гауссово. Заметим, что для start> 4 куртоз (четвертый центральный момент) _T, является тем же самым, что и куртоз стандартизованного студента t (_zt), то есть для t случайной величины куртоз является масштабным инвариантом.
Совет
Рекомендуется оценить распределительные свойства остатков, чтобы определить, подходит ли для модели распределение инноваций по Гауссу (распределение по умолчанию).

Определение распределения инноваций

Открыть сценарий в реальном времени

regARIMA сохраняет распределение (и степени свободы для распределения t) в Distribution собственность. Тип данных Distribution является struct массив с потенциально двумя полями: Name и DoF.

Если нововведения гауссовы, то Name поле имеет значение Gaussian, и нет DoF поле. regARIMA наборы Distribution кому Gaussian по умолчанию.
Если инновации t-распределены, то Name поле имеет значение t и DoF поле имеет значение NaN по умолчанию или можно указать скаляр, превышающий 2.

Чтобы проиллюстрировать определение распределения, рассмотрим эту регрессионную модель с ошибками AR (2):

$\begin{array}{rcl} _{yt} & = c_{} +_{} \\ {Xtβ}_{} & + & _{}_{utut} =_{}_{} α1ut-1_{+} \end{array}$ α2ut-2 + αt

Mdl = regARIMA(2,0,0);
Mdl.Distribution

ans = struct with fields:
    Name: "Gaussian"

По умолчанию Distribution имущество Mdl является struct массив с полем Name имеющие значение Gaussian.

Если необходимо указать распределение инноваций, можно либо указать модель с помощью аргумента пара имя-значение 'Distribution','t'или используйте точечную нотацию для изменения существующей модели.

Укажите модель с помощью аргумента пара имя-значение.

Mdl = regARIMA('ARLags',1:2,'Distribution','t');
Mdl.Distribution

ans = struct with fields:
    Name: "t"
     DoF: NaN

Если для определения распределения инноваций используется аргумент пара имя-значение, то степенями свободы по умолчанию являются NaN.

Для получения того же результата можно использовать точечную нотацию.

Mdl = regARIMA(2,0,0);
Mdl.Distribution = 't'

Mdl = 
  regARIMA with properties:

     Description: "ARMA(2,0) Error Model (t Distribution)"
    Distribution: Name = "t", DoF = NaN
       Intercept: NaN
            Beta: [1×0]
               P: 2
               Q: 0
              AR: {NaN NaN} at lags [1 2]
             SAR: {}
              MA: {}
             SMA: {}
        Variance: NaN

Если инновационное распределение t10, $_{}$ то можно использовать точечную нотацию для изменения Distribution свойство существующей модели Mdl. Нельзя изменять поля Distribution использование точечной нотации, например, Mdl.Distribution.DoF = 10 не является присвоением значения. Однако можно отобразить значение полей с помощью точечной нотации.

Mdl.Distribution = struct('Name','t','DoF',10)

Mdl = 
  regARIMA with properties:

     Description: "ARMA(2,0) Error Model (t Distribution)"
    Distribution: Name = "t", DoF = 10
       Intercept: NaN
            Beta: [1×0]
               P: 2
               Q: 0
              AR: {NaN NaN} at lags [1 2]
             SAR: {}
              MA: {}
             SMA: {}
        Variance: NaN

tDistributionDoF = Mdl.Distribution.DoF

tDistributionDoF = 10

С момента DoF поле не является полем NaN, это ограничение равенства при оценке Mdl использование estimate.

Кроме того, можно указать $_{}$ распределение инноваций t10 с помощью аргумента пары имя-значение.

Mdl = regARIMA('ARLags',1:2,'Intercept',0,...
    'Distribution',struct('Name','t','DoF',10))

Mdl = 
  regARIMA with properties:

     Description: "ARMA(2,0) Error Model (t Distribution)"
    Distribution: Name = "t", DoF = 10
       Intercept: 0
            Beta: [1×0]
               P: 2
               Q: 0
              AR: {NaN NaN} at lags [1 2]
             SAR: {}
              MA: {}
             SMA: {}
        Variance: NaN

Ссылки

[1] Бокс, Г. Э. П., Г. М. Дженкинс и Г. К. Рейнсель. Анализ временных рядов: прогнозирование и контроль. 3-й ред. Энглвуд Клиффс, Нью-Джерси: Прентис Холл, 1994.

[2] Wold, H. Исследование в анализе стационарных временных рядов. Уппсала, Швеция: Almqvist & Wiksell, 1938.

См. также

Связанные примеры

Подробнее

Регрессионные модели с ошибками временных рядов

Документация