Модель регрессии с ошибками ARIMA имеет следующую общую форму:
(1) |
t = 1..., T.
yt является рядом ответа.
Xt является строкой t X, который является матрицей конкатенированных векторов данных предиктора. Таким образом, Xt является наблюдением t каждого ряда предиктора.
c является прерыванием модели регрессии.
β является коэффициентом регрессии.
ut является рядом воздействия.
εt является инновационным рядом.
который является степенью p, несезонный авторегрессивный полином.
который является степенью ps, сезонный авторегрессивный полином.
который является степенью D, несезонный полином интегрирования.
который является степенью s, сезонный полином интегрирования.
который является степенью q, несезонный полином скользящего среднего значения.
который является степенью qs, сезонный полином скользящего среднего значения.
Предположим, что безусловный ряд воздействия (ut) является стационарными стохастическими процессами. Затем можно выразить второе уравнение в уравнении 1 как
где Ψ (L) является бесконечным полиномом оператора задержки степени [2].
Инновационный процесс (εt) является независимым политиком и тождественно распределенный (iid), имейте в виду 0 процессов с известным распределением. Econometrics Toolbox™ обобщает инновационный процесс к εt = σzt, где zt является серией iid случайных переменных со средним значением 0 и отклонением 1, и σ 2 является постоянным отклонением εt.
Модели regARIMA
содержат два свойства, которые описывают распределение εt:
Variance
хранит σ 2.
Distribution
хранит параметрическую форму zt.
Значением по умолчанию Variance
является NaN
, означая, что инновационное отклонение неизвестно. Можно присвоить положительную скалярную величину Variance
, когда вы задаете модель с помощью аргумента пары "имя-значение" 'Variance',sigma2
(где sigma2
= σ 2), или путем изменения существующей модели с помощью записи через точку. Также можно оценить Variance
с помощью estimate
.
Можно задать следующие дистрибутивы для zt (использующий аргументы пары "имя-значение" или запись через точку):
Гауссов стандарт
t стандартизированного Студента со степенями свободы ν> 2. А именно,
где Tν является распределением t Студента со степенями свободы ν> 2.
Распределение t полезно для моделирования инноваций, которые более экстремальны, чем ожидалось при Распределении Гаусса. Такие инновационные процессы имеют excess kurtosis, более остроконечное (или более тяжелый выследил), распределение, чем Гауссово. Обратите внимание на то, что для ν> 4, эксцесс (четвертый центральный момент) Tν совпадает с эксцессом t Стандартизированного Студента (zt), т.е. для случайной переменной t, эксцесс инвариантен к масштабу.
Это - хорошая практика, чтобы оценить дистрибутивные свойства невязок определить, подходит ли Гауссово инновационное распределение (распределение по умолчанию) для вашей модели.
regARIMA
хранит распределение (и степени свободы для t распределения) в свойстве Distribution
. Тип данных Distribution
является массивом struct
с потенциально двумя полями: Name
и DoF
.
Если инновации являются Гауссовыми, то полем Name
является Gaussian
, и нет никакого поля DoF
. regARIMA
устанавливает Distribution
на Gaussian
по умолчанию.
Если инновациями является t-distributed, то полем Name
является t
, и полем DoF
является NaN
по умолчанию, или можно задать скаляр, который больше, чем 2.
Чтобы проиллюстрировать определение распределения, рассмотрите эту модель регрессии с AR (2) ошибки:
Mdl = regARIMA(2,0,0); Mdl.Distribution
ans = struct with fields:
Name: "Gaussian"
По умолчанию свойство Distribution
Mdl
является массивом struct
с полем Name
, имеющим значение Gaussian
.
Если вы хотите задать t инновационное распределение, то можно или задать модель с помощью аргумента пары "имя-значение" 'Distribution','t'
, или использовать запись через точку, чтобы изменить существующую модель.
Задайте модель с помощью аргумента пары "имя-значение".
Mdl = regARIMA('ARLags',1:2,'Distribution','t'); Mdl.Distribution
ans = struct with fields:
Name: "t"
DoF: NaN
Если вы используете аргумент пары "имя-значение", чтобы задать t инновационное распределение, то степенями свободы по умолчанию является NaN
.
Можно использовать запись через точку, чтобы привести к тому же результату.
Mdl = regARIMA(2,0,0);
Mdl.Distribution = 't'
Mdl = regARIMA with properties: Description: "ARMA(2,0) Error Model (t Distribution)" Distribution: Name = "t", DoF = NaN Intercept: NaN Beta: [1×0] P: 2 Q: 0 AR: {NaN NaN} at lags [1 2] SAR: {} MA: {} SMA: {} Variance: NaN
Если инновационное распределение , затем можно использовать запись через точку, чтобы изменить свойство Distribution
существующей модели Mdl
. Вы не можете изменить поля Distribution
с помощью записи через точку, например, Mdl.Distribution.DoF = 10
не является присвоением значения. Однако можно отобразить значение полей с помощью записи через точку.
Mdl.Distribution = struct('Name','t','DoF',10)
Mdl = regARIMA with properties: Description: "ARMA(2,0) Error Model (t Distribution)" Distribution: Name = "t", DoF = 10 Intercept: NaN Beta: [1×0] P: 2 Q: 0 AR: {NaN NaN} at lags [1 2] SAR: {} MA: {} SMA: {} Variance: NaN
tDistributionDoF = Mdl.Distribution.DoF
tDistributionDoF = 10
Поскольку полем DoF
не является NaN
, это - ограничение равенства, когда вы оцениваете Mdl
с помощью estimate
.
Также можно задать инновационное распределение с помощью аргумента пары "имя-значение".
Mdl = regARIMA('ARLags',1:2,'Intercept',0,... 'Distribution',struct('Name','t','DoF',10))
Mdl = regARIMA with properties: Description: "ARMA(2,0) Error Model (t Distribution)" Distribution: Name = "t", DoF = 10 Intercept: 0 Beta: [1×0] P: 2 Q: 0 AR: {NaN NaN} at lags [1 2] SAR: {} MA: {} SMA: {} Variance: NaN
[1] Поле, G. E. P. Г. М. Дженкинс и Г. К. Рейнсель. Анализ timeseries: Прогнозирование и Управление. 3-й редактор Englewood Cliffs, NJ: Prentice Hall, 1994.
[2] Пустошь, H. Исследование в анализе стационарных временных рядов. Упсала, Швеция: Almqvist & Wiksell, 1938.