Регрессионная модель с ошибками ARIMA имеет следующую общую форму (t = 1,..., T)
(1) |
t = 1..., T.
yt - серия откликов.
Xt - t строка X, которая является матрицей конкатенированных векторов данных предиктора. То есть Xt является t наблюдения каждой серии предикторов.
c является регрессионной моделью точки пересечения.
β - коэффициент регрессии.
ut - ряд нарушений порядка.
εt - серия инноваций.
который является p степени, несезональным авторегрессивным полиномом.
который является ps степени, сезонным авторегрессивным полиномом.
который является D степени, несезональным полиномом интегрирования.
который является s степени, сезонным полиномом интегрирования.
который является q степени, несезональным полиномом скользящего среднего значения.
который является qs степени, сезонным полиномом скользящего среднего значения.
Если вы задаете, что D = s = 0 (т.е. вы не указываете сезонное или несезонное интегрирование), то каждый параметр идентифицируется. Другими словами, целевая функция правдоподобия чувствительна к изменению параметра, учитывая данные.
Если вы задаете, что D > 0 или s > 0, и хотите оценить точку пересечения, c, то c не идентифицируется.
Можно показать, что это правда.
Рассмотрим уравнение 1. Решите для ut во втором уравнении и замените его в первое.
где
Функция правдоподобия основана на распределении εt. Решите для εt.
Обратите внимание, что Ljc = c. Постоянный термин способствует вероятности следующим образом.
или
Поэтому, когда модель ошибки ARIMA интегрирована, целевая функция правдоподобия, основанная на распределении εt, инвариантна значению c.
В целом эффективная константа в эквивалентном представлении ARIMAX регрессионой модели с ошибками ARIMA является функцией составных авторегрессивных коэффициентов и исходной < reservedrangesplaceholder0 > точки пересечения и включает нелинейное ограничение. Это ограничение легко введено для таких приложений, как Симуляция Монте-Карло интегрированных моделей с ненулевыми точками пересечения. Однако для оценки модель ARIMAX не может идентифицировать константу в присутствии интегрированного полинома, и это приводит к ложным или необычным оценкам параметра.
Следует исключить точку пересечения из интегрированных моделей в большинстве приложений.
В качестве иллюстрации рассмотрим регрессионую модель с ошибками ARIMA (2,1,1) без предикторов
(2) |
(3) |
Вы можете переписать Уравнение 3 с помощью замены и некоторых манипуляций
Обратите внимание, что
Поэтому регрессионая модель с ошибками ARIMA (2,1,1) в уравнении 3 имеет представление модели ARIMA (2,1,1)
Можно увидеть, что константа не присутствует в модели (что подразумевает ее значение 0), хотя значение регрессионой модели с точкой пересечения ошибок ARIMA составляет 0,5.
Можно также моделировать это поведение. Начните, задав регрессионую модель с ошибками ARIMA (2,1,1) в уравнении 3.
Mdl0 = regARIMA('D',1,'AR',{0.8 -0.4},'MA',0.3,... 'Intercept',0.5,'Variance', 0.2);
Симулируйте 1000 наблюдений.
rng(1); T = 1000; y = simulate(Mdl0, T);
Подгонка Mdl
к данным.
Mdl = regARIMA('ARLags',1:2,'MALags',1,'D',1);... % "Empty" model to pass into estimate [EstMdl,EstParamCov] = estimate(Mdl,y,'Display','params');
Warning: When ARIMA error model is integrated, the intercept is unidentifiable and cannot be estimated; a NaN is returned.
ARIMA(2,1,1) Error Model (Gaussian Distribution): Value StandardError TStatistic PValue ________ _____________ __________ ___________ Intercept NaN NaN NaN NaN AR{1} 0.89647 0.048507 18.481 2.9207e-76 AR{2} -0.45102 0.038916 -11.59 4.6573e-31 MA{1} 0.18804 0.054505 3.45 0.00056069 Variance 0.19789 0.0083512 23.696 3.9373e-124
estimate
отображает предупреждение, чтобы сообщить вам, что точка пересечения не идентифицируется, и устанавливает его оценку, стандартную ошибку и t -статистическую на NaN
.
Постройте график вероятности для точки пересечения.
c = linspace(Mdl0.Intercept - 50,... Mdl0.Intercept + 50,100); % Grid of intercepts logL = nan(numel(c),1); % For preallocation for i = 1:numel(logL) EstMdl.Intercept = c(i); [~,~,~,logL(i)] = infer(EstMdl,y); end figure plot(c,logL) title('Profile Log-Likelihood with Respect to the Intercept') xlabel('Intercept') ylabel('Loglikelihood')
Логарифмическая правдоподобность не меняется по сетке значений точки пересечения. Легкое колебание является результатом численной стандартной программы, используемой infer
.