Этот пример показывает аппроксимацию регрессионной модели с мультипликативными ошибками ARIMA к данным с помощью estimate
.
Загрузите данные о авиакомпании и рецессии. Постройте график ежемесячных итогов по пассажирам и журнала итогов.
load('Data_Airline.mat') load Data_Recessions y = Data; logY = log(y); figure subplot(2,1,1) plot(y) title('{\bf Monthly Passenger Totals (Jan1949 - Dec1960)}') datetick subplot(2,1,2) plot(log(y)) title('{\bf Monthly Passenger Log-Totals (Jan1949 - Dec1960)}') datetick
Преобразование журнала, по-видимому, линеаризирует временные ряды.
Создайте предиктор (X
), который заключается в том, была ли страна в рецессии в течение выбранного периода. 0 в строке t означает, что страна не была в рецессии в месяце t, а 1 в строке t означает, что она была в рецессии в месяце t.
X = zeros(numel(dates),1); % Preallocation for j = 1:size(Recessions,1) X(dates >= Recessions(j,1) & dates <= Recessions(j,2)) = 1; end
Подбирайте простую линейную регрессионую модель
к данным.
Fit = fitlm(X,logY);
Fit
является LinearModel
который содержит оценки методом наименьших квадратов.
Проверяйте на соответствие стандартной линейной модели путем построения графиков невязок несколькими способами.
figure subplot(2,2,1) plotResiduals(Fit,'caseorder','ResidualType','Standardized',... 'LineStyle','-','MarkerSize',0.5) h = gca; h.FontSize = 8; subplot(2,2,2) plotResiduals(Fit,'lagged','ResidualType','Standardized') h = gca; h.FontSize = 8; subplot(2,2,3) plotResiduals(Fit,'probability','ResidualType','Standardized') h = gca; h.YTick = h.YTick(1:2:end); h.YTickLabel = h.YTickLabel(1:2:end,:); h.FontSize = 8; subplot(2,2,4) plotResiduals(Fit,'histogram','ResidualType','Standardized') h = gca; h.FontSize = 8;
r = Fit.Residuals.Standardized; figure subplot(2,1,1) autocorr(r) h = gca; h.FontSize = 9; subplot(2,1,2) parcorr(r) h = gca; h.FontSize = 9;
Остаточные графики указывают, что безусловные нарушения порядка являются автокоррелированными. График вероятностей и гистограмма, по-видимому, указывают, что безусловные нарушения порядка являются Гауссовыми.
ACF невязок подтверждает, что безусловные нарушения порядка являются автокоррелированными.
Возьмите 1-ое различие невязок и постройте график ACF и PACF дифференцированных невязок.
dR = diff(r); figure subplot(2,1,1) autocorr(dR,'NumLags',50) h = gca; h.FontSize = 9; subplot(2,1,2) parcorr(dR,'NumLAgs',50) h = gca; h.FontSize = 9;
ACF показывает, что существуют значительно большие автокорреляции, особенно при каждой 12-й задержке. Это указывает, что безусловные нарушения порядка имеют сезонное интегрирование 12-й степени.
Возьмем первое и 12-е различия невязок. Постройте график дифференцированных невязок и их ACF и PACF.
DiffPoly = LagOp([1 -1]); SDiffPoly = LagOp([1 -1],'Lags',[0, 12]); diffR = filter(DiffPoly*SDiffPoly,r); figure subplot(2,1,1) plot(diffR) axis tight subplot(2,2,3) autocorr(diffR) h = gca; h.FontSize = 7; axis tight subplot(2,2,4) parcorr(diffR) h = gca; h.FontSize = 7; axis tight
Невязки напоминают белый шум (с возможной гетероскедастичностью). Согласно Box and Jenkins (1994), глава 9, ACF и PACF указывают, что безусловные нарушения порядка являются модель.
Задайте регрессионую модель с ошибки:
Mdl = regARIMA('MALags',1,'D',1,'Seasonality',12,'SMALags',12)
Mdl = regARIMA with properties: Description: "ARIMA(0,1,1) Error Model Seasonally Integrated with Seasonal MA(12) (Gaussian Distribution)" Distribution: Name = "Gaussian" Intercept: NaN Beta: [1×0] P: 13 D: 1 Q: 13 AR: {} SAR: {} MA: {NaN} at lag [1] SMA: {NaN} at lag [12] Seasonality: 12 Variance: NaN
Разбейте набор данных на предварительную выборку и выборку оценки, чтобы можно было инициализировать ряд. P
= Q
= 13, поэтому предварительная выборка должен быть продолжительностью не менее 13 периодов.
preLogY = logY(1:13); % Presample responses estLogY = logY(14:end); % Estimation sample responses preX = X(1:13); % Presample predictors estX = X(14:end); % Estimation sample predictors
Получите предварительную выборку безусловных нарушений порядка из линейной регрессии данных предварительного образца.
PreFit = fitlm(preX,preLogY);... % Presample fit for presample residuals EstFit = fitlm(estX,estLogY);... % Estimation sample fit for the intercept U0 = PreFit.Residuals.Raw;
Если модель ошибки интегрирована, то точка пересечения регрессионой модели не идентифицируется. Задайте Intercept
к оценённой точке пересечения из линейной регрессии оценочных выборочных данных. Оцените регрессионую модель с ошибками IMA.
Mdl.Intercept = EstFit.Coefficients{1,1}; EstMdl = estimate(Mdl,estLogY,'X',estX,'U0',U0);
Regression with ARIMA(0,1,1) Error Model Seasonally Integrated with Seasonal MA(12) (Gaussian Distribution): Value StandardError TStatistic PValue _________ _____________ __________ __________ Intercept 5.5722 0 Inf 0 MA{1} -0.025366 0.22197 -0.11427 0.90902 SMA{12} -0.80255 0.052705 -15.227 2.3349e-52 Beta(1) 0.0027588 0.10139 0.02721 0.97829 Variance 0.0072463 0.00015974 45.365 0
MA{1}
и Beta1
существенно не отличаются от 0. Можно удалить эти параметры из модели, возможно, добавить другие параметры (например, параметры AR) и сравнить несколько моделей подгонки с помощью aicbic
. Обратите внимание, что оценка и предварительная выборка должны быть одинаковыми по сравнению с конкурирующими моделями.
Ссылки:
Box, G. E. P., G. M. Jenkins, and G. C. Reinsel. Анализ временных рядов: прогнозирование и управление. 3-й эд. Englewood Cliffs, Нью-Джерси: Prentice Hall, 1994.