В этом примере показано, как спрогнозировать мультипликативную сезонную модель ARIMA с помощью forecast
. Серия ответов - ежемесячные международные пассажирские номера авиакомпаний с 1949 по 1960 год.
Загрузите данные авиакомпании и наборы данных спада. Преобразуйте ответ.
load('Data_Airline.mat') load Data_Recessions y = log(Data);
Создайте предиктор (X
), который определяет, была ли страна в рецессии в течение выбранного периода. 0 в строке t означает, что страна не была в рецессии в месяце t, а 1 в строке t означает, что она была в рецессии в месяце t.
X = zeros(numel(dates),1); % Preallocation for j = 1:size(Recessions,1) X(dates >= Recessions(j,1) & dates <= Recessions(j,2)) = 1; end
Задайте наборы индексов, которые разделяют данные на оценочные и прогнозные выборки.
nSim = 60; % Forecast period
T = length(y);
estInds = 1:(T-nSim);
foreInds = (T-nSim+1):T;
Оцените регрессионую модель с мультипликативным сезонным ARIMA} ошибки:
Установите точку пересечения регрессионной модели равным 0, поскольку он не идентифицируется в модели с интегрированными ошибками.
Mdl = regARIMA('D',1,'Seasonality',12,'MALags',1,'SMALags',12,... 'Intercept',0); EstMdl = estimate(Mdl,y(estInds),'X',X(estInds));
Regression with ARIMA(0,1,1) Error Model Seasonally Integrated with Seasonal MA(12) (Gaussian Distribution): Value StandardError TStatistic PValue _________ _____________ __________ __________ Intercept 0 0 NaN NaN MA{1} -0.35662 0.10393 -3.4312 0.00060088 SMA{12} -0.67729 0.11294 -5.9972 2.0077e-09 Beta(1) 0.0015098 0.020533 0.07353 0.94138 Variance 0.0015198 0.00021411 7.0983 1.2631e-12
Используйте оцененные коэффициенты модели (содержатся в EstMdl
), чтобы сгенерировать прогнозы MMSE и соответствующие средние квадратные ошибки в 60-месячном горизонте. Используйте наблюдаемый ряд как предварительные данные. По умолчанию forecast
выводит предварительную выборку инноваций и безусловных нарушений порядка с использованием заданной модели и наблюдений.
[YF,YMSE] = forecast(EstMdl,nSim,'X0',X(estInds),... 'Y0',y(estInds),'XF',X(foreInds)); ForecastInt = [YF,YF] + 1.96*[-sqrt(YMSE), sqrt(YMSE)]; figure h1 = plot(dates,y); title('{\bf Forecasted Monthly Passenger Totals}') hold on h2 = plot(dates(foreInds),YF,'Color','r','LineWidth',2); h3 = plot(dates(foreInds),ForecastInt,'k--','LineWidth',2); datetick legend([h1,h2,h3(1)],'Observations','MMSE Forecasts',... '95% MMSE Forecast Intervals','Location','NorthWest') axis tight hold off
Регрессионная модель с ошибками SMA, по-видимому, хорошо прогнозирует серию, хотя и немного завышая. Поскольку процесс ошибки нестационарен, интервалы прогноза расширяются с увеличением времени.
Сравнение прогнозов MMSE с прогнозами Монте-Карло путем симуляции 500 путей выборки из EstMdl
по прогнозному горизонту.
[e0,u0] = infer(EstMdl,y(estInds),'X',X(estInds)); rng(5); numPaths = 500; ySim = simulate(EstMdl,nSim,'numPaths',numPaths,... 'E0',e0,'U0',u0,'X',X(foreInds)); meanYSim = mean(ySim,2); ForecastIntMC = [prctile(ySim,2.5,2),prctile(ySim,97.5,2)]; figure h1 = plot(dates(foreInds),y(foreInds)); title('{\bf Forecasted Monthly Passenger Totals}') hold on h2 = plot(dates(foreInds),YF,'Color',[0.85,0.85,0.85],... 'LineWidth',4); h3 = plot(dates(foreInds),ForecastInt,'--','Color',... [0.85,0.85,0.85],'LineWidth',4); h4 = plot(dates(foreInds),meanYSim,'k','LineWidth',2); h5 = plot(dates(foreInds),ForecastIntMC,'k--','LineWidth',2); datetick legend([h1,h2,h3(1),h4,h5(1)],'Observations',... 'MMSE Forecasts','95% MMSE Forecast Intervals',... 'Monte Carlo Forecasts','95% Monte Carlo Forecast Intervals',... 'Location','NorthWest') axis tight hold off
Прогнозы MMSE и средние прогнозы Монте-Карло практически неразличимы. Однако существуют небольшие расхождения между теоретическими 95% интервалами прогноза и 95% интервалами прогноза на основе моделирования.
estimate
| forecast
| regARIMA
| simulate