forecast

Класс: dssm

Предскажите состояния и наблюдения за рассеянными моделями в пространстве состояний

Описание

пример

[Y,YMSE] = forecast(Mdl,numPeriods,Y0) возвращает предсказанные наблюдения (Y) и их соответствующие отклонения (YMSE) от прогнозирования рассеянной модели в пространстве состояний Mdl использование numPeriods предскажите горизонт и наблюдения в выборке Y0.

пример

[Y,YMSE] = forecast(Mdl,numPeriods,Y0,Name,Value) дополнительные опции использования заданы одним или несколькими Name,Value парные аргументы. Например, для моделей в пространстве состояний, которые включают компонент линейной регрессии в модель наблюдения, включайте данные о предикторе в выборке, данные о предикторе для горизонта прогноза и коэффициент регрессии.

пример

[Y,YMSE,X,XMSE] = forecast(___) использование любой из входных параметров в предыдущих синтаксисах, чтобы дополнительно возвратить прогнозы состояния (X) и их соответствующие отклонения (XMSE).

Входные параметры

развернуть все

Рассеянная модель в пространстве состояний в виде dssm объект модели возвращен dssm или estimate.

Если Mdl не полностью задан (то есть, Mdl содержит неизвестные параметры), затем задайте значения для неизвестных параметров с помощью 'Params' аргумент пары "имя-значение". В противном случае программное обеспечение выдает ошибку. estimate возвращает полностью заданные модели в пространстве состояний.

Mdl не хранит наблюдаемые ответы или данные о предикторе. Снабдите данными везде, где необходимое использование соответствующего входа или аргументов пары "имя-значение".

Предскажите горизонт в виде положительного целого числа. Таким образом, программное обеспечение возвращается 1.., numPeriods прогнозы.

Типы данных: double

В выборке, наблюдаемые ответы в виде вектора ячейки из числовых векторов или матрицы.

  • Если Mdl независимо от времени, затем Y0 T-by-n числовая матрица, где каждая строка соответствует периоду, и каждый столбец соответствует конкретному наблюдению в модели. Поэтому T является объемом выборки, и m является количеством наблюдений на период. Последняя строка Y содержит последние наблюдения.

  • Если Mdl время, варьируясь относительно уравнения наблюдения, затем Y T-by-1 вектор ячейки. Каждый элемент вектора ячейки соответствует периоду и содержит nt - размерный вектор из наблюдений в течение того периода. Соответствующие размерности содействующих матриц в Mdl.C{t} и Mdl.D{t} должно быть сопоставимо с матрицей в Y{t} в течение всех периодов. Последняя ячейка Y содержит последние наблюдения.

Если Mdl предполагаемая модель в пространстве состояний (то есть, возвращенный estimate), затем это - лучшая практика установить Y0 к тому же набору данных, что вы раньше соответствовали Mdl.

NaN элементы указывают на недостающие наблюдения. Для получения дополнительной информации о том, как Фильтр Калмана вмещает недостающие наблюдения, см. Алгоритмы.

Типы данных: double | cell

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Beta',beta,'Predictors',Z задает, чтобы выкачать наблюдения компонентом регрессии, состоявшим из данных о предикторе Z и матрица коэффициентов beta.

Горизонт прогноза, изменение состояния, содействующие матрицы в виде разделенной запятой пары, состоящей из 'A' и вектор ячейки из числовых матриц.

  • A должен содержать, по крайней мере, numPeriods ячейки. Каждая ячейка должна содержать матрицу, задающую как переход состояний в горизонте прогноза. Если длина A больше numPeriods, затем программное обеспечение использует первый numPeriods ячейки. Последняя ячейка указывает на последний период в горизонте прогноза.

  • Если Mdl независимо от времени относительно состояний, затем каждая ячейка A должен содержать m-by-m матрица, где m является количеством состояний в выборке на период. По умолчанию программное обеспечение использует Mdl.A в горизонте прогноза.

  • Если Mdl время, варьируясь относительно состояний, затем размерности матриц в ячейках A может варьироваться, но размерности каждой матрицы должны быть сопоставимы с матрицами в B и C в соответствующие периоды. По умолчанию программное обеспечение использует Mdl.A{end} в горизонте прогноза.

Примечание

Матрицы в A не может содержать NaN значения.

Типы данных: cell

Горизонт прогноза, загрузка воздействия состояния, содействующие матрицы в виде разделенной запятой пары, состоящей из 'B' и вектор ячейки из матриц.

  • B должен содержать, по крайней мере, numPeriods ячейки. Каждая ячейка должна содержать матрицу, задающую как переход состояний в горизонте прогноза. Если длина B больше numPeriods, затем программное обеспечение использует первый numPeriods ячейки. Последняя ячейка указывает на последний период в горизонте прогноза.

  • Если Mdl независимо от времени относительно состояний и воздействий состояния, затем каждая ячейка B должен содержать m-by-k матрица, где m является количеством состояний в выборке на период, и k является количеством воздействий состояния, в выборке на период. По умолчанию программное обеспечение использует Mdl.B в горизонте прогноза.

  • Если Mdl время, варьируясь, затем размерности матриц в ячейках B может варьироваться, но размерности каждой матрицы должны быть сопоставимы с матрицами в A в соответствующие периоды. По умолчанию программное обеспечение использует Mdl.B{end} в горизонте прогноза.

Примечание

Матрицы в B не может содержать NaN значения.

Типы данных: cell

Горизонт прогноза, чувствительность измерения, содействующие матрицы в виде разделенной запятой пары, состоящей из 'C' и вектор ячейки из матриц.

  • C должен содержать, по крайней мере, numPeriods ячейки. Каждая ячейка должна содержать матрицу, задающую как переход состояний в горизонте прогноза. Если длина C больше numPeriods, затем программное обеспечение использует первый numPeriods ячейки. Последняя ячейка указывает на последний период в горизонте прогноза.

  • Если Mdl независимо от времени относительно состояний и наблюдений, затем каждая ячейка C должен содержать n-by-m матрица, где n является количеством наблюдений в выборке на период, и m является количеством состояний в выборке на период. По умолчанию программное обеспечение использует Mdl.C в горизонте прогноза.

  • Если Mdl время, варьируясь относительно состояний или наблюдений, затем размерности матриц в ячейках C может варьироваться, но размерности каждой матрицы должны быть сопоставимы с матрицами в A и D в соответствующие периоды. По умолчанию программное обеспечение использует Mdl.C{end} в горизонте прогноза.

Примечание

Матрицы в C не может содержать NaN значения.

Типы данных: cell

Горизонт прогноза, инновации наблюдения, содействующие матрицы в виде разделенной запятой пары, состоящей из 'D' и вектор ячейки из матриц.

  • D должен содержать, по крайней мере, numPeriods ячейки. Каждая ячейка должна содержать матрицу, задающую как переход состояний в горизонте прогноза. Если длина D больше numPeriods, затем программное обеспечение использует первый numPeriods ячейки. Последняя ячейка указывает на последний период в горизонте прогноза.

  • Если Mdl независимо от времени относительно наблюдений и инноваций наблюдения, затем каждая ячейка D должен содержать n-by-h матрица, где n является количеством наблюдений в выборке на период, и h является количеством в выборке, инноваций наблюдения на период. По умолчанию программное обеспечение использует Mdl.D в горизонте прогноза.

  • Если Mdl время, варьируясь относительно наблюдений или инноваций наблюдения, затем размерности матриц в ячейках D может варьироваться, но размерности каждой матрицы должны быть сопоставимы с матрицами в C в соответствующие периоды. По умолчанию программное обеспечение использует Mdl.D{end} в горизонте прогноза.

Примечание

Матрицы в D не может содержать NaN значения.

Типы данных: cell

Коэффициенты регрессии, соответствующие переменным предикторам в виде разделенной запятой пары, состоящей из 'Beta' и d-by-n числовая матрица. d является количеством переменных предикторов (см. Predictors0 и PredictorsF) и n является количеством наблюдаемого ряда ответа (см. Y0).

  • Если вы задаете Beta, затем необходимо также задать Predictors0 и PredictorsF.

  • Если Mdl предполагаемая модель в пространстве состояний, затем задайте предполагаемые коэффициенты регрессии, сохраненные в Mdl.estParams.

По умолчанию программное обеспечение исключает компонент регрессии из модели в пространстве состояний.

В выборке, переменные предикторы в уравнении наблюдения модели в пространстве состояний в виде разделенной запятой пары, состоящей из 'Predictors0' и матрица. Столбцы Predictors0 соответствуйте отдельным переменным предикторам. Predictors0 должен иметь строки T, где строка t соответствует наблюдаемым предикторам в период t (Zt). Расширенное уравнение наблюдения

ytZtβ=Cxt+Dut.

Другими словами, программное обеспечение выкачивает наблюдения с помощью компонента регрессии. β является независимым от времени вектором из коэффициентов регрессии, которые программное обеспечение оценивает всеми другими параметрами.

  • Если существуют наблюдения n на период, то регрессы программного обеспечения весь ряд предиктора на каждое наблюдение.

  • Если вы задаете Predictors0, затем Mdl должно быть независимо от времени. В противном случае программное обеспечение возвращает ошибку.

  • Если вы задаете Predictors0, затем необходимо также задать Beta и PredictorsF.

  • Если Mdl предполагаемая модель в пространстве состояний (то есть, возвращенный estimate), затем это - лучшая практика установить Predictors0 к тому же набору данных предиктора, что вы раньше соответствовали Mdl.

По умолчанию программное обеспечение исключает компонент регрессии из модели в пространстве состояний.

Типы данных: double

В выборке, переменные предикторы в уравнении наблюдения модели в пространстве состояний в виде разделенной запятой пары, состоящей из 'Predictors0' и T-by-d числовая матрица. T является количеством в периодах расчета, и d является количеством переменных предикторов. Строка t соответствует наблюдаемым предикторам в период t (Zt). Расширенное уравнение наблюдения

ytZtβ=Cxt+Dut.

Другими словами, программное обеспечение выкачивает наблюдения с помощью компонента регрессии. β является независимым от времени вектором из коэффициентов регрессии, которые программное обеспечение оценивает всеми другими параметрами.

  • Если существуют наблюдения n на период, то регрессы программного обеспечения весь ряд предиктора на каждое наблюдение.

  • Если вы задаете Predictors0, затем Mdl должно быть независимо от времени. В противном случае программное обеспечение возвращает ошибку.

  • Если вы задаете Predictors0, затем необходимо также задать Beta и PredictorsF.

  • Если Mdl предполагаемая модель в пространстве состояний (то есть, возвращенный estimate), затем это - лучшая практика установить Predictors0 к тому же набору данных предиктора, что вы раньше соответствовали Mdl.

По умолчанию программное обеспечение исключает компонент регрессии из модели в пространстве состояний.

Типы данных: double

Выходные аргументы

развернуть все

Предсказанные наблюдения, возвращенные как матрица или вектор ячейки из числовых векторов.

Если Mdl независимое от времени, модель в пространстве состояний относительно наблюдений, затем Y numPeriods- n матрица.

Если Mdl изменяющееся во времени, модель в пространстве состояний относительно наблюдений, затем Y numPeriods- 1 вектор ячейки из числовых векторов. Ячейка t Y содержит nt-by-1 числовой вектор из предсказанных наблюдений в течение периода t.

Ошибочные отклонения предсказанных наблюдений, возвращенных как матрица или вектор ячейки из числовых векторов.

Если Mdl независимое от времени, модель в пространстве состояний относительно наблюдений, затем YMSE numPeriods- n матрица.

Если Mdl изменяющееся во времени, модель в пространстве состояний относительно наблюдений, затем YMSE numPeriods- 1 вектор ячейки из числовых векторов. Ячейка t YMSE содержит nt-by-1 числовой вектор из ошибочных отклонений для соответствующих предсказанных наблюдений в течение периода t.

Прогнозы состояния, возвращенные как матрица или вектор ячейки из числовых векторов.

Если Mdl независимое от времени, модель в пространстве состояний относительно состояний, затем X numPeriods- m матрица.

Если Mdl изменяющееся во времени, модель в пространстве состояний относительно состояний, затем X numPeriods- 1 вектор ячейки из числовых векторов. Ячейка t X содержит mt-by-1 числовой вектор из предсказанных наблюдений в течение периода t.

Ошибочные отклонения прогнозов состояния, возвращенных как матрица или вектор ячейки из числовых векторов.

Если Mdl независимое от времени, модель в пространстве состояний относительно состояний, затем XMSE numPeriods- m матрица.

Если Mdl изменяющееся во времени, модель в пространстве состояний относительно состояний, затем XMSE numPeriods- 1 вектор ячейки из числовых векторов. Ячейка t XMSE содержит mt-by-1 числовой вектор из ошибочных отклонений для соответствующих предсказанных наблюдений в течение периода t.

Примеры

развернуть все

Предположим, что скрытый процесс является случайным обходом. Уравнение состояния

xt=xt-1+ut,

где ut является Гауссовым со средним значением 0 и стандартным отклонением 1.

Сгенерируйте случайную последовательность 100 наблюдений от xt, предположение, что ряд запускается в 1,5.

T = 100;
x0 = 1.5;
rng(1); % For reproducibility
u = randn(T,1);
x = cumsum([x0;u]);
x = x(2:end);

Предположим далее, что скрытый процесс подвергается аддитивной погрешности измерения. Уравнение наблюдения

yt=xt+εt,

где εt является Гауссовым со средним значением 0 и стандартным отклонением 0.75. Вместе, скрытые уравнения процесса и наблюдения составляют модель в пространстве состояний.

Используйте случайный скрытый процесс состояния (x) и уравнение наблюдения, чтобы сгенерировать наблюдения.

y = x + 0.75*randn(T,1);

Задайте четыре содействующих матрицы.

A = 1;
B = 1;
C = 1;
D = 0.75;

Создайте рассеянную модель в пространстве состояний с помощью содействующих матриц. Укажите, что распределение начального состояния является рассеянным.

Mdl = dssm(A,B,C,D,'StateType',2)
Mdl = 
State-space model type: dssm

State vector length: 1
Observation vector length: 1
State disturbance vector length: 1
Observation innovation vector length: 1
Sample size supported by model: Unlimited

State variables: x1, x2,...
State disturbances: u1, u2,...
Observation series: y1, y2,...
Observation innovations: e1, e2,...

State equation:
x1(t) = x1(t-1) + u1(t)

Observation equation:
y1(t) = x1(t) + (0.75)e1(t)

Initial state distribution:

Initial state means
 x1 
  0 

Initial state covariance matrix
     x1  
 x1  Inf 

State types
    x1   
 Diffuse 

Mdl dssm модель. Проверьте, что модель правильно задана с помощью отображения в Командном окне.

Предскажите наблюдения 10 периодов в будущее и оцените среднеквадратические ошибки прогнозов.

numPeriods = 10;
[ForecastedY,YMSE] = forecast(Mdl,numPeriods,y);

Постройте прогнозы с ответами в выборке, и 95% интервалов прогноза вальдового типа.

ForecastIntervals(:,1) = ForecastedY - 1.96*sqrt(YMSE);
ForecastIntervals(:,2) = ForecastedY + 1.96*sqrt(YMSE);

figure
plot(T-20:T,y(T-20:T),'-k',T+1:T+numPeriods,ForecastedY,'-.r',...
    T+1:T+numPeriods,ForecastIntervals,'-.b',...
    T:T+1,[y(end)*ones(3,1),[ForecastedY(1);ForecastIntervals(1,:)']],':k',...
    'LineWidth',2)
hold on
title({'Observed Responses and Their Forecasts'})
xlabel('Period')
ylabel('Responses')
legend({'Observations','Forecasted observations','95% forecast intervals'},...
    'Location','Best')
hold off

Интервалы прогноза становятся шире, потому что процесс является неустановившимся.

Предположим, что линейное соотношение между уровнем безработицы и номинальным валовым национальным продуктом (nGNP) представляет интерес. Предположим далее, что уровень безработицы является серией AR (1). Символически, и в форме пространства состояний, модель

xt=ϕxt-1+σutyt-βZt=xt,

где:

  • xt уровень безработицы во время t.

  • yt наблюдаемое изменение в уровне безработицы, выкачиваемом возвратом nGNP (Zt).

  • ut серия Gaussian воздействий состояния, имеющих среднее значение 0 и неизвестное стандартное отклонение σ.

Загрузите набор данных Нельсона-Плоссера, который содержит уровень безработицы и nGNP ряд, среди прочего.

load Data_NelsonPlosser

Предварительно обработайте данные путем взятия натурального логарифма nGNP ряда и удаления стартового NaN значения от каждого ряда.

isNaN = any(ismissing(DataTable),2);       % Flag periods containing NaNs
gnpn = DataTable.GNPN(~isNaN);
y = diff(DataTable.UR(~isNaN));
T = size(gnpn,1);                          % The sample size
Z = price2ret(gnpn);

Этот пример продолжает использовать ряд без NaN значения. Однако с помощью среды Фильтра Калмана, программное обеспечение может вместить ряд, содержащий отсутствующие значения.

Определите, как хорошо модель предсказывает наблюдения путем удаления последних 10 наблюдений для сравнения.

numPeriods = 10;                   % Forecast horizon
isY = y(1:end-numPeriods);         % In-sample observations
oosY = y(end-numPeriods+1:end);    % Out-of-sample observations
ISZ = Z(1:end-numPeriods);         % In-sample predictors
OOSZ = Z(end-numPeriods+1:end);  % Out-of-sample predictors

Задайте содействующие матрицы.

A = NaN;
B = NaN;
C = 1;

Создайте модель в пространстве состояний с помощью dssm путем предоставления содействующих матриц и указывания, что значения состояния прибывают из рассеянного распределения. Рассеянная спецификация указывает на полное незнание о моментах начального распределения.

StateType = 2;
Mdl = dssm(A,B,C,'StateType',StateType);

Оцените параметры. Задайте компонент регрессии и его начальное значение для оптимизации с помощью 'Predictors' и 'Beta0' аргументы пары "имя-значение", соответственно. Отобразите оценки и всю информацию о диагностике оптимизации. Ограничьте оценку σ ко всем положительным, вещественным числам.

params0 = [0.3 0.2]; % Initial values chosen arbitrarily
Beta0 = 0.1;
[EstMdl,estParams] = estimate(Mdl,y,params0,'Predictors',Z,'Beta0',Beta0,...
    'lb',[-Inf 0 -Inf]);
Method: Maximum likelihood (fmincon)
Effective Sample size:             60
Logarithmic  likelihood:     -110.477
Akaike   info criterion:      226.954
Bayesian info criterion:      233.287
           |      Coeff       Std Err    t Stat    Prob 
--------------------------------------------------------
 c(1)      |   0.59436       0.09408     6.31738  0     
 c(2)      |   1.52554       0.10758    14.17991  0     
 y <- z(1) | -24.26161       1.55730   -15.57930  0     
           |                                            
           |    Final State   Std Dev     t Stat   Prob 
 x(1)      |   2.54764        0           Inf     0     

EstMdl dssm модель, и можно получить доступ к ее свойствам с помощью записи через точку.

Предскажите наблюдения по горизонту прогноза. EstMdl не хранит набор данных, таким образом, необходимо передать его в соответствующих аргументах пары "имя-значение".

[fY,yMSE] = forecast(EstMdl,numPeriods,isY,'Predictors0',ISZ,...
    'PredictorsF',OOSZ,'Beta',estParams(end));

fY вектор 10 на 1, содержащий предсказанные наблюдения и yMSE вектор 10 на 1, содержащий отклонения предсказанных наблюдений.

Получите 95% интервалов прогноза вальдового типа. Постройте предсказанные наблюдения с их истинными значениями и интервалами прогноза.

ForecastIntervals(:,1) = fY - 1.96*sqrt(yMSE);
ForecastIntervals(:,2) = fY + 1.96*sqrt(yMSE);

figure
h = plot(dates(end-numPeriods-9:end-numPeriods),isY(end-9:end),'-k',...
    dates(end-numPeriods+1:end),oosY,'-k',...
    dates(end-numPeriods+1:end),fY,'--r',...
    dates(end-numPeriods+1:end),ForecastIntervals,':b',...
    dates(end-numPeriods:end-numPeriods+1),...
    [isY(end)*ones(4,1),[oosY(1);ForecastIntervals(1,:)';fY(1)]],':k',...
    'LineWidth',2);
xlabel('Period')
ylabel('Change in unemployment rate')
legend(h([1,3,4]),{'Observations','Forecasted responses',...
    '95% forecast intervals'})
title('Observed and Forecasted Changes in the Unemployment Rate')

Предположим, что скрытый процесс является случайным обходом. Уравнение состояния

xt=xt-1+ut,

где ut является Гауссовым со средним значением 0 и стандартным отклонением 1.

Сгенерируйте случайную последовательность 100 наблюдений от xt, предположение, что ряд запускается в 1,5.

T = 100;
x0 = 1.5;
rng(1); % For reproducibility
u = randn(T,1);
x = cumsum([x0;u]);
x = x(2:end);

Предположим далее, что скрытый процесс подвергается аддитивной погрешности измерения. Уравнение наблюдения

yt=xt+εt,

где εt является Гауссовым со средним значением 0 и стандартным отклонением 0.75. Вместе, скрытые уравнения процесса и наблюдения составляют модель в пространстве состояний.

Используйте случайный скрытый процесс состояния (x) и уравнение наблюдения, чтобы сгенерировать наблюдения.

y = x + 0.75*randn(T,1);

Задайте четыре содействующих матрицы.

A = 1;
B = 1;
C = 1;
D = 0.75;

Создайте рассеянную модель в пространстве состояний с помощью содействующих матриц. Укажите, что распределение начального состояния является рассеянным.

Mdl = dssm(A,B,C,D,'StateType',2)
Mdl = 
State-space model type: dssm

State vector length: 1
Observation vector length: 1
State disturbance vector length: 1
Observation innovation vector length: 1
Sample size supported by model: Unlimited

State variables: x1, x2,...
State disturbances: u1, u2,...
Observation series: y1, y2,...
Observation innovations: e1, e2,...

State equation:
x1(t) = x1(t-1) + u1(t)

Observation equation:
y1(t) = x1(t) + (0.75)e1(t)

Initial state distribution:

Initial state means
 x1 
  0 

Initial state covariance matrix
     x1  
 x1  Inf 

State types
    x1   
 Diffuse 

Mdl dssm модель. Проверьте, что модель правильно задана с помощью отображения в Командном окне.

Предскажите состояния 10 периодов в будущее и оцените среднеквадратические ошибки прогнозов.

numPeriods = 10;
[~,~,ForecastedX,XMSE] = forecast(Mdl,numPeriods,y);

Постройте прогнозы с состояниями в выборке, и 95% интервалов прогноза вальдового типа.

ForecastIntervals(:,1) = ForecastedX - 1.96*sqrt(XMSE);
ForecastIntervals(:,2) = ForecastedX + 1.96*sqrt(XMSE);

figure
plot(T-20:T,x(T-20:T),'-k',T+1:T+numPeriods,ForecastedX,'-.r',...
    T+1:T+numPeriods,ForecastIntervals,'-.b',...
    T:T+1,[x(end)*ones(3,1),[ForecastedX(1);ForecastIntervals(1,:)']],':k',...
    'LineWidth',2)
hold on
title({'State Values and Their Forecasts'})
xlabel('Period')
ylabel('State value')
legend({'State Values','Forecasted states','95% forecast intervals'},...
    'Location','Best')
hold off

Интервалы прогноза становятся шире, потому что процесс является неустановившимся.

Советы

Mdl не хранит данные об ответе, данные о предикторе и коэффициенты регрессии. Предоставьте их каждый раз, когда необходимое использование соответствующего входа или аргументов пары "имя-значение".

Алгоритмы

Фильтр Калмана хранит недостающие данные, не обновляя отфильтрованное оценочное соответствие состояния недостающим наблюдениям. Другими словами, предположите, что существует недостающее наблюдение в период t. Затем прогноз состояния для периода t на основе предыдущего t – 1 наблюдение и отфильтрованное состояние в течение периода t эквивалентен.

Ссылки

[1] Дербин Дж. и С. Дж. Купмен. Анализ Временных рядов Методами Пространства состояний. 2-й редактор Оксфорд: Издательство Оксфордского университета, 2012.

Введенный в R2015b
Для просмотра документации необходимо авторизоваться на сайте