оценка

Класс: dssm

Оценка параметра наибольшего правдоподобия рассеянных моделей в пространстве состояний

Синтаксис

EstMdl = estimate(Mdl,Y,params0)
EstMdl = estimate(Mdl,Y,params0,Name,Value)
[EstMdl,estParams,EstParamCov,logL,Output] = estimate(___)

Описание

пример

EstMdl = estimate(Mdl,Y,params0) возвращает предполагаемую рассеянную модель в пространстве состояний в подбор кривой модели dssm Mdl к данным об ответе Y. params0 является вектором начальных значений для неизвестных параметров в Mdl.

пример

EstMdl = estimate(Mdl,Y,params0,Name,Value) оценивает рассеянную модель в пространстве состояний с дополнительными опциями, заданными одним или несколькими аргументами пары Name,Value. Например, можно задать, чтобы выкачать наблюдения линейной регрессией с помощью данных о предикторе, управлять, как результаты появляются в Командном окне и показывают который метод оценки использовать для ковариационной матрицы параметра.

пример

[EstMdl,estParams,EstParamCov,logL,Output] = estimate(___) дополнительно возвращает эти аргументы с помощью любого из входных параметров в предыдущих синтаксисах.

  • estParams, вектор, содержащий предполагаемые параметры

  • EstParamCov, предполагаемая ковариационная матрица отклонения предполагаемых параметров

  • logL, оптимизированное loglikelihood значение

  • Output, информационная структура диагностики оптимизации

Входные параметры

развернуть все

Рассеянная модель в пространстве состояний, содержащая неизвестные параметры, заданные как объект модели dssm, возвращенный dssm.

  • Для явным образом созданных моделей в пространстве состояний программное обеспечение оценивает все значения NaN в содействующих матрицах (Mdl.A, Mdl.B, Mdl.C и Mdl.D) и средние значения начального состояния и ковариационная матрица (Mdl.Mean0 и Mdl.Cov0). Для получения дополнительной информации на явном и неявном образцовом создании, смотрите dssm.

  • Для неявно созданных моделей в пространстве состояний вы задаете образцовую структуру и местоположение неизвестных параметров с помощью функции отображения параметра к матрице. Неявно создайте модель в пространстве состояний, чтобы оценить сложные модели, наложить ограничения параметра и оценить начальные состояния. Функция параметра к отображению может также разместить дополнительные выходные аргументы.

Примечание

Mdl не хранит наблюдаемые ответы или данные о предикторе. Снабдите данными везде, где необходимое использование, соответствующий вход и аргументы пары "имя-значение".

Наблюдаемые данные об ответе, к которым Mdl является подходящим, задан как числовая матрица или вектор ячейки числовых векторов.

  • Если Mdl независим от времени относительно уравнения наблюдения, то Y является T-by-n матрица. Каждая строка матрицы соответствует периоду, и каждый столбец соответствует конкретному наблюдению в модели. Поэтому T является объемом выборки, и n является количеством наблюдений на период. Последняя строка Y содержит последние наблюдения.

  • Если Mdl время, отличаясь относительно уравнения наблюдения, то Y является T-by-1 вектор ячейки. Y{t} содержит nt - размерный вектор наблюдений в течение периода t, где t = 1..., T. Соответствующие размерности содействующих матриц в Mdl.C{t} и Mdl.D{t} должны быть сопоставимы с матрицей в Y{t} в течение всех периодов. Последняя ячейка Y содержит последние наблюдения.

Предположим, что вы создаете Mdl неявно путем определения функции отображения параметра к матрице, и функция имеет входные параметры для наблюдаемых ответов или предикторов. Затем функция отображения устанавливает ссылку на наблюдаемые ответы и данные о предикторе в рабочей области MATLAB®, которая заменяет значение Y.

Элементы NaN указывают на недостающие наблюдения. Для получения дополнительной информации о том, как Фильтр Калмана размещает недостающие наблюдения, см. Алгоритмы.

Типы данных: double | cell

Начальные значения неизвестных параметров для числовой оценки наибольшего правдоподобия, заданной как числовой вектор.

Элементы params0 соответствуют неизвестным параметрам в матрицах модели в пространстве состояний A, B, C, и D, и, опционально, начальное состояние означают Mean0 и ковариационную матрицу Cov0.

  • Если вы создали Mdl явным образом (то есть, путем определения матриц без функции отображения параметра к матрице), то программное обеспечение сопоставляет элементы params к NaN s в матрицах модели в пространстве состояний и значениях начального состояния. Программное обеспечение ищет NaN s по столбцам, выполняя приказ A, B, C, D, Mean0, Cov0.

  • Если вы создали Mdl неявно (то есть, путем определения матриц с функцией отображения параметра к матрице), то установленные начальные значения параметров для матриц модели в пространстве состояний, значений начального состояния и состояния вводят в функции отображения параметра к матрице.

Типы данных: double

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'CovMethod','hessian','Display','diagnostics','Predictors',Z задает, чтобы оценить асимптотическую ковариацию параметра с помощью отрицательной, инвертированной матрицы Гессиана, диагностики оптимизации отображения в Командном окне, и выкачать наблюдения линейной регрессией, содержащей данные о предикторе Z.

Опции оценки

развернуть все

Начальные значения коэффициентов регрессии, заданных как пара, разделенная запятой, состоящая из 'Beta0' и d-by-n числовая матрица. d является количеством переменных прогноза (см. Predictors), и n является количеством наблюдаемого ряда ответа (см. Y).

По умолчанию Beta0 является обычной оценкой наименьших квадратов Y на Predictors.

Типы данных: double

Асимптотический метод оценки ковариации, заданный как пара, разделенная запятой, состоящая из 'CovMethod' и значения в этой таблице.

ЗначениеОписание
'hessian'Отрицательная, инвертированная матрица Гессиана
'opg'Векторное произведение градиентов (OPG)
'sandwich'И гессиан и OPG

Пример: 'CovMethod','sandwich'

Типы данных: char

Параметр экрана Командного окна, заданный как пара, разделенная запятой, состоящая из 'Display' и значения или любой комбинации значений в этой таблице.

Значениеоцените Отображения
'diagnostics'Диагностика оптимизации
'full'Оценки параметра наибольшего правдоподобия, стандартные погрешности, статистика t, итеративная информация об оптимизации и диагностика оптимизации
'iter'Итеративная информация об оптимизации
'off'Никакое отображение в Командном окне
'params'Оценки параметра наибольшего правдоподобия, стандартные погрешности и статистика t

Например:

  • Запускать симуляцию, где вы соответствуете многим моделям, и поэтому хотите подавить весь вывод, 'Display','off' использования.

  • Чтобы отобразить все результаты оценки и диагностику оптимизации, используйте 'Display',{'params','diagnostics'}.

Типы данных: char | cell | string

Опции оптимизации, заданные как пара, разделенная запятой, состоящая из 'Options' и контроллера оптимизации optimoptions. Options заменяет опции оптимизации по умолчанию оптимизатора. Для получения дополнительной информации на изменяющихся значениях по умолчанию оптимизатора, смотрите контроллер оптимизации optimoptions, ограниченная функция оптимизации fmincon или неограниченная функция оптимизации fminunc в Optimization Toolbox™.

Например, чтобы изменить допуск ограничения на 1e-6, установите Options = optimoptions(@fmincon,'ConstraintTolerance',1e-6,'Algorithm','sqp'). Затем передача Options в estimate с помощью 'Options',Options.

По умолчанию:

  • Для ограниченной оптимизации estimate максимизирует целевую функцию вероятности с помощью fmincon и его опций по умолчанию, но устанавливает 'Algorithm','interior-point'.

  • Для неограниченной оптимизации estimate максимизирует целевую функцию вероятности с помощью fminunc и его опций по умолчанию, но устанавливает 'Algorithm','quasi-newton'.

Данные о предикторе для компонента регрессии в уравнении наблюдения, заданном как пара, разделенная запятой, состоящая из 'Predictors' и T-by-d числовая матрица. T является количеством периодов, и d является количеством переменных прогноза. Строка t соответствует наблюдаемым предикторам в период t (Zt) в расширенном уравнении наблюдения

ytZtβ=Cxt+Dut.

Другими словами, ряды предиктора служат дефляторами наблюдения. β является d-by-n независимая от времени матрица коэффициентов регрессии, которые программное обеспечение оценивает со всеми другими параметрами.

  • Для наблюдений n на период программное обеспечение регрессирует весь ряд предиктора на каждое наблюдение.

  • Если вы задаете Predictors, то Mdl должен быть независим от времени. В противном случае программное обеспечение возвращает ошибку.

  • По умолчанию программное обеспечение исключает компонент регрессии из модели в пространстве состояний.

Типы данных: double

Итоговый период для рассеянной инициализации состояния, заданной как пара, разделенная запятой, состоящая из 'SwitchTime' и положительного целого числа. Таким образом, estimate использует наблюдения с периода 1 к периоду SwitchTime как предварительная выборка, чтобы реализовать exact initial Kalman filter (см. Рассеянный Фильтр Калмана и [1]). После инициализации рассеянных состояний estimate применяет стандартный Фильтр Калмана к наблюдениям с периодов SwitchTime + 1 к T.

Значение по умолчанию для SwitchTime является последним периодом, в который предполагаемая сглаживавшая матрица точности состояния сингулярна (т.е. инверсия ковариационной матрицы). Эта спецификация представляет наименьшее количество количества наблюдений, требуемых инициализировать рассеянные состояния. Поэтому это - лучшая практика использовать значение по умолчанию.

Если вы устанавливаете SwitchTime на значение, больше, чем значение по умолчанию, то эффективный объем выборки уменьшается. Если вы устанавливаете SwitchTime на значение, которое является меньше, чем значение по умолчанию, то estimate не может иметь достаточных наблюдений, чтобы инициализировать рассеянные состояния, которые могут привести к ошибке или неподходящим значениям.

В целом оценка, фильтруя и сглаживая модели в пространстве состояний по крайней мере с одним рассеянным состоянием требует, чтобы SwitchTime был по крайней мере одним. Отображение оценки по умолчанию содержит эффективный объем выборки.

Типы данных: double

Предскажите порог неуверенности, заданный как пара, разделенная запятой, состоящая из 'Tolerance' и неотрицательного скаляра.

Если неуверенность прогноза для конкретного наблюдения является меньше, чем Tolerance во время числовой оценки, то программное обеспечение удаляет неуверенность, соответствующую наблюдению от ковариационной матрицы прогноза перед ее инверсией.

Это - лучшая практика установить Tolerance на небольшое число, например, le-15, преодолевать числовые препятствия во время оценки.

Пример: 'Tolerance',le-15

Типы данных: double

Одномерная обработка многомерного серийного флага, заданного как пара, разделенная запятой, состоящая из 'Univariate' и true или false. Одномерная обработка многомерного ряда также известна как sequential filtering.

Одномерная обработка может ускорить и улучшить числовую устойчивость Фильтра Калмана. Однако все инновации наблюдения должны быть некоррелироваными. Таким образом, Dt, Dt' должен быть диагональным, где Dt, t = 1..., T, является одним из следующего:

  • Матричный D{t} в изменяющейся во времени модели в пространстве состояний

  • Матричный D в независимой от времени модели в пространстве состояний

Пример: 'Univariate',true

Типы данных: логический

Ограниченные Опции Оптимизации для fmincon

развернуть все

Линейный преобразователь параметра ограничения равенства для ограниченной максимизации целевой функции вероятности, заданной как пара, разделенная запятой, состоящая из 'Aeq' и матрицы.

Если вы задаете Aeq и beq, то estimate максимизирует целевую функцию вероятности с помощью ограничения равенства Aeqθ=beq, где θ является вектором, содержащим каждый параметр Mdl.

Количество строк Aeq является количеством ограничений, и количество столбцов является количеством параметров, которые оценивает программное обеспечение. Закажите столбцы Aeq Mdl.A, Mdl.B, Mdl.C, Mdl.D, Mdl.Mean0, Mdl.Cov0 и коэффициентом регрессии (если модель имеет один).

Задайте Aeq и beq вместе, в противном случае estimate возвращает ошибку.

Aeq непосредственно соответствует входному параметру Aeq fmincon, не к матрице коэффициентов изменения состояния Mdl.A.

По умолчанию, если вы не задавали ограничения (линейное неравенство, линейное равенство или верхняя и нижняя граница), затем estimate максимизирует целевую функцию вероятности с помощью неограниченной максимизации.

Линейный преобразователь параметра ограничения неравенства для ограниченной максимизации целевой функции вероятности, заданной как пара, разделенная запятой, состоящая из 'Aineq' и матрицы.

Если вы задаете Aineq и bineq, то estimate максимизирует целевую функцию вероятности с помощью ограничения неравенства Aineqθbineq, где θ является вектором, содержащим каждый параметр Mdl.

Количество строк Aineq является количеством ограничений, и количество столбцов является количеством параметров, которые оценивает программное обеспечение. Закажите столбцы Aineq Mdl.A, Mdl.B, Mdl.C, Mdl.D, Mdl.Mean0, Mdl.Cov0 и коэффициентом регрессии (если модель имеет один).

Задайте Aineq и bineq вместе, в противном случае estimate возвращает ошибку.

Aineq непосредственно соответствует входному параметру A fmincon, не к матрице коэффициентов изменения состояния Mdl.A.

По умолчанию, если вы не задавали ограничения (линейное неравенство, линейное равенство или верхняя и нижняя граница), затем estimate максимизирует целевую функцию вероятности с помощью неограниченной максимизации.

Типы данных: double

Линейные ограничения равенства преобразованных параметров для ограниченной максимизации целевой функции вероятности, заданной как пара, разделенная запятой, состоящая из 'beq' и числового вектора.

Если вы задаете Aeq и beq, то estimate максимизирует целевую функцию вероятности с помощью ограничения равенства Aeqθ=beq, где θ является вектором, содержащим каждый параметр Mdl..

Задайте Aeq и beq вместе, в противном случае estimate возвращает ошибку.

beq непосредственно соответствует входному параметру beq fmincon и не сопоставлен ни с каким компонентом Mdl.

По умолчанию, если вы не задавали ограничения (линейное неравенство, линейное равенство или верхняя и нижняя граница), затем estimate максимизирует целевую функцию вероятности с помощью неограниченной максимизации.

Типы данных: double

Линейные верхние границы ограничения неравенства преобразованных параметров для ограниченной максимизации целевой функции вероятности, заданной как пара, разделенная запятой, состоящая из 'bineq' и числового вектора.

Если вы задаете Aineq и bineq, то estimate максимизирует целевую функцию вероятности с помощью ограничения неравенства Aineqθbineq, где θ является вектором, содержащим каждый параметр Mdl.

Задайте Aineq и bineq вместе, в противном случае estimate возвращает ошибку.

bineq непосредственно соответствует входному параметру b fmincon и не сопоставлен ни с каким компонентом Mdl.

По умолчанию, если вы не задавали ограничения (линейное неравенство, линейное равенство или верхняя и нижняя граница), затем estimate максимизирует целевую функцию вероятности с помощью неограниченной максимизации.

Типы данных: double

Нижние границы параметров для ограниченной максимизации целевой функции вероятности, заданной как пара, разделенная запятой, состоящая из 'lb' и числового вектора.

Если вы задаете lb и ub, то estimate максимизирует целевую функцию вероятности, подвергающуюсяlbθub, где θ является вектором, содержащим каждый параметр Mdl.

Закажите элементы lb Mdl.A, Mdl.B, Mdl.C, Mdl.D, Mdl.Mean0, Mdl.Cov0 и коэффициентом регрессии (если модель имеет один).

По умолчанию, если вы не задавали ограничения (линейное неравенство, линейное равенство или верхняя и нижняя граница), затем estimate максимизирует целевую функцию вероятности с помощью неограниченной максимизации.

Типы данных: double

Верхние границы параметров для ограниченной максимизации целевой функции вероятности, заданной как пара, разделенная запятой, состоящая из 'ub' и числового вектора.

Если вы задаете lb и ub, то estimate максимизирует целевую функцию вероятности, подвергающуюсяlbθub, где θ является вектором каждый параметр Mdl.

Закажите элементы ub Mdl.A, Mdl.B, Mdl.C, Mdl.D, Mdl.Mean0, Mdl.Cov0 и коэффициентом регрессии (если модель имеет один).

По умолчанию, если вы не задавали ограничения (линейное неравенство, линейное равенство или верхняя и нижняя граница), затем estimate максимизирует целевую функцию вероятности с помощью неограниченной максимизации.

Типы данных: double

Выходные аргументы

развернуть все

Рассеянная модель в пространстве состояний, содержащая оценки параметра, возвращенные как объект модели dssm.

estimate использует рассеянный Фильтр Калмана и наибольшее правдоподобие, чтобы вычислить все оценки параметра.

Независимо от того, как вы создали Mdl, хранилища EstMdl:

  • Оценки параметра содействующих матриц в свойствах A, B, C и D.

  • Средние значения начального состояния и ковариационная матрица в свойствах Mean0 и Cov0.

Примечание

EstMdl не хранит наблюдаемые ответы или данные о предикторе. Если вы планируете отфильтровать (использование filter), предсказать (использование forecast), или сглаженный (использование smooth) использование EstMdl, то необходимо снабдить соответствующими данными.

Оценки наибольшего правдоподобия параметров модели известны оптимизатору, возвращенному как числовой вектор. estParams имеет те же размерности как params0.

estimate располагает оценки в estParams, соответствующем неизвестным параметрам в этом порядке.

  1. EstMdl.A(:), то есть, оценивает в EstMdl.A, перечисленном по столбцам

  2. EstMdl.B(:)

  3. EstMdl.C(:)

  4. EstMdl.D(:)

  5. EstMdl.Mean0

  6. EstMdl.Cov0(:)

  7. В моделях с предикторами, оцененные коэффициенты регрессии, перечисленные по столбцам

Ковариационная матрица отклонения оценок наибольшего правдоподобия параметров модели, известных оптимизатору, возвращенному как числовая матрица.

Строки и столбцы содержат ковариации оценок параметра. Стандартные погрешности оценок параметра являются квадратным корнем из записей по основной диагонали.

estimate располагает оценки в строках и столбцах EstParamCov, соответствующего неизвестным параметрам в этом порядке.

  1. EstMdl.A(:), то есть, оценивает в EstMdl.A, перечисленном по столбцам

  2. EstMdl.B(:)

  3. EstMdl.C(:)

  4. EstMdl.D(:)

  5. EstMdl.Mean0

  6. EstMdl.Cov0(:)

  7. В моделях с предикторами, оцененные коэффициенты регрессии, перечисленные по столбцам

Оптимизированное loglikelihood значение, возвращенное как скаляр.

Недостающие наблюдения не способствуют loglikelihood. Наблюдения после первых периодов SwitchTime способствуют loglikelihood только.

Информация об оптимизации, возвращенная как массив структур.

Эта таблица описывает поля Output.

Поле Описание
ExitFlagВыходной флаг оптимизации, который описывает выходное условие. Для получения дополнительной информации смотрите fmincon и fminunc.
OptionsОпции оптимизации, что оптимизатор используется для числовой оценки. Для получения дополнительной информации смотрите optimoptions.

Типы данных: struct

Примеры

развернуть все

Сгенерируйте данные из известной модели, и затем соответствуйте рассеянной модели в пространстве состояний к данным.

Предположим, что скрытый процесс является этим AR (1) процесс

xt=0.5xt-1+ut,

где ut является Гауссовым со средним значением 0 и стандартным отклонением 1.

Сгенерируйте случайную последовательность 100 наблюдений от xt, предположение, что ряд запускается в 1,5.

T = 100;
ARMdl = arima('AR',0.5,'Constant',0,'Variance',1);
x0 = 1.5;
rng(1); % For reproducibility
x = simulate(ARMdl,T,'Y0',x0);

Предположим далее, что скрытый процесс подвергается аддитивной погрешности измерения, как обозначено в уравнении

yt=xt+εt,

где εt является Гауссовым со средним значением 0 и стандартным отклонением 0.1.

Используйте случайный скрытый процесс состояния (x) и уравнение наблюдения, чтобы сгенерировать наблюдения.

y = x + 0.1*randn(T,1);

Вместе, скрытые уравнения процесса и наблюдения составляют модель в пространстве состояний. Если коэффициенты и отклонения являются неизвестными параметрами, модель в пространстве состояний

xt=ϕxt-1+σ1utyt=xt+σ2εt.

Задайте матрицу Грина. Используйте значения NaN для неизвестных параметров.

A = NaN;

Задайте матрицу коэффициентов загрузки воздействия состояния.

B = NaN;

Задайте матрицу коэффициентов чувствительности измерения.

C = 1;

Задайте матрицу коэффициентов инноваций наблюдения

D = NaN;

Создайте модель в пространстве состояний с помощью содействующих матриц и укажите, что переменная состояния является рассеянной. Рассеянная спецификация состояния указывает на полное незнание на значениях состояний.

StateType = 2;
Mdl = dssm(A,B,C,D,'StateType',StateType);

Mdl является моделью dssm. Проверьте, что модель правильно задана путем просмотра ее отображения в Командном окне.

Передайте наблюдения estimate, чтобы оценить параметр. Установите начальное значение для параметра к params0. σ1 и σ2 должно быть положительным, таким образом, устанавливает ограничения нижней границы с помощью аргумента пары "имя-значение" 'lb'. Укажите что нижняя граница ϕ isinf.

params0 = [0.9; 0.5; 0.1];
EstMdl = estimate(Mdl,y,params0,'lb',[-Inf; 0; 0])
Method: Maximum likelihood (fmincon)
Effective Sample size:             99
Logarithmic  likelihood:     -138.968
Akaike   info criterion:      283.936
Bayesian info criterion:      291.752
      |     Coeff      Std Err   t Stat    Prob  
-------------------------------------------------
 c(1) | 0.56114       0.18045   3.10975  0.00187 
 c(2) | 0.75836       0.24569   3.08661  0.00202 
 c(3) | 0.57129       0.27455   2.08086  0.03745 
      |                                          
      |  Final State   Std Dev   t Stat    Prob  
 x(1) | 1.24096       0.46532   2.66690  0.00766 
EstMdl = 
State-space model type: dssm

State vector length: 1
Observation vector length: 1
State disturbance vector length: 1
Observation innovation vector length: 1
Sample size supported by model: Unlimited

State variables: x1, x2,...
State disturbances: u1, u2,...
Observation series: y1, y2,...
Observation innovations: e1, e2,...

State equation:
x1(t) = (0.56)x1(t-1) + (0.76)u1(t)

Observation equation:
y1(t) = x1(t) + (0.57)e1(t)

Initial state distribution:

Initial state means
 x1 
  0 

Initial state covariance matrix
     x1  
 x1  Inf 

State types
    x1   
 Diffuse 

EstMdl является моделью dssm. Результаты оценки появляются в Командном окне, содержат подходящие уравнения пространства состояний и содержат таблицу оценок параметра, их стандартных погрешностей, t статистика и p-значения.

Используйте запись через точку, чтобы использовать или отобразить подходящую матрицу Грина.

EstMdl.A
ans = 0.5611

Передайте EstMdl forecast, чтобы предсказать наблюдения, или simulate, чтобы провести исследование Монте-Карло.

Предположим, что линейное соотношение между уровнем безработицы и номинальным валовым национальным продуктом (nGNP) представляет интерес. Предположим далее, что уровень безработицы является серией AR (1). Символически, и в форме пространства состояний, модель

xt=ϕxt-1+σutyt-βZt=xt,

где:

  • xt уровень безработицы во время t.

  • yt наблюдаемое изменение в уровне безработицы, выкачиваемом возвратом nGNP (Zt).

  • ut серия Gaussian воздействий состояния, имеющих среднее значение 0 и неизвестное стандартное отклонение σ.

Загрузите набор данных Нельсона-Плоссера, который содержит уровень безработицы и nGNP ряд, среди прочего.

load Data_NelsonPlosser

Предварительно обработайте данные путем взятия натурального логарифма nGNP ряда и удаления стартовых значений NaN из каждого ряда.

isNaN = any(ismissing(DataTable),2);       % Flag periods containing NaNs
gnpn = DataTable.GNPN(~isNaN);
y = diff(DataTable.UR(~isNaN));
T = size(gnpn,1);                          % The sample size
Z = price2ret(gnpn);

Этот пример продолжает использовать ряд без значений NaN. Однако с помощью среды Фильтра Калмана, программное обеспечение может разместить ряд, содержащий отсутствующие значения.

Задайте содействующие матрицы.

A = NaN;
B = NaN;
C = 1;

Создайте модель в пространстве состояний с помощью dssm путем предоставления содействующих матриц и указывания, что значения состояния прибывают из рассеянного распределения. Рассеянная спецификация указывает на полное незнание о моментах начального распределения.

StateType = 2;
Mdl = dssm(A,B,C,'StateType',StateType);

Оцените параметры. Задайте компонент регрессии и его начальное значение для оптимизации с помощью аргументов пары "имя-значение" 'Predictors' и 'Beta0', соответственно. Отобразите оценки и всю информацию о диагностике оптимизации. Ограничьте оценку σ ко всем положительным, вещественным числам.

params0 = [0.3 0.2]; % Initial values chosen arbitrarily
Beta0 = 0.1;
EstMdl = estimate(Mdl,y,params0,'Predictors',Z,'Display','full',...
    'Beta0',Beta0,'lb',[-Inf 0 -Inf]);
____________________________________________________________
   Diagnostic Information

Number of variables: 3

Functions 
Objective:                            @(c)-fML(c,Mdl,Y,Predictors,unitFlag,sqrtFlag,mexFlag,mexTvFlag,tol,ind,switchTime,precaution)
Gradient:                             finite-differencing
Hessian:                              finite-differencing (or Quasi-Newton)

Constraints
Nonlinear constraints:                do not exist
 
Number of linear inequality constraints:    0
Number of linear equality constraints:      0
Number of lower bound constraints:          1
Number of upper bound constraints:          0

Algorithm selected
   interior-point


____________________________________________________________
   End diagnostic information
                                            First-order      Norm of
 Iter F-count            f(x)  Feasibility   optimality         step
    0       4    5.084683e+03    0.000e+00    5.096e+04
    1       8    6.405732e+02    0.000e+00    7.720e-02    1.457e+04
    2      12    6.405620e+02    0.000e+00    7.713e-02    1.058e-01
    3      16    6.405063e+02    0.000e+00    7.683e-02    5.285e-01
    4      20    6.402322e+02    0.000e+00    7.531e-02    2.632e+00
    5      24    6.389682e+02    0.000e+00    6.816e-02    1.289e+01
    6      28    6.346900e+02    0.000e+00    4.146e-02    5.821e+01
    7      32    6.314789e+02    0.000e+00    1.601e-02    8.771e+01
    8      36    6.307024e+02    0.000e+00    7.462e-03    5.266e+01
    9      40    6.304200e+02    0.000e+00    4.104e-03    4.351e+01
   10      44    6.303324e+02    0.000e+00    4.116e-03    3.167e+01
   11      48    6.303036e+02    0.000e+00    4.120e-03    2.418e+01
   12      52    6.302943e+02    0.000e+00    4.121e-03    1.814e+01
   13      56    6.302913e+02    0.000e+00    4.121e-03    1.379e+01
   14      60    6.302903e+02    0.000e+00    4.121e-03    1.065e+01
   15      64    6.302899e+02    0.000e+00    4.121e-03    8.811e+00
   16      68    6.302897e+02    0.000e+00    4.121e-03    9.052e+00
   17      72    6.302895e+02    0.000e+00    4.121e-03    1.076e+01
   18      77    6.302889e+02    0.000e+00    4.121e-03    2.589e+01
   19      85    6.302889e+02    0.000e+00    4.121e-03    1.244e-03
   20      93    6.302888e+02    0.000e+00    4.121e-03    6.220e-03
   21     101    6.302887e+02    0.000e+00    4.121e-03    3.110e-02
   22     109    6.302881e+02    0.000e+00    4.121e-03    1.555e-01
   23     116    6.302879e+02    0.000e+00    4.121e-03    1.294e+01
   24     120    6.302820e+02    0.000e+00    4.122e-03    4.676e+00
   25     124    6.302496e+02    0.000e+00    4.124e-03    1.093e+01
   26     128    6.300782e+02    0.000e+00    4.136e-03    4.482e+01
   27     132    6.291896e+02    0.000e+00    4.198e-03    2.133e+02
   28     136    6.244655e+02    0.000e+00    4.542e-03    1.082e+03
   29     140    5.893928e+02    0.000e+00    8.142e-03    5.854e+03
   30     145    5.481662e+02    0.000e+00    1.617e-02    3.664e+03

                                            First-order      Norm of
 Iter F-count            f(x)  Feasibility   optimality         step
   31     150    5.071740e+02    0.000e+00    4.817e-02    1.839e+03
   32     154    2.454929e+02    0.000e+00    5.541e+01    1.849e+03
   33     171    2.330170e+02    0.000e+00    1.125e+01    5.617e-01
   34     176    2.305627e+02    0.000e+00    4.574e+00    1.117e+00
   35     180    2.288295e+02    0.000e+00    1.305e+00    2.734e+00
   36     184    2.210450e+02    0.000e+00    5.899e+00    1.833e+01
   37     188    2.045922e+02    0.000e+00    6.097e+00    4.853e+01
   38     193    1.946343e+02    0.000e+00    2.147e+01    9.603e+01
   39     197    1.878028e+02    0.000e+00    6.277e+00    6.201e+01
   40     201    1.751451e+02    0.000e+00    7.821e+00    1.149e+01
   41     206    1.408147e+02    0.000e+00    1.168e+01    1.535e+01
   42     211    1.399614e+02    0.000e+00    6.341e+01    5.413e+00
   43     215    1.205383e+02    0.000e+00    2.578e+01    1.767e+01
   44     219    1.151918e+02    0.000e+00    1.133e+01    5.602e+00
   45     225    1.113918e+02    0.000e+00    3.905e+00    7.877e-01
   46     229    1.109467e+02    0.000e+00    7.133e+00    1.952e+00
   47     233    1.105528e+02    0.000e+00    3.320e+00    4.561e-01
   48     237    1.104892e+02    0.000e+00    7.305e-01    1.136e-01
   49     241    1.104773e+02    0.000e+00    8.279e-02    3.526e-01
   50     245    1.104771e+02    0.000e+00    9.159e-03    3.209e-02
   51     249    1.104771e+02    0.000e+00    1.327e-03    1.305e-03
   52     253    1.104771e+02    0.000e+00    6.547e-04    3.094e-04
   53     257    1.104771e+02    0.000e+00    1.311e-04    1.068e-05
   54     261    1.104771e+02    0.000e+00    1.311e-06    2.539e-06
   55     265    1.104771e+02    0.000e+00    1.889e-06    4.583e-07
   56     269    1.104771e+02    0.000e+00    3.815e-06    6.375e-07
   57     281    1.104771e+02    0.000e+00    4.768e-06    7.496e-08

Local minimum possible. Constraints satisfied.

fmincon stopped because the size of the current step is less than
the value of the step size tolerance and constraints are 
satisfied to within the value of the constraint tolerance.


Method: Maximum likelihood (fmincon)
Effective Sample size:             60
Logarithmic  likelihood:     -110.477
Akaike   info criterion:      226.954
Bayesian info criterion:      233.287
           |      Coeff       Std Err    t Stat    Prob 
--------------------------------------------------------
 c(1)      |   0.59436       0.09408     6.31738  0     
 c(2)      |   1.52554       0.10758    14.17991  0     
 y <- z(1) | -24.26161       1.55730   -15.57930  0     
           |                                            
           |    Final State   Std Dev     t Stat   Prob 
 x(1)      |   2.54764        0           Inf     0     

Информация об оптимизации и таблица оценок и статистики вывод к Командному окну. EstMdl является моделью ssm, и можно получить доступ к ее свойствам с помощью записи через точку.

Для рассеянных моделей в пространстве состояний программное обеспечение реализует рассеянный Фильтр Калмана, пока это не удовлетворяет условие регулярности. Чтобы удовлетворить условию, программное обеспечение требует достаточного количества преддемонстрационных данных. После того, как программное обеспечение удовлетворяет условие, оно переключается на использование стандартного Фильтра Калмана. По умолчанию программное обеспечение определяет, сколько преддемонстрационных данных оно требует и только использует столько, сколько ему нужно. Однако можно экспериментировать путем определения других значений для аргумента пары "имя-значение" SwitchTime.

В данном примере используйте те же данные и модель как в Оценке Рассеянная Модель в пространстве состояний, Содержащая Компонент Регрессии.

Загрузите набор данных Нельсона-Плоссера.

load Data_NelsonPlosser

isNaN = any(ismissing(DataTable),2);
gnpn = DataTable.GNPN(~isNaN);
y = DataTable.UR(~isNaN);
T = size(gnpn,1);                          
Z = log(gnpn);

Задайте содействующие матрицы.

A = NaN;
B = NaN;
C = 1;

Создайте модель в пространстве состояний с помощью dssm путем предоставления содействующих матриц и указывания, что значения состояния прибывают из рассеянного распределения. Рассеянная спецификация указывает на полное незнание о моментах начального распределения.

StateType = 2;
Mdl = dssm(A,B,C,'StateType',StateType);

Оценивайте параметры несколько раз. В течение каждого раза измените период, чтобы переключиться на стандартный Фильтр Калмана.

params0 = [0.3 0.2]; % Initial values chosen arbitrarily
Beta0 = 0.1;

[~,estParams1] = estimate(Mdl,y,params0,'Predictors',Z,'Display','off',...
    'Beta0',Beta0,'lb',[-Inf 0 -Inf],'SwitchTime',1);
[~,estParams5] = estimate(Mdl,y,params0,'Predictors',Z,'Display','off',...
    'Beta0',Beta0,'lb',[-Inf 0 -Inf],'SwitchTime',5);
[~,estParams10] = estimate(Mdl,y,params0,'Predictors',Z,'Display','off',...
    'Beta0',Beta0,'lb',[-Inf 0 -Inf],'SwitchTime',10);

Сравните оценки параметра.

estParams1
estParams1 = 1×3

    1.0101    1.3574  -24.4585

estParams5
estParams5 = 1×3

    1.0102    1.3832  -24.4852

estParams10
estParams10 = 1×3

    1.0094    1.2735  -26.4448

Поскольку estimate использует меньше точек данных для последующих оценок, оценки немного отличаются.

Ограничения

  • Если модель время, меняясь в зависимости от уважения наблюдаемые ответы, то программное обеспечение не поддерживает включая предикторы. Если векторы наблюдения среди различных периодов отличаются по длине, то программное обеспечение не может определить который коэффициенты использовать, чтобы выкачать наблюдаемые ответы.

  • Если рассеянная модель в пространстве состояний имеет проблемы идентифицируемости (т.е. по крайней мере два набора отличных значений параметров приводят к тому же значению вероятности для всех наблюдений), то estimate не может правильно инициализировать рассеянные состояния, и результаты не предсказуемы.

Советы

Ограниченная максимизация целевой функции вероятности

  • Можно задать любую комбинацию линейного неравенства, линейного равенства и ограничений верхней и нижней границы на параметры.

  • Хорошая практика должна избежать равенства и ограничений неравенства во время оптимизации. Например, чтобы ограничить параметр w быть положительным, неявно задайте модель в пространстве состояний с помощью функции отображения параметра к матрице. В функции, набор w = exp (s) в функции. Затем используйте неограниченную оптимизацию, чтобы оценить s. Следовательно, s может принять любое действительное значение, но w должен быть положительным.

Предикторы и соответствующие коэффициенты

  • Чтобы включать полное среднее значение в модель наблюдения, включайте столбец 1 s в Zt.

  • Чтобы составлять эффекты предиктора, когда вы моделируете, необходимо выкачать наблюдения вручную. Чтобы выкачать наблюдения, использовать Wt=YtZtβ^.

  • Если модель регрессии является комплексной, то рассмотрите неявно определение модели в пространстве состояний. Например, задайте параметр к матрице, сопоставляющий функцию с помощью следующего шаблона синтаксиса.

    function [A,B,C,D,Mean0,Cov0,StateType,DeflateY] = ParamMap(params,Y,Z)
    		...
    		DeflateY = Y - exp(params(9) + params(10)*Z);
    		...
    end
    В этом примере Y является матрицей наблюдений, и Z является матрицей предикторов. Функция возвращает DeflateY, который является матрицей выкачанных наблюдений. Задайте Y и Z в рабочем пространстве MATLAB прежде, и затем передайте ParamMap ssm с помощью следующего шаблона синтаксиса.

    Mdl = ssm(@(params)ParamMap(params,Y,Z))

    Это также полезно, если каждый ряд ответа требует отличного набора предикторов.

  • Если уравнение состояния требует предикторов, то включайте предикторы как дополнительные переменные состояния. Поскольку данные о предикторе меняются в зависимости от времени, модели в пространстве состояний с предикторами, когда состояния время, отличаясь.

Рассеянные модели в пространстве состояний

  • Вы не можете использовать метод квадратного корня, чтобы отфильтровать и сглаживать рассеянные модели в пространстве состояний. Как обходное решение, можно преобразовать рассеянную модель в пространстве состояний в стандартную модель в пространстве состояний с помощью ssm, и затем можно отфильтровать использование метода квадратного корня. На преобразование все рассеянные состояния имеют конечное, хотя большой, начальное отклонение распределения 1e7.

  • Лучшая практика состоит в том, чтобы позволить estimate определить значение SwitchTime. Однако в редких случаях, вы можете испытать числовые проблемы во время оценки, фильтрации или сглаживания рассеянных моделей в пространстве состояний. Для таких случаев попытайтесь экспериментировать с различными спецификациями SwitchTime или рассмотрите различную образцовую структуру. Другими словами, упростите модель или проверьте, что модель идентифицируется. Например, преобразуйте рассеянную модель в пространстве состояний в стандартную модель в пространстве состояний с помощью ssm.

Дополнительные советы

  • Программное обеспечение хранит недостающие данные. Укажите на недостающие данные с помощью значений NaN в наблюдаемых ответах (Y).

  • Хорошая практика должна проверять состояние сходимости стандартной программы оптимизации путем отображения Output.ExitFlag.

  • Если алгоритм оптимизации не сходится, то можно увеличить число итераций с помощью аргумента пары "имя-значение" 'Options'.

  • Если алгоритм оптимизации не сходится, то рассматривает использование refine, который может помочь вам получить лучшие начальные значения параметров для оптимизации.

Алгоритмы

  • Фильтр Калмана хранит недостающие данные, не обновляя отфильтрованное оценочное соответствие состояния недостающим наблюдениям. Другими словами, предположите, что существует недостающее наблюдение в период t. Затем прогноз состояния для периода t на основе предыдущего t – 1 наблюдение и отфильтрованное состояние в течение периода t эквивалентен.

  • Рассеянный Фильтр Калмана требует преддемонстрационных данных. Если недостающие наблюдения начинают временные ряды, то рассеянный Фильтр Калмана должен собрать достаточно ненедостающих наблюдений, чтобы инициализировать рассеянные состояния.

  • Для явным образом созданных моделей в пространстве состояний estimate применяет все предикторы к каждому ряду ответа. Однако каждый ряд ответа имеет свой собственный набор коэффициентов регрессии.

  • Если вы не задаете ограничения оптимизации, то estimate использует fminunc для неограниченной числовой оценки. Если вы задаете какую-либо пару ограничений оптимизации, то estimate использует fmincon для ограниченной числовой оценки. Для любого типа оптимизации опции оптимизации вы устанавливаете использование аргумента пары "имя-значение" Options, должно быть сопоставимо с опциями алгоритма оптимизации.

  • estimate передает аргументы пары "имя-значение" Options, Aineq, bineq, Aeq, beq, lb и ub непосредственно к оптимизатору fmincon или fminunc.

  • estimate соответствует коэффициентам регрессии наряду со всеми другими параметрами модели в пространстве состояний. Программное обеспечение достаточно гибко, чтобы позволить применять ограничения к коэффициентам регрессии с помощью ограниченных опций оптимизации. Для получения дополнительной информации смотрите аргументы пары Name,Value и fmincon.

  • Если вы устанавливаете 'Univariate',true затем, во время алгоритма фильтрации, программное обеспечение последовательно обновляет скорее затем обновление целиком. Эта практика может ускорить оценку параметра, специально для низко-размерной, независимой от времени модели.

  • Предположим, что вы хотите создать модель в пространстве состояний с помощью функции отображения параметра к матрице с этой подписью

    [A,B,C,D,Mean0,Cov0,StateType,DeflateY] = paramMap(params,Y,Z)
    и вы задаете модель с помощью анонимной функции
    Mdl = dssm(@(params)paramMap(params,Y,Z))
    Наблюдаемые ответы Y и данные о предикторе Z не являются входными параметрами в анонимной функции. Если Y и Z существуют в рабочем пространстве MATLAB прежде, чем создать Mdl, то программное обеспечение устанавливает ссылку на них. В противном случае, если вы передаете Mdl estimate, программное обеспечение выдает ошибку.

    Ссылка на данные, установленные анонимной функцией, заменяет все другие соответствующие значения входного параметра estimate. Это различие важно особенно при проведении прокручивающегося анализа окна. Для получения дополнительной информации смотрите Анализ Окна Прокрутки Моделей Timeseries.

  • Для рассеянных моделей в пространстве состояний estimate обычно переключается от рассеянного Фильтра Калмана до стандартного Фильтра Калмана, когда количество совокупных наблюдений и количество рассеянных состояний равны.

Ссылки

[1] Дербин Дж. и С. Дж. Купмен. Анализ Временных рядов Методами Пространства состояний. 2-й редактор Оксфорд: Издательство Оксфордского университета, 2012.

Введенный в R2015b