exponenta event banner

Преобразования данных

Зачем трансформироваться?

Временные ряды можно преобразовать в:

  • Выделить интересующие временные компоненты.

  • Устраните влияние компонентов неприятностей (например, сезонность).

  • Сделайте серию стационарной.

  • Уменьшение ложных эффектов регрессии.

  • Стабилизируйте изменчивость, которая растет с уровнем серии.

  • Сделайте два или более временных ряда более сопоставимыми.

Для решения этих (и других) задач можно выбрать одно из многих преобразований данных.

Например, можно использовать методы разложения для описания и оценки компонентов временных рядов. Сезонная корректировка - это метод разложения, который можно использовать для удаления неприятного сезонного компонента.

Сдерживание и дифференциация - это преобразования, которые можно использовать для устранения нестационарности из-за трендового среднего. Дифференцирование также может помочь удалить ложные эффекты регрессии из-за коинтеграции.

Как правило, если перед моделированием данных применяется преобразование данных, для возврата к исходному масштабу необходимо выполнить обратное преобразование прогнозов модели. Это необязательно в Econometrics Toolbox™ при моделировании стационарных разностных данных. Использовать arima для моделирования интегрированных рядов, которые априори не различаются. Ключевым преимуществом этого является то, что arima также автоматически возвращает прогнозы по исходной шкале.

Преобразование общих данных

Detrending

Некоторые нестационарные ряды можно смоделировать как сумму детерминированного тренда и стационарного стохастического процесса. То есть можно написать серию yt как

yt = мкт + αт,

где αt - стационарный стохастический процесс со средним нулем.

Детерминированный тренд, мкт, может иметь несколько компонентов, таких как несезонные и сезонные компоненты. Можно уменьшить (или разложить) данные, чтобы идентифицировать и оценить их различные компоненты. Процесс сдерживания протекает следующим образом:

  1. Оцените детерминированный трендовый компонент.

  2. Удалите тренд из исходных данных.

  3. (Необязательно) Смоделировать оставшиеся остаточные серии с помощью соответствующего стационарного стохастического процесса.

Для оценки компонента тренда имеется несколько методов. Его можно оценить параметрически с помощью наименьших квадратов, непараметрически с помощью фильтров (скользящих средних) или комбинации обоих.

Сдерживание дает оценки всех трендовых и стохастических компонентов, которые могут быть желательными. Однако для оценки компонентов тренда могут потребоваться дополнительные допущения, выполнение дополнительных шагов и оценка дополнительных параметров.

Differencing

Дифференциация является альтернативной трансформацией для удаления среднего тренда из нестационарного ряда. Этот подход пропагандируется в подходе Бокса-Дженкинса к спецификации модели [1]. Согласно этой методике, первым шагом для построения моделей является дифференциация данных до тех пор, пока они не будут выглядеть стационарными. Дифференцирование подходит для удаления стохастических тенденций (например, случайных прогулок).

Определите первое различие как

Δyt = yt yt − 1,

где Δ называется дифференциальным оператором. В нотации оператора запаздывания, где Liyt = yt − i,

Δyt = (1 L) yt.

Можно создать полиномиальные объекты оператора запаздывания с помощью LagOp.

Аналогично, определите второе различие как

Δ2yt = (1 L) 2yt = (yt yt 1) (yt 1 yt − 2) = yt − 2yt − 1 + yt − 2.

Как и использование производных, использование первой разности делает линейную постоянную тренда, использование второй разности делает квадратичную постоянную тренда и так далее для многочленов более высокой степени. Многие сложные стохастические тенденции также могут быть устранены путем принятия относительно низких различий. Использование различий D делает процесс с корнями D единицы стационарным.

Для серий с сезонной периодичностью сезонная дифференциация может учитывать корни сезонных единиц. Для данных с периодичностью s (например, квартальные данные имеют s = 4, а ежемесячные данные имеют s = 12) оператор сезонных разниц определяется как

Δsyt = (1 Ls) yt = yt − yt − s.

Использование дифференциального преобразования исключает промежуточные этапы оценки, необходимые для сдерживания. Однако это означает, что невозможно получить отдельные оценки тренда и стохастических компонентов.

Преобразования журнала

Для ряда с экспоненциальным ростом и дисперсией, который растет с уровнем ряда, логарифмическое преобразование может помочь линеаризовать и стабилизировать ряд. При наличии отрицательных значений во временном ряду следует добавить константу, достаточно большую для того, чтобы все наблюдения были больше нуля, прежде чем выполнять преобразование журнала.

В некоторых областях применения работа с разностными записанными сериями является нормой. Например, первые различия зарегистрированного временного ряда,

Δlogyt = logyt − logyt − 1,

представляют собой приблизительно скорость изменения ряда.

Цены, возвраты и компаундирование

Скорости изменения ценового ряда называются доходностью. В то время как ряды цен обычно не колеблются вокруг постоянного уровня, ряды возвратов часто выглядят неподвижными. Таким образом, ряды возвратов обычно используются вместо рядов цен во многих приложениях.

Обозначают последовательные наблюдения цен, сделанные в моменты времени t и t + 1 как yt и yt + 1 соответственно. Непрерывно скомпонованный ряд возвратов представляет собой преобразованный ряд

rt = logyt + 1yt = logyt + 1 − logyt.

Это первая разница в ценовой серии журнала и иногда называется возвратом журнала.

Альтернативным преобразованием для рядов цен является простая доходность.

rt = yt + 1 ytyt = yt + 1yt − 1.

Для рядов с относительно высокой частотой (например, ежедневных или еженедельных наблюдений) разница между этими двумя преобразованиями невелика. Инструментарий эконометрики имеет price2ret для преобразования рядов цен в ряды возвратов (с непрерывным или простым суммированием), и ret2price для обратной операции.

Ссылки

[1] Бокс, Г. Э. П., Г. М. Дженкинс и Г. К. Рейнсель. Анализ временных рядов: прогнозирование и контроль. 3-й ред. Энглвуд Клиффс, Нью-Джерси: Прентис Холл, 1994.

См. также

| |

Связанные примеры

Подробнее