Преобразования данных

Зачем преобразовывать?

Можно преобразовать временные ряды в:

  • Выделите интересующие вас временные компоненты.

  • Удалите эффект неприятных компонентов (таких как сезонность).

  • Сделайте серию стационарной.

  • Уменьшите паразитные эффекты регрессии.

  • Стабилизируйте изменчивость, которая растет с уровнем ряда.

  • Сделать два или более временных рядов более непосредственно сопоставимыми.

Можно выбрать среди многих преобразований данных для решения этих (и других) задач.

Для примера можно использовать методы разложения, чтобы описать и оценить компоненты временных рядов. Сезонная корректировка - это метод разложения, который можно использовать для удаления неприятного сезонного компонента.

Удаление тренда и дифференцирование - это преобразования, которые можно использовать для решения нестационарности из-за трендового среднего. Дифференцирование может также помочь удалить ложные регрессионые эффекты из-за коинтеграции.

В целом, если вы применяете преобразование данных перед моделированием данных, вам нужно обратно преобразовать прогнозы модели, чтобы вернуться к исходной шкале. Это не обязательно в Econometrics Toolbox™ если вы моделируете дифференцированные стационарные данные. Использование arima для модели интегрированных рядов, которые не являются априори дифференцированными. Ключевым преимуществом этого является то, что arima также автоматически возвращает прогнозы по исходной шкале.

Общие преобразования данных

Удаление тренда

Некоторые нестационарные ряды могут быть смоделированы как сумма детерминированного тренда и стационарного стохастического процесса. То есть можно записать серию yt как

yt=μt+εt,

где εt является стационарным стохастическим процессом со средним нулем.

Детерминированный тренд, μt, может иметь несколько компонентов, таких как несезонные и сезонные компоненты. Можно уменьшить (или разложить) данные, чтобы идентифицировать и оценить его различные компоненты. Процесс удаления тренда протекает следующим образом:

  1. Оцените детерминированный компонент тренда.

  2. Удалите тренд из исходных данных.

  3. (Необязательно) Моделируйте оставшийся остаточный ряд с соответствующим стационарным стохастическим процессом.

Для оценки компонента тренда доступно несколько методов. Можно оценить его параметрически с помощью методом наименьших квадратов, непараметрически с помощью фильтров (скользящие средние значения) или комбинации обоих.

Удаление тренда даёт оценки всех трендовых и стохастических компонентов, что может быть желательно. Однако оценка компонентов тренда может потребовать принятия дополнительных допущений, выполнения дополнительных шагов и оценки дополнительных параметров.

Дифференцирование

Дифференцирование является альтернативным преобразованием для удаления среднего тренда из нестационарного ряда. Этот подход пропагандируется в подходе Box-Jenkins к спецификации модели [1]. Согласно этой методологии, первый шаг к созданию моделей - дифференцирование ваших данных до тех пор, пока они не выглядят стационарными. Дифференцирование подходит для удаления стохастических трендов (например, случайных прогулок).

Определите первое различие как

Δyt=ytyt1,

где И называется оператором дифференцирования. В обозначении оператора задержки, где Liyt=yti,

Δyt=(1L)yt.

Можно создать полиномиальные объекты оператора задержки с помощью LagOp.

Точно так же задайте второе различие как

Δ2yt=(1L)2yt=(ytyt1)(yt1yt2)=yt2yt1+yt2.

Как и взятие производных, взятие первого различия делает линейный тренд постоянным, взятие второго различия делает квадратичный тренд постоянным, и так далее для полиномов более высокой степени. Многие сложные стохастические тренды также могут быть устранены путем взятия различий относительно низкого порядка. Взятие D различий делает процесс с D единичными корнями стационарным.

Для серий с сезонной периодичностью сезонное дифференцирование может касаться сезонных единичных корней. Для данных с s периодичности (например, квартальные данные имеют s = 4, а ежемесячные данные имеют s = 12) сезонный оператор дифференцирования определяется как

Δsyt=(1Ls)yt=ytyts.

Использование преобразования дифференцирования устраняет промежуточные шаги оценки, необходимые для удаления тренда. Однако это означает, что вы не можете получить отдельные оценки тренда и стохастических компонентов.

Логарифмические преобразования

Для ряда с экспоненциальным ростом и отклонением, который растет с уровнем ряда, журнала преобразование может помочь линеаризировать и стабилизировать ряд. Если у вас есть отрицательные значения во временных рядах, вы должны добавить константу, достаточно большую, чтобы все наблюдения были больше нуля, прежде чем принимать преобразование журнала.

В некоторых областях применения работа с дифференцированными, записанными сериями является нормой. Для примера, первые различия записанного в журнал временных рядов,

Δlogyt=logytlogyt1,

это примерно скорости изменения ряда.

Цены, возвраты и компаундирование

Скорости изменения ценового ряда называются возвратами. В то время как ценовые ряды обычно не колеблются вокруг постоянного уровня, серия возвратов часто выглядит стационарной. Таким образом, ряды возвратов обычно используются вместо ценовых рядов во многих приложениях.

Обозначьте последовательные ценовые наблюдения, делаемые время от времени t и t + 1 как <reservedrangesplaceholder3> <reservedrangesplaceholder2> и <reservedrangesplaceholder1> <reservedrangesplaceholder0> +1 , соответственно. Непрерывно компаундируемая серия возвратов является трансформированной серией

rt=logyt+1yt=logyt+1logyt.

Это первое различие ценового ряда журнала, которое иногда называют возвратом журнала.

Альтернативное преобразование для ценовых рядов - простые возвраты,

rt=yt+1ytyt=yt+1yt1.

Для ряда с относительно высокой частотой (например, ежедневные или еженедельные наблюдения) различие между двумя преобразованиями небольшая. Econometrics Toolbox имеет price2ret для преобразования ценовых рядов в ряды возвратов (с непрерывным или простым компаундированием) и ret2price для обратной операции.

Ссылки

[1] Box, G. E. P., G. M. Jenkins, and G. C. Reinsel. Анализ временных рядов: прогнозирование и управление. 3-й эд. Englewood Cliffs, Нью-Джерси: Prentice Hall, 1994.

См. также

| |

Похожие примеры

Подробнее о