Преобразования данных

Почему преобразовывают?

Можно преобразовать временные ряды к:

  • Изолируйте временные компоненты интереса.

  • Удалите эффект компонентов неприятности (как сезонность).

  • Сделайте ряд стационарным.

  • Уменьшайте побочные эффекты регрессии.

  • Стабилизируйте изменчивость, которая растет с уровнем ряда.

  • Сделайте два или больше временных рядов более непосредственно сопоставимыми.

Можно выбрать среди многих преобразование данных, чтобы обратиться к ним (и другой) цели.

Например, можно использовать методы разложения, чтобы описать и оценить компоненты временных рядов. Сезонная корректировка является методом разложения, который можно использовать, чтобы удалить неприятность сезонный компонент.

Удаление тренда и дифференцирование является преобразованиями, которые можно использовать, чтобы обратиться к нестационарности из-за отклоняющегося среднего значения. Дифференцирование может также помочь удалить побочные эффекты регрессии из-за коинтеграции.

В общем случае, если вы применяете преобразование данных прежде, чем смоделировать ваши данные, вам затем нужно к прогнозам модели заднего преобразования возвратиться к исходной шкале. Это не необходимо в Econometrics Toolbox™, если вы моделируете стационарные различием данные. Используйте arima к интегрированным рядам модели, которые не являются априорным differenced. Главным преимуществом этого является тот arima также возвращает прогнозы по исходной шкале автоматически.

Преобразования общих данных

Удаление тренда

Некоторый неустановившийся ряд может быть смоделирован как сумма детерминированного тренда и стационарного стохастического процесса. Таким образом, можно записать серию yt как

yt=μt+εt,

где εt стационарный стохастический процесс со средним нулем.

Детерминированный тренд, μt, может иметь несколько компонентов, таких как несезонные и сезонные компоненты. Можно детрендировать (или разложиться), данные, чтобы идентифицировать и оценить его различные компоненты. Процесс удаления тренда продолжает можно следующим образом:

  1. Оцените детерминированный компонент тренда.

  2. Удалите тренд из исходных данных.

  3. (Необязательно) Смоделируйте остающийся остаточный ряд с соответствующим стационарным стохастическим процессом.

Несколько методов доступны для оценки компонента тренда. Можно оценить его параметрически использование наименьших квадратов, непараметрическим образом с помощью фильтров (скользящие средние значения) или комбинация обоих.

Удаление тренда оценок выражений всего тренда и стохастических компонентов, которые могут быть желательными. Однако оценка компонентов тренда может потребовать делающих дополнительных предположений, выполнив дополнительные шаги, и оценив дополнительные параметры.

Дифференцирование

Дифференцирование является альтернативным преобразованием для удаления среднего тренда от неустановившегося ряда. Этот подход защищен в подходе Поля-Jenkins к спецификации [1] модели. Согласно этой методологии, первый шаг, чтобы создать модели является дифференцированием ваши данные, пока это не выглядит стационарным. Дифференцирование подходит для удаления стохастических трендов (e.g., случайные обходы).

Задайте первое различие как

Δyt=ytyt1,

где Δ называется оператором дифференцирования. В обозначении оператора задержки, где Liyt=yti,

Δyt=(1L)yt.

Можно создать объекты полинома оператора задержки с помощью LagOp.

Точно так же задайте второе различие как

Δ2yt=(1L)2yt=(ytyt1)(yt1yt2)=yt2yt1+yt2.

Как взятие производных, взятие первого различия делает линейный тренд постоянным, брать второе различие делает квадратичный тренд постоянным, и так далее для полиномов более высокой степени. Много комплексных стохастических трендов могут также быть устранены путем взятия различий относительно младшего разряда. Взятие различий D делает процесс с модульными корнями D стационарным.

Для ряда с сезонной периодичностью сезонное дифференцирование может обратиться к сезонным модульным корням. Для данных с периодичностью s (например, ежеквартальные данные имеют s = 4 и ежемесячные данные, имеет s = 12), сезонный оператор дифференцирования задан как

Δsyt=(1Ls)yt=ytyts.

Используя дифференцирование преобразование устраняет промежуточные шаги оценки, требуемые для удаления тренда. Однако это означает, что вы не можете получить отдельные оценки тренда и стохастических компонентов.

Регистрируйте преобразования

Для ряда с экспоненциальным ростом и отклонением, которое растет с уровнем ряда, логарифмическое преобразование может помочь линеаризовать и стабилизировать ряд. Если у вас есть отрицательные величины в ваших временных рядах, необходимо добавить константу, достаточно большую, чтобы сделать все наблюдения больше, чем нуль прежде, чем взять логарифмическое преобразование.

В некоторых областях применения, работающих с differenced, регистрируемый ряд является нормой. Например, первые различия регистрируемых временных рядов,

Δlogyt=logytlogyt1,

приблизительно скорости изменения ряда.

Цены, возвращается, и соединение

Скорости изменения ценового ряда называются, возвращается. Принимая во внимание, что ценовые ряды обычно не колеблются вокруг постоянного уровня, ряд возвратов часто выглядит стационарным. Таким образом, возвращается, ряды обычно используются вместо ценового ряда во многих приложениях.

Обозначьте последовательные ценовые наблюдения, сделанные во времена t и t + 1 как y t и y t +1, соответственно. Постоянно составляемый возвращается, ряд является преобразованным рядом

rt=logyt+1yt=logyt+1logyt.

Это - первое различие ряда цены журнала и иногда называется, журнал возвращаются.

Альтернативное преобразование для ценового ряда является простыми возвратами,

rt=yt+1ytyt=yt+1yt1.

Для ряда с относительно высокой частотой (e.g., ежедневные или еженедельные наблюдения), различие между этими двумя преобразованиями мало. Econometrics Toolbox имеет price2ret для преобразования ценового ряда к ряду возвратов (или с непрерывным или с простым соединением), и ret2price для обратной операции.

Ссылки

[1] Поле, G. E. P. Г. М. Дженкинс и Г. К. Рейнсель. Анализ Временных Рядов: Прогнозирование и Управление. 3-й редактор Englewood Cliffs, NJ: Prentice Hall, 1994.

Смотрите также

| |

Связанные примеры

Больше о