Оцените прогнозирующую производительность

Если вы планируете использовать подобранную модель в прогнозировании, хорошая практика должна оценить прогнозирующую способность модели. Модели, которые соответствуют хорошо в выборке, как гарантируют, не предскажут хорошо. Например, сверхподбор кривой может привести к хорошей подгонке в выборке, но плохой прогнозирующей производительности.

При проверке прогнозирующей производительности важно не использовать данные дважды. Таким образом, данные, которые вы используете, чтобы подбирать вашу модель, должны отличаться, чем данные, которые вы используете, чтобы оценить прогнозы. Можно использовать перекрестную проверку, чтобы оценить из выборки предсказывающую способность:

  1. Разделите свои временные ряды на две части: набор обучающих данных и валидация установлены.

  2. Подберите модель к своим обучающим данным.

  3. Предскажите подобранную модель за период валидации.

  4. Сравните прогнозы с наблюдениями валидации затяжки с помощью графиков и числовых сводных данных (таких как прогнозирующая среднеквадратичная погрешность).

Среднеквадратичная погрешность предсказания (PMSE) измеряет несоответствие между прогнозами модели и наблюдаемыми данными. Предположим, что у вас есть временные ряды длины N, и вы откладываете точки валидации M, обозначенные y1v,y2v,,yMv.. После того, чтобы подбирать вашу модель к первому N – точки данных M (набор обучающих данных), сгенерируйте прогнозы y^1v,y^2v,,y^Mv.

Модель PMSE вычисляется как

PMSE=1Mi=1M(yivy^iv)2.

Можно вычислить PMSE для различного выбора M проверить робастность результатов.

Связанные примеры

Больше о

Для просмотра документации необходимо авторизоваться на сайте