ARIMA, что означает авторегрессионное интегрированное скользящее среднее, является широко используемым статистическим методом для анализа и прогнозирования данных временных рядов. Это расширение модели ARMA, включающее в себя идею дифференцирования, чтобы сделать временные ряды стационарными.
Структура модели ARIMA:
Модели ARIMA обычно обозначаются как ARIMA(p, d, q), где:
- p: Порядок авторегрессионной части (AR)
- d: порядок различий
- q: порядок части скользящей средней (MA).
Математическое представление модели ARIMA(p, d, q) можно рассматривать как комбинацию компонентов AR, I (для интегрированного или разностного) и MA.
Компоненты АРИМА:
- Часть авторегрессии (AR): эта часть включает использование взаимосвязи между наблюдением и рядом запаздывающих наблюдений (предыдущие временные шаги).
- Интегрированная (I) часть: это относится к разнице исходного временного ряда, чтобы сделать его стационарным. Дифференциация означает вычитание предыдущего наблюдения из текущего наблюдения. Порядок d указывает, сколько раз производилась разность рядов для достижения стационарности.
- Часть скользящего среднего (MA): включает моделирование взаимосвязи между наблюдением и остаточными ошибками от запаздывающих наблюдений с использованием модели скользящего среднего.
Как работает АРИМА:
- Стационарность. Первым шагом в моделировании ARIMA является обеспечение стационарности временного ряда. Если нет, разность применяется столько раз, сколько необходимо для достижения стационарности.
- Идентификация модели: выбор соответствующих значений для p, d и q. Это можно сделать с помощью статистических графиков, таких как функция автокорреляции (ACF) и функция частичной автокорреляции (PACF), а также такие критерии, как AIC (информационный критерий Акаике) и BIC (байесовский информационный критерий).
- Оценка: оценка параметров частей модели AR и MA с использованием таких методов, как оценка максимального правдоподобия.
- Прогнозирование: после того, как модель подобрана, ее можно использовать для получения прогнозов на будущие периоды.
Сезонный АРИМ:
Когда данные временных рядов имеют четкие сезонные закономерности, можно использовать модель Seasonal ARIMA или SARIMA. Модели SARIMA включают сезонные условия и обозначаются как SARIMA(p,d,q)(P,D,Q)s, где P,D и Q — это сезонные порядки частей AR, I и MA соответственно, а s — количество периодов в каждом сезоне (например, 12 для месячных данных с годовым циклом).
Приложения:
Модели ARIMA используются в различных областях, включая финансы, экономику, науку об окружающей среде и т. д., для решения таких задач, как:
- Прогнозирование будущих значений (например, цен на акции, продаж)
- Понимание основной динамики временного ряда
- Анализ влияния вмешательств или событий на временной ряд
Заключение:
Модели ARIMA предлагают гибкий подход к моделированию данных временных рядов, способный охватить широкий спектр шаблонов и структур. Включая компоненты авторегрессии, разности и скользящего среднего, модели ARIMA могут предоставлять надежные прогнозы и аналитические данные как для несезонных, так и для сезонных данных временных рядов. Тщательный выбор модели и ее проверка имеют решающее значение для получения надежных результатов.
Хорошая статья Сувика Маджумдера: https://medium.com/analytics-vidhya/time-series-modelling-arima-82453bac7de