ARIMA, что означает авторегрессионное интегрированное скользящее среднее, является широко используемым статистическим методом для анализа и прогнозирования данных временных рядов. Это расширение модели ARMA, включающее в себя идею дифференцирования, чтобы сделать временные ряды стационарными.

Структура модели ARIMA:

Модели ARIMA обычно обозначаются как ARIMA(p, d, q), где:

  • p: Порядок авторегрессионной части (AR)
  • d: порядок различий
  • q: порядок части скользящей средней (MA).

Математическое представление модели ARIMA(p, d, q) можно рассматривать как комбинацию компонентов AR, I (для интегрированного или разностного) и MA.

Компоненты АРИМА:

  1. Часть авторегрессии (AR): эта часть включает использование взаимосвязи между наблюдением и рядом запаздывающих наблюдений (предыдущие временные шаги).
  2. Интегрированная (I) часть: это относится к разнице исходного временного ряда, чтобы сделать его стационарным. Дифференциация означает вычитание предыдущего наблюдения из текущего наблюдения. Порядок d указывает, сколько раз производилась разность рядов для достижения стационарности.
  3. Часть скользящего среднего (MA): включает моделирование взаимосвязи между наблюдением и остаточными ошибками от запаздывающих наблюдений с использованием модели скользящего среднего.

Как работает АРИМА:

  • Стационарность. Первым шагом в моделировании ARIMA является обеспечение стационарности временного ряда. Если нет, разность применяется столько раз, сколько необходимо для достижения стационарности.
  • Идентификация модели: выбор соответствующих значений для p, d и q. Это можно сделать с помощью статистических графиков, таких как функция автокорреляции (ACF) и функция частичной автокорреляции (PACF), а также такие критерии, как AIC (информационный критерий Акаике) и BIC (байесовский информационный критерий).
  • Оценка: оценка параметров частей модели AR и MA с использованием таких методов, как оценка максимального правдоподобия.
  • Прогнозирование: после того, как модель подобрана, ее можно использовать для получения прогнозов на будущие периоды.

Сезонный АРИМ:

Когда данные временных рядов имеют четкие сезонные закономерности, можно использовать модель Seasonal ARIMA или SARIMA. Модели SARIMA включают сезонные условия и обозначаются как SARIMA(p,d,q)(P,D,Q)s, где P,D и Q — это сезонные порядки частей AR, I и MA соответственно, а s — количество периодов в каждом сезоне (например, 12 для месячных данных с годовым циклом).

Приложения:

Модели ARIMA используются в различных областях, включая финансы, экономику, науку об окружающей среде и т. д., для решения таких задач, как:

  • Прогнозирование будущих значений (например, цен на акции, продаж)
  • Понимание основной динамики временного ряда
  • Анализ влияния вмешательств или событий на временной ряд

Заключение:

Модели ARIMA предлагают гибкий подход к моделированию данных временных рядов, способный охватить широкий спектр шаблонов и структур. Включая компоненты авторегрессии, разности и скользящего среднего, модели ARIMA могут предоставлять надежные прогнозы и аналитические данные как для несезонных, так и для сезонных данных временных рядов. Тщательный выбор модели и ее проверка имеют решающее значение для получения надежных результатов.

Хорошая статья Сувика Маджумдера: https://medium.com/analytics-vidhya/time-series-modelling-arima-82453bac7de