Вы правы, вы можете поспорить на 98,4%, что есть сезонность для t = 4 * k, и ее значение равно +2 1108156. Если сезонность предполагается мультипликативной, а не аддитивной, можно получить на 98,5%, что сезонность есть и ее значение равно +18,7%.
Вот как я поступаю, не используя готовый пакет, чтобы вы могли задавать любые подобные вопросы.
Сначала введите новую логическую переменную dt$season = (dt$time %% 4)==0
, которая истинна (т.е. =1) для t=0,4,8,... и ложна (т.е. =0) в других местах. Тогда функция x~a*season+b
равна a+b
для t=0,4,8,... и b
в другом месте. Другими словами, a
— это разница между сезонным эффектом и несезонным эффектом.
Линейная регрессия fit <- lm(units ~ season, data= dt)
дает вам a=21108156
, а summary(fit)
говорит вам, что стандартная ошибка a
равна 6697979, так что наблюдаемое значение a=21108156
имеет вероятность менее 0,0161 появиться, если бы оно было равно 0. Таким образом, вы можете разумно поспорить, что существует сезонность из 4 циклов с более чем 1-0,0161 = 98,388% шансов быть правильным.
Если вы предполагаете, что сезонность является мультипликативной, используйте те же рассуждения с переменной dt$mult = dt$units * dt$season
. На этот раз a * dt$mult + b
равно a * dt$units + b
, если действует сезонность, и b
, если нет. Таким образом, сезонность дает разницу в a * dt$units
, то есть среднее значение умножается на a=.1877=18.77%
со значимостью 0.01471=1-98.5%
.
Так работают готовые пакеты.
person
AlainD
schedule
31.07.2018