繁体   English   中英

使用每月虚拟变量消除时间序列季节性

[英]Removing time series seasonality with monthly dummies

我正在处理 2018-2021 年不同单词的每周谷歌搜索量(0-100)数据。 例如,我的“黄金价格”一词的数据如下:

gold <- (ts(SVI_Log_returns_Winsorized$`gold price`,frequency =52,start = c(2018,1), end = c(2021,52)))

Time Series:
Start = c(2018, 1) 
End = c(2021, 52) 
Frequency = 52 
  [1] -0.10919929  0.10919929 -0.03509132  0.00000000  0.13353139 -0.16989904 -0.16034265  0.04255961 -0.04255961 -0.09097178  0.13353139  0.00000000  0.04082199 -0.04082199  0.00000000 -0.08701138
 [17]  0.00000000 -0.04652002  0.09097178 -0.04445176 -0.04652002  0.00000000  0.00000000  0.04652002  0.04445176 -0.04445176  0.00000000  0.08701138  0.00000000 -0.04255961  0.00000000  0.26570317
 [33] -0.14310084 -0.03922071 -0.12783337  0.08701138 -0.08701138  0.00000000  0.04445176  0.16034265 -0.07696104 -0.04082199 -0.04255961  0.00000000 -0.04445176  0.08701138 -0.08701138  0.08701138
 [49] -0.04255961  0.23180161  0.15906469 -0.15906469 -0.10919929 -0.08004271  0.00000000  0.08004271 -0.12260232  0.00000000  0.08338161 -0.04082199  0.00000000 -0.04255961  0.04255961 -0.04255961
 [65] -0.04445176 -0.04652002  0.04652002 -0.04652002  0.04652002  0.00000000  0.08701138 -0.08701138 -0.04652002  0.25131443 -0.07696104  0.27763174  0.08701138 -0.11778304 -0.06453852  0.03278982
 [81] -0.03278982  0.03278982  0.30228422  0.00000000 -0.15028220  0.02666825 -0.08223810 -0.05884050 -0.06252036  0.00000000  0.00000000 -0.10178269  0.00000000  0.00000000 -0.07410797  0.03774033
 [97] -0.03774033 -0.03922071 -0.04082199  0.04082199  0.03922071  0.03774033  0.10536052  0.15415068  0.25131443 -0.22977835 -0.03390155  0.09844007 -0.06453852 -0.06899287  0.22314355  0.30228422
[113] -0.20875481  0.30228422  0.08252102 -0.22977835 -0.22977835  0.00000000  0.07696104  0.05406722 -0.22977835 -0.07410797 -0.05264373  0.05264373 -0.16705408  0.00000000  0.05884050 -0.05884050
[129]  0.08701138  0.02739897  0.12675171 -0.10008346  0.30228422  0.30228422  0.00000000 -0.13503628 -0.21414799 -0.22977835 -0.06453852 -0.19574458 -0.05556985  0.13353139 -0.10536052  0.00000000
[145]  0.00000000  0.00000000  0.05406722 -0.14107860  0.24116206 -0.10008346  0.07598591 -0.02469261 -0.07796154  0.02666825  0.00000000  0.02597549  0.28768207 -0.14458123 -0.04546237 -0.02353050
[161]  0.30228422 -0.22977835 -0.02469261  0.13976194  0.06317890 -0.08515781 -0.11778304 -0.07796154  0.02666825 -0.05406722 -0.02817088  0.02817088 -0.05715841  0.11122564  0.12361396 -0.04762805
[177] -0.05001042 -0.02597549 -0.05406722  0.05406722  0.00000000 -0.08223810 -0.05884050  0.02985296  0.00000000 -0.02985296 -0.03077166  0.24783616 -0.15822401 -0.05884050 -0.06252036 -0.06669137
[193]  0.12921173  0.05884050  0.00000000 -0.02898754  0.00000000 -0.02985296  0.08701138 -0.02817088  0.10821358 -0.05264373 -0.08455739  0.02898754 -0.05884050  0.05884050 -0.02898754 -0.06062462

绘制此数据如下所示: DiffLog 'Gold price'

如此处所示,数据似乎具有季节性成分。

使用分解数据

decomp <- stl(gold,"periodic")
    
plot(decomp)

给出以下分解的“黄金价格”

从季节性图表来看,“黄金价格”这个词的搜索量似乎在每年年中下降了很多。

我不太确定如何消除数据中的季节性。 我发现了几篇论文,它们通过保留残差来回归每月假人的此类数据。 我试图复制这一点,但我不知道从哪里开始。 有人可以建议我如何解决季节性问题吗?

谢谢!

我认为《预测——原则与实践》一书是一个很好的起点。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM