簡體   English   中英

R中auto.arima的訓練數據集

[英]Training data set for auto.arima in R

我有大約10000個時間序列。

我想使用auto.arima函數http://www.inside-r.org/packages/cran/forecast/docs/auto.arima

我想測試10000個時間序列的auto.arima模型的准確性。 我保留了20%的數據點(如果您看到40個樣本中的樣本,我將保留8個),然后讓auto.arima進行預測。 然后,我可以將生成的8個值與實際的8個值進行比較。
但是,有沒有一種正式的方法可以測試ARIMA模型的准確性? 我的方法正確嗎?

y=auto.arima(x)
plot(forecast(y,h=8))

采樣時間序列1

0.0003748,0.0003929,0.0003653,0.0003557,0.0004463,0.000349,0.0003099,0.0003395,0.0003157,0.0002871,0.0002604,0.0002422,0.0001917,0.0002117,0.0002689

時間序列2

0.0003977,0.0003481,0.0002413,0.0002069,0.0002127,0.0002108,0.0002003,0.0002174,0.0002098,0.0002069,0.0001955,0.0001926,0.0002108,0.0002146,0.0002079

在我看來,您的Q與用於比較預測准確性的不同指標有關,而不是與auto.arima()forecast()的特定用法有關。 如果是這樣,那么可以使用許多指標。 有關概述,請參見

https://zh.wikipedia.org/wiki/Forecasting#Forecasting_accuracy

他們每個人都有其支持者和反對者; 例如,請參見本文:

http://robjhyndman.com/papers/mase.pdf

不管使用哪種精度指標,您仍然需要能夠證明為什么要保留20%的數據用於預測。

但是,如果您對不同的模型形式感興趣,那么您也可以選擇。 例如,如評論中所建議,

  1. 使用arima() (或某些等效方法)將相同的單變量模型(指定為先驗 )擬合到每個時間序列;
  2. 使用auto.arima()將(可能)不同的單變量模型擬合到每個時間序列; 要么
  3. 使多元模型適合所有時間序列。

如果您感興趣的是#3,我建議在這里提出MARSS pkg:

https://cran.r-project.org/web/packages/MARSS/index.html

和用戶指南在這里:

https://cran.r-project.org/web/packages/MARSS/vignettes/UserGuide.pdf

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM