R中auto.arima的训练数据集

Question

我有大约10000个时间序列。

我想使用auto.arima函数http://www.inside-r.org/packages/cran/forecast/docs/auto.arima

我想测试10000个时间序列的auto.arima模型的准确性。 我保留了20％的数据点（如果您看到40个样本中的样本，我将保留8个），然后让auto.arima进行预测。 然后，我可以将生成的8个值与实际的8个值进行比较。
但是，有没有一种正式的方法可以测试ARIMA模型的准确性？ 我的方法正确吗？

y=auto.arima(x)
plot(forecast(y,h=8))

采样时间序列1

0.0003748,0.0003929,0.0003653,0.0003557,0.0004463,0.000349,0.0003099,0.0003395,0.0003157,0.0002871,0.0002604,0.0002422,0.0001917,0.0002117,0.0002689

时间序列2

0.0003977,0.0003481,0.0002413,0.0002069,0.0002127,0.0002108,0.0002003,0.0002174,0.0002098,0.0002069,0.0001955,0.0001926,0.0002108,0.0002146,0.0002079

Answer 1

在我看来，您的Q与用于比较预测准确性的不同指标有关，而不是与auto.arima()和forecast()的特定用法有关。 如果是这样，那么可以使用许多指标。 有关概述，请参见

https://zh.wikipedia.org/wiki/Forecasting#Forecasting_accuracy

他们每个人都有其支持者和反对者； 例如，请参见本文：

http://robjhyndman.com/papers/mase.pdf

不管使用哪种精度指标，您仍然需要能够证明为什么要保留20％的数据用于预测。

但是，如果您对不同的模型形式感兴趣，那么您也可以选择。 例如，如评论中所建议，

使用arima() （或某些等效方法）将相同的单变量模型（指定为先验 ）拟合到每个时间序列；
使用auto.arima()将（可能）不同的单变量模型拟合到每个时间序列； 要么
使多元模型适合所有时间序列。

如果您感兴趣的是＃3，我建议在这里提出MARSS pkg：

https://cran.r-project.org/web/packages/MARSS/index.html

和用户指南在这里：

https://cran.r-project.org/web/packages/MARSS/vignettes/UserGuide.pdf

R中auto.arima的训练数据集

问题描述

1 个解决方案

解决方案1
0 2015-09-29 22:25:14

R中auto.arima的训练数据集

问题描述

1 个解决方案

解决方案1 0 2015-09-29 22:25:14

解决方案1
0 2015-09-29 22:25:14