繁体   English   中英

ARIMA在statsmodels中没有样本预测?

[英]ARIMA out of sample prediction in statsmodels?

我有一个时间序列预测问题,我正在使用statsmodels python包来解决。 使用AIC标准进行评估,最佳模型变得相当复杂,类似于ARIMA(27,1,8)[我没有对参数空间进行详尽的搜索,但它似乎在那里的最小值]。 我在使用此模型进行验证和预测时遇到了麻烦,因为训练单个模型实例需要很长时间(小时),因此进行重复测试非常困难。

在任何情况下,我真正需要的是为了能够在操作中使用statsmodels(假设我可以首先以某种方式验证模型)是一种机制,用于在新数据到达时合并以生成下一组预测。 我希望能够在可用数据上拟合模型,对其进行选择,然后在下一个数据点可用时进行解开,并将其合并到更新的预测集中。 目前,每当新数据可用时我都必须重新调整模型,正如我所说,这需要很长时间。

我看了一下这个问题 ,主要解决了我对ARMA模型的问题。 然而,对于ARIMA情况,存在增加的数据复杂性的差异。 我需要能够生成原始时间序列的新预测(参见ARIMAResultsWrapper.predict方法中的typ ='levels'关键字)。 我的理解是,statsmodels目前无法做到这一点,但是我需要使用现有功能的哪些组件才能自己写一些东西来做这件事?

编辑:我也使用transparams = True,因此预测过程需要能够将预测转换回原始时间序列,这是自制方法中的另一个难点。

在事物的方案中,ARIMA(27,1,8)模型非常复杂。 对于大多数时间序列,您可以使用五个左右的参数进行合理的预测。 当然这取决于数据和领域,但我非常怀疑27 + 8 = 35个参数是必要的。

偶尔会知道AIC对参数的数量过于宽松。 我会尝试将结果与BIC进行比较。

我还会研究一下您的数据是否具有某种季节性。 例如,这些AR术语中的所有27个都无关紧要,您实际上只需要滞后= 1和滞后= 24(例如)。 这可能是每日季节性的每小时数据。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM