Statsmodels ARIMA：每个预测的恒定值

Question

我正在尝试使用 statsmodels 的 ARIMA 来预测时间序列。 我正在使用 sklearn 的TimeSeriesSplit来评估我的模型。 不幸的是，当我预测下一个数据折叠（具有真实值Y_test ）时，我得到了一个恒定的预测：

if is_arima:
      Y_train = Y_train.astype(float)
      # build basic ARIMA model
      arima_model = ARIMA(Y_train, order=(2,0,1))
      # fit it, using exogenous variables
      arima_results = arima_model.fit()
      # predict next len(test) values, using exogenous variables (X_test)
      preds = arima_results.forecast(steps=len(Y_test))[0]
      print(preds)

这给了我：

115.65096239  120.89113477  121.52020239  121.59572014  121.60478583
  121.60587414  121.60600479  121.60602047  121.60602235  121.60602258
  121.6060226   121.60602261  121.60602261  121.60602261  121.60602261
  121.60602261  121.60602261  121.6060226   121.6060226   121.6060226
  121.6060226   121.6060226   121.6060226   121.6060226   121.6060226
  121.6060226   121.6060226   121.6060226   121.6060226   121.6060226...

这让我觉得我的 ARIMA 没有使用时间 t 的预测来预测时间 t+1？

我知道输出不是完全恒定的，但我的数据集显示出很大的变化，所以这有点令人担忧。 知道发生了什么吗？

谢谢！

Answer 1

您使用 ARIMA(2,0,1)，所以您的预测是

x(t) = constant + w(t) + a1 * x(t-1) + a2 * x(t-2) + b1 * w(t-1)

因此，您的预测取决于两个因素。 您有自回归项和移动平均项。 您的自回归项只是前一周期值的常数乘以 2 周期前的值加上不同的常数乘以。 然后你有一个移动平均项，它是前一期预测误差的常数倍。 因此，您的模型可能主要由前两个时期主导，并且它可能会很快找到平衡。

尝试打印出参数，然后将其插入 excel 以查看模型中发生的情况。

print(arima_model.summary())
print(arima_model.params)

Answer 2

您正在使用递归策略进行多步预测，即在先前步骤中生成的预测用于迭代预测下一个预测。 它导致错误累积，结果预测收敛到一个值。 对于很长的数据系列，Arima 表现不佳。

Statsmodels ARIMA：每个预测的恒定值

问题描述

2 个解决方案

解决方案1
0 2018-06-19 17:25:55

解决方案2
0 2020-10-29 03:10:21

Statsmodels ARIMA：每个预测的恒定值

问题描述

2 个解决方案

解决方案1 0 2018-06-19 17:25:55

解决方案2 0 2020-10-29 03:10:21

解决方案1
0 2018-06-19 17:25:55

解决方案2
0 2020-10-29 03:10:21