如何修复Python中的ARIMA MODEL错误

Question

我正在尝试为我的时间序列数据创建一个ARIMA模型。 我该如何对其代码进行平滑处理才能使其正常运行？

我正在使用statsmodels在python中创建ARIMA模型，但是却收到错误警告

    indexedDataset_logscale.head(10)
    OUTPUT: 
                Price
    Period  
    2013-02-08  2.515274
    2013-02-11  2.526528
    2013-02-12  2.520113
    2013-02-13  2.515274
    2013-02-14  2.543961
    2013-02-15  2.544040
    2013-02-19  2.530119
    2013-02-20  2.516082
    2013-02-21  2.508786
    2013-02-22  2.5273

    #AR Model
    from statsmodels.tsa.arima_model import ARIMA

    model = ARIMA(indexedDataset_logscale, order=(0, 1, 2))
    results_AR = model.fit(disp = -1)
    plt.plot(datasetLogDiffShifting)
    plt.plot(results_AR.fittedvalues, color = 'red')
    plt.title('RSS: %.4f' %sum((results_AR.fittedvalues-datasetLogDiffShifting['Price'])**2))
    print('Plotting AR Model')

Error messages i get are:

“ ValueWarning：提供了日期索引，但没有相关的频率信息，因此在进行预测时将被忽略。例如在进行预测时将被忽略。”，ValueWarning）
8 plt.title（'RSS：％.4f'％sum（（results_AR.fittedvalues-datasetLogDiffShifting ['Price']）** 2））TypeError：'str'对象不可调用

Answer 1

1）看来您的索引没有设定频率尝试在Arima之前添加此

df.index.freq = 'D'

D是每天的时间戳，似乎您不是线性/有规律的，很难定义问题所在。 检查熊猫中的其他频率选项。

为避免警告，请在脚本开头键入以下内容：

#Clear console
import warnings
warnings.filterwarnings("ignore")

Answer 2

问题在于，在您的数据中，索引似乎是每日的，但某些日期不是连续的天。 您可以提供缺少的日期，然后插值这些日期的值，如下所示：

df = df.resample('D').mean()
df["Price"] = df["Price"].interpolate(method='linear', axis=0).ffill().bfill()

然后，您将能够构建模型并绘制拟合值。

如何修复Python中的ARIMA MODEL错误

问题描述

2 个解决方案

解决方案1
0 2019-07-04 12:57:43

解决方案2
0 2019-07-04 13:24:32

如何修复Python中的ARIMA MODEL错误

问题描述

2 个解决方案

解决方案1 0 2019-07-04 12:57:43

解决方案2 0 2019-07-04 13:24:32

解决方案1
0 2019-07-04 12:57:43

解决方案2
0 2019-07-04 13:24:32