Python中的趋势“预测变量”？

Question

我目前正在使用具有2列的数据框（以pandas ）：第一列是一些数字定量数据，例如重量，某天花费的金额，GPA等；第二列是日期值，即添加相应的第1列条目的日期。

我想知道，有没有一种方法可以“预测”在X时间之后Python中的下一个值？ 例如，如果我有100个体重条目跨越2-3个月（并非所有条目都具有相同的时差，那么1个条目可能在第3天，下一个第5天和下一个第10天），并且想“预测”我在1个月后的下一个录入内容，有什么办法吗？

我认为这与“时间序列分析”有关，但是我的统计背景不是很强，所以我不知道这是否是正确的方法。 如果是，该如何将其应用于数据框（即哪些包）？ 它可能返回的值是否具有任何意义，或者在我正在使用的上下文中它毫无意义？ 谢谢。

Answer 1

对于预测时序数据，我觉得最好的选择是LSTM，这是一种递归神经网络，非常适合时序回归。

如果您不想深入了解神经网络的后端，建议使用Keras库，该库是Tensorflow框架的包装。

假设您有一个一维值数组，并且想要预测下一个值。 Keras中的代码可能类似于：

#start off by building the training data, let arr = the list of values
X = []
y = []
for i in range(len(arr)-100-1):
    X.append(arr[i:i+100]) #get prev 100 values for the X
    y.append(arr[i+100])   # predict next value for Y

由于LSTM需要3D输入，因此我们希望将X数据重塑为3维：

import numpy as np
X = np.array(X)
X = X.reshape(len(X), len(X[0]), 1)

现在，X的形式为（样本，时间步长，特征）

在这里，我们可以使用keras构建神经网络：

from keras.models import Sequential
from keras.layers import Dense, LSTM

model = Sequential()
model.add(LSTM(input_shape = (len(X[0], 1)) #input 3-D timeseries data
model.add(Dense(1)) #output 1-D vector of predicted values
model.compile(loss='mean_squared_error', optimizer='adam')
model.fit(X, y)

中提琴，您可以使用模型来预测数据中的下一个值

Answer 2

Statsmodels是一个python模块，提供时间序列预测（Arima）中“最著名的”方法之一。

可以在以下链接中看到一个示例： https : //machinelearningmastery.com/arima-for-time-series-forecasting-with-python/

一些库中提供了其他时间序列预测方法，例如支持向量回归，Holt-Winters和简单指数平滑。

Spark-ts（ https://github.com/sryza/spark-timeseries ）是一个支持Python的时间序列库，并提供Arima，Holt-Winters和指数加权移动平均值之类的方法。

Libsvm（ https://github.com/cjlin1/libsvm ）提供了支持向量回归方法。

Python中的趋势“预测变量”？

问题描述

2 个解决方案

解决方案1
2 2018-04-07 21:31:20

解决方案2
2 2018-04-08 12:55:49

Python中的趋势“预测变量”？

问题描述

2 个解决方案

解决方案1 2 2018-04-07 21:31:20

解决方案2 2 2018-04-08 12:55:49

解决方案1
2 2018-04-07 21:31:20

解决方案2
2 2018-04-08 12:55:49