時間序列數據集訓練測試拆分 ML

Question

在machinelearningmastery 上，有一篇關於如何從一個時間序列變量創建監督學習回歸類型數據集的帖子。

例如這個：

time, measure
1, 100
2, 110
3, 108
4, 115
5, 120

通過函數series_to_supervised傳遞數據后可以變成下面這個

X, y
?, 100
100, 110
110, 108
108, 115
115, 120
120, ?

在series_to_supervised帖子的多步或序列預測部分， series_to_supervised可以輸出如下：

   var1(t-2)  var1(t-1)  var1(t)  var1(t+1)
2        0.0        1.0        2        3.0
3        1.0        2.0        3        4.0
4        2.0        3.0        4        5.0
5        3.0        4.0        5        6.0
6        4.0        5.0        6        7.0
7        5.0        6.0        7        8.0
8        6.0        7.0        8        9.0

我的問題是我將如何定義 X & y 列車測試拆分？ 我假設var1(t)將被定義為 y，對嗎？ 例如，這對於 trainX 和 trainy 是否正確？ 我正在試驗

#function for time series X,y breakdown
train = series_to_supervised(need_to_train,11,14)

#split data sets
trainX = np.array(train.drop(['var1(t)'],1))
trainy = np.array(train['var1(t)'])

model = XGBRegressor(objective='reg:squarederror', n_estimators=100)

Answer 1

不， var1(t+1)將是目標並被視為y 。 重點是根據當前（和過去）的數據預測未來的下一步。

時間序列數據集訓練測試拆分 ML

問題描述

1 個解決方案

解決方案1
1 已采納 2020-11-17 13:12:29

時間序列數據集訓練測試拆分 ML

問題描述

1 個解決方案

解決方案1 1 已采納 2020-11-17 13:12:29

解決方案1
1 已采納 2020-11-17 13:12:29