[英]time series dataset train test split ML
在machinelearningmastery 上,有一篇關於如何從一個時間序列變量創建監督學習回歸類型數據集的帖子。
例如這個:
time, measure
1, 100
2, 110
3, 108
4, 115
5, 120
通過函數series_to_supervised
傳遞數據后可以變成下面這個
X, y
?, 100
100, 110
110, 108
108, 115
115, 120
120, ?
在series_to_supervised
帖子的多步或序列預測部分, series_to_supervised
可以輸出如下:
var1(t-2) var1(t-1) var1(t) var1(t+1)
2 0.0 1.0 2 3.0
3 1.0 2.0 3 4.0
4 2.0 3.0 4 5.0
5 3.0 4.0 5 6.0
6 4.0 5.0 6 7.0
7 5.0 6.0 7 8.0
8 6.0 7.0 8 9.0
我的問題是我將如何定義 X & y 列車測試拆分? 我假設var1(t)
將被定義為 y,對嗎? 例如,這對於 trainX 和 trainy 是否正確? 我正在試驗
#function for time series X,y breakdown
train = series_to_supervised(need_to_train,11,14)
#split data sets
trainX = np.array(train.drop(['var1(t)'],1))
trainy = np.array(train['var1(t)'])
model = XGBRegressor(objective='reg:squarederror', n_estimators=100)
不, var1(t+1)
將是目標並被視為y
。 重點是根據當前(和過去)的數據預測未來的下一步。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.