[英]LSTM time series prediction - val and test loss lower then train loss
[英]Train / Val / Test split time LSTM
我有一個由幾個月組成的數據集(從 JAN-15 到 SEPT-17),報告每個月的客戶財務狀況。 我的任務是預測每個客戶未來 12 個月的累計銷售額。
我的數據集看起來像這樣(這是原始數據,為了訓練我將創建滯后特征)
Month CustomerID NetSales
JAN-15 A 10
JAN-15 B 10
JAN-15 C 10
FEB-15 A 10
FEB-15 B 10
FEB-15 C 10
...
我怎樣才能在 TRAIN / VAL / TEST 中以與時間一致的方式拆分它? 我可以做這樣的事情嗎?
這是一致的拆分策略嗎? 或者,您有什么建議?
非常感謝,安德里亞
這是一致的拆分策略嗎?
是的,您尊重這樣一個事實,即您不使用訓練數據之前的驗證集數據,對於您的測試集也是如此。 您正在防止數據泄漏,這是正確的方法。
或者,您有什么建議?
您唯一可以更改的是您的訓練集、驗證集、測試集的部分,但您可以嘗試一下。 由於它是一個時間序列,您應該考慮季節性趨勢,它們都包含在您的訓練數據中。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.