簡體   English   中英

訓練/驗證/測試分割時間 LSTM

[英]Train / Val / Test split time LSTM

我有一個由幾個月組成的數據集(從 JAN-15 到 SEPT-17),報告每個月的客戶財務狀況。 我的任務是預測每個客戶未來 12 個月的累計銷售額。

我的數據集看起來像這樣(這是原始數據,為了訓練我將創建滯后特征)

Month   CustomerID NetSales
JAN-15     A          10
JAN-15     B          10
JAN-15     C          10
FEB-15     A          10
FEB-15     B          10
FEB-15     C          10
...

我怎樣才能在 TRAIN / VAL / TEST 中以與時間一致的方式拆分它? 我可以做這樣的事情嗎?

  • 火車--> 從 1 月 15 日到 3 月 16 日的所有客戶/月份(我每個月至少服用一次,因此 model 將學習季節性模式
  • VAL --> 所有客戶/月從 APR-16 到 JUN-16
  • 測試--> 從 JUL-16 到 SEP-16 的所有客戶/月(我停在這里,因為我需要接下來的 12 個月來創建目標變量)

這是一致的拆分策略嗎? 或者,您有什么建議?

非常感謝,安德里亞

這是一致的拆分策略嗎?

是的,您尊重這樣一個事實,即您不使用訓練數據之前的驗證集數據,對於您的測試集也是如此。 您正在防止數據泄漏,這是正確的方法。

或者,您有什么建議?

您唯一可以更改的是您的訓練集、驗證集、測試集的部分,但您可以嘗試一下。 由於它是一個時間序列,您應該考慮季節性趨勢,它們都包含在您的訓練數據中。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM