繁体   English   中英

训练/验证/测试分割时间 LSTM

[英]Train / Val / Test split time LSTM

我有一个由几个月组成的数据集(从 JAN-15 到 SEPT-17),报告每个月的客户财务状况。 我的任务是预测每个客户未来 12 个月的累计销售额。

我的数据集看起来像这样(这是原始数据,为了训练我将创建滞后特征)

Month   CustomerID NetSales
JAN-15     A          10
JAN-15     B          10
JAN-15     C          10
FEB-15     A          10
FEB-15     B          10
FEB-15     C          10
...

我怎样才能在 TRAIN / VAL / TEST 中以与时间一致的方式拆分它? 我可以做这样的事情吗?

  • 火车--> 从 1 月 15 日到 3 月 16 日的所有客户/月份(我每个月至少服用一次,因此 model 将学习季节性模式
  • VAL --> 所有客户/月从 APR-16 到 JUN-16
  • 测试--> 从 JUL-16 到 SEP-16 的所有客户/月(我停在这里,因为我需要接下来的 12 个月来创建目标变量)

这是一致的拆分策略吗? 或者,您有什么建议?

非常感谢,安德里亚

这是一致的拆分策略吗?

是的,您尊重这样一个事实,即您不使用训练数据之前的验证集数据,对于您的测试集也是如此。 您正在防止数据泄漏,这是正确的方法。

或者,您有什么建议?

您唯一可以更改的是您的训练集、验证集、测试集的部分,但您可以尝试一下。 由于它是一个时间序列,您应该考虑季节性趋势,它们都包含在您的训练数据中。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM