[英]LSTM time series prediction - val and test loss lower then train loss
[英]Train / Val / Test split time LSTM
我有一个由几个月组成的数据集(从 JAN-15 到 SEPT-17),报告每个月的客户财务状况。 我的任务是预测每个客户未来 12 个月的累计销售额。
我的数据集看起来像这样(这是原始数据,为了训练我将创建滞后特征)
Month CustomerID NetSales
JAN-15 A 10
JAN-15 B 10
JAN-15 C 10
FEB-15 A 10
FEB-15 B 10
FEB-15 C 10
...
我怎样才能在 TRAIN / VAL / TEST 中以与时间一致的方式拆分它? 我可以做这样的事情吗?
这是一致的拆分策略吗? 或者,您有什么建议?
非常感谢,安德里亚
这是一致的拆分策略吗?
是的,您尊重这样一个事实,即您不使用训练数据之前的验证集数据,对于您的测试集也是如此。 您正在防止数据泄漏,这是正确的方法。
或者,您有什么建议?
您唯一可以更改的是您的训练集、验证集、测试集的部分,但您可以尝试一下。 由于它是一个时间序列,您应该考虑季节性趋势,它们都包含在您的训练数据中。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.