[英]Question about Train-Test Split in Time Series
我有一个关于在时间序列任务中将数据拆分为训练和测试集的问题。 我知道数据不能被洗牌,因为保持数据的时间性很重要,所以我们不会创造我们能够展望未来的场景。 然而,当我对数据进行洗牌(用于实验)时,我得到了一个高得离谱的 R-Squared 分数。 是的,R Squared 使用测试集进行了评估。 有人可以简单地解释为什么会这样吗? 为什么在时间序列中改组训练和测试数据会产生高 R-Squared 分数? 我的猜测是它与时间序列的趋势有关,但我不确定。 我只是出于好奇而问,谢谢!
这真的取决于你的问题。 如果:
希望这可以帮助!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.