[英]model evaluation with “train_test_split” not static?
根据资源,sklearn.cross_validation模块的在线“ train_test_split”函数以随机状态返回数据。
这是否意味着如果我两次训练具有相同数据的模型,由于学习过程中使用的训练数据点在每种情况下都不同,我将得到两个不同的模型吗?
实际上,这两个模型的准确性会相差很多吗? 那有可能吗?
您可以将random_state
参数设置为某个常数,以重现数据拆分。 另一方面,通常最好测试一下您想知道的内容,即使用不同的随机状态至少进行两次训练并比较结果。 如果它们相差很大,则表明存在问题,并且您的解决方案不可靠。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.