繁体   English   中英

将数据拆分为R,拆分为百分比

[英]Split the data in R, split into percentage

我有一个对应于不同类型数据集的数据集。 然后如何计算大小写。

数据应分为一种情况:1) 一种情况 - 15%的列车数据和5%的测试

如何正确写?

没有createDataPartition ,一种简单的方法如下。

假设您希望train_prop作为训练集,并将test_prop作为数据集my_dataset测试集。 理想情况下,他们的总和将是11-val_prop ,但在这里你需要15%和5%由于某种原因。 因此您将分别需要0.15和0.05。

indices <- sample(x = rep.int(x = c(0, 1, 2),
                  times = round(nrow(my_dataset) * c(1 - train_prop - test_prop, train_prop, test_prop))))
train_set <- my_dataset[indices == 1,]
test_set <- my_dataset[indices == 2,]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM