[英]Compare two datasets to find the rows that are not present in one of the datset in r [duplicate]
我有两个数据集,数据集中的 Id 是无序的,并且有多个值存在于一个数据集中但不存在于另一个数据集中。
最后我想要的是 csv 文件,其中包含两个数据集列的非通用 ID。
Dataset 1
Id Quant
1 a
2 b
3 c
4 d
5 e
6 f
7 g
Dataset 2
Id Quant2
6 d
4 a
5 f
2 e
1 a
3 b
您可以使用具有dplyr
function 的anti_join
package 来完成此任务:
library(dplyr)
anti_join(dataset1, dataset2, by = "Id")
这将返回dataset1
中没有匹配Id
的所有行dataset2
。 同样你可以看看
anti_join(dataset2, dataset1, by = "Id")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.