繁体   English   中英

比较两个数据集以查找 r 中的一个数据集中不存在的行 [重复]

[英]Compare two datasets to find the rows that are not present in one of the datset in r [duplicate]

我有两个数据集,数据集中的 Id 是无序的,并且有多个值存在于一个数据集中但不存在于另一个数据集中。

最后我想要的是 csv 文件,其中包含两个数据集列的非通用 ID。

Dataset 1
Id Quant
1     a
2     b
3     c
4     d
5     e
6     f
7     g

Dataset 2
Id Quant2
6     d
4     a
5     f
2     e
1     a
3     b

您可以使用具有dplyr function 的anti_join package 来完成此任务:

library(dplyr)
anti_join(dataset1, dataset2, by = "Id")

这将返回dataset1中没有匹配Id的所有行dataset2 同样你可以看看

 anti_join(dataset2, dataset1, by = "Id")

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM