在两列或三列中查找包含相同值的行

Question

我想在两列或三列中找到包含相同值的行。 这是一个示例数据集：

replicate(3, {sample(1:3)})
     [,1] [,2] [,3]
[1,]    3    3    2
[2,]    2    1    1
[3,]    1    2    3

对于此数据集，第一行和第二行具有重复值（即 3 和 1），因此我想提取并处理它们，然后只保留具有非重复值的行（即在这种情况下为第三行）。

如何做到这一点？ 我有一个更大的数据集。 感谢您的帮助！

Answer 1

在最后的注释中使用 m ，将 anyDuplicated 应用于每一行并使用它来对行进行子集化。 如果没有重复项，则 anyDupolicated 返回 0，否则返回第一个重复项的索引。 感叹号 (.) 会将 0 强制为 FALSE 并将其他值强制为 TRUE，然后将其取反。

m[!apply(m, 1, anyDuplicated),, drop = FALSE ]
##      [,1] [,2] [,3]
## [1,]    1    2    3

或者

subset(m, !apply(m, 1, anyDuplicated))
##      [,1] [,2] [,3]
## [1,]    1    2    3

笔记

这与问题中所示的矩阵相同，但在生成时没有使用随机数来实现重现性。

m <- matrix(c(3, 2, 1, 3, 1, 2, 2, 1, 3), 3)

Answer 2

给你 go

dataf<- replicate(3, {sample(1:3)})

dup_rows<-apply(dataf,1,FUN=function(x) ifelse( max(table(x) )>1 ,TRUE, FALSE) )

data_non_dup<-dataf[!dup_rows,]

Answer 3

如果您有兴趣，这是一个 tidyverse 解决方案：

library(dplyr)
library(purrr)

     [,1] [,2] [,3]
[1,]    1    3    2
[2,]    3    1    3
[3,]    2    2    1


df %>%
  as_tibble() %>%
  mutate(dup = pmap_dbl(list(V1, V2, V3), ~ n_distinct(c(...)))) %>%
  filter(dup == 3) %>%
  select(-dup)


# A tibble: 1 x 3
     V1    V2    V3
  <int> <int> <int>
1     1     3     2

在两列或三列中查找包含相同值的行

问题描述

3 个解决方案

解决方案1
2 已采纳 2021-04-10 14:47:30

笔记

解决方案2
1 2021-04-10 14:40:36

解决方案3
1 2021-04-10 14:58:57

在两列或三列中查找包含相同值的行

问题描述

3 个解决方案

解决方案1 2 已采纳 2021-04-10 14:47:30

笔记

解决方案2 1 2021-04-10 14:40:36

解决方案3 1 2021-04-10 14:58:57

解决方案1
2 已采纳 2021-04-10 14:47:30

解决方案2
1 2021-04-10 14:40:36

解决方案3
1 2021-04-10 14:58:57