检查数据表中哪些行相同

Question

我需要一个解决方案，向我显示哪些行是相同的，但找不到聪明的解决方案（没有一堆复杂循环的解决方案）。 我希望有一个data.table解决方案。 我想要的是带有相同条目的行号的列表。

一个例子：

library(data.table)
Data <- data.table(A = c("a", "a", "c"), 
                   B = c("A", "A", "B"))

第一和第二行相同。 我想要的输出：

[[1]]
[1] 1 2

[[2]]
[1] 3

Answer 1

这是快速而肮脏的事情：

Data[, .(.I, .GRP), by = .(A, B)][, list(split(I, GRP))]$V1

可以简化为：

Data[, .(list(.I)), by = .(A, B)]$V1

Answer 2

那就是我的解决方案，直到sindri_baldur提出了一个更好的解决方案：

Data.unique <- unique(Data)
Data.unique[, G := .I]
Data[, I := .I]
Data.full <- 
  merge(Data,
        Data.unique,
        by = c("A", "B"))

Data.full %>% 
  split(by = "G") %>% 
  map(~ .x[, I])

检查数据表中哪些行相同

问题描述

2 个解决方案

解决方案1
4 已采纳 2019-11-25 14:46:25

解决方案2
0 2019-11-25 14:53:33

检查数据表中哪些行相同

问题描述

2 个解决方案

解决方案1 4 已采纳 2019-11-25 14:46:25

解决方案2 0 2019-11-25 14:53:33

解决方案1
4 已采纳 2019-11-25 14:46:25

解决方案2
0 2019-11-25 14:53:33