R：删除所有列中相同的行

Question

输入文件：

y <- read.table(textConnection('
   c1   c2   c3
1  a    b    -1
2  a    b    -1
3  a    c    1
4  a    b    1
5  a    b    -1
'), header=TRUE)

因此，y 是

  c1 c2 c3
1  a  b -1
2  a  b -1
3  a  c  1
4  a  b  1
5  a  b  -1

output 文件将是：

  c1 c2 c3
1  a  b -1
3  a  c  1
4  a  b  1

如何删除所有列中具有相同条目的多个或重复行？

Answer 1

尝试unique(y)

> unique(y)
  c1 c2 c3
1  a  b -1
3  a  c  1
4  a  b  1

Answer 2

？独特的。 不过要注意浮点变量...

Answer 3

除了unique()之外， duplicated()还有助于识别哪些行是重复的。

例如：

subset(y, !duplicated(y))

但正如 Chase 和 Nick 所展示的， unique()是您要在这里寻找的，而且效率更高。

Answer 4

您还可以使用 dplyr package 中的 distinct()

> library(dplyr, quietly = T)
> distinct(y)
  c1 c2 c3
1  a  b -1
2  a  c  1
3  a  b  1