dplyr汇总和group_by获取唯一值

Question

这是一个代表性的例子：

DF <- as.data.frame(matrix(data = 0, nrow = 9, ncol = 3))
colnames(DF) <- c("code", "actual", "expected")

DF$code <- letters[rep(1:3, each = 3)]
DF$actual <- runif(9, 3,5)
DF$expected <- rep(1:3, each = 3)

以下崩溃：

  DF %>%
  group_by(code) %>%
  summarise(Exp = expected)
 Error: expecting a single value

但是，以下工作：

DF %>%
  group_by(code) %>%
  summarise(Exp = unique(expected))

但是，代码的唯一值只是一个值。 为什么不回报价值工作？ 为什么我需要将其包装成“独特”？

谢谢！

Answer 1

这是一个常见的错误。 调试它的一种方法是在汇总调用中使用paste（）。

> DF %>% 
     group_by(code) %>% 
     summarise(Exp=paste(expected, collapse='-'))

Source: local data frame [3 x 2]

   code   Exp
  (chr) (chr)
1     a 1-1-1
2     b 2-2-2
3     c 3-3-3

你看到发生了什么事吗？ 您正在尝试将多个值分配给单个组。

一种解决方案是使用您描述的唯一。 或者，如果您知道具有相同代码的所有行始终具有相同的预期值，则可以直接group_by：

> DF%>% group_by(code, expected) %>% summarise()
Source: local data frame [3 x 2]
Groups: code [?]

   code expected
  (chr)    (int)
1     a        1
2     b        2
3     c        3

如果数据帧很大，group_by将比基于unique（）的解决方案快得多

dplyr汇总和group_by获取唯一值

问题描述

1 个解决方案

解决方案1
10 已采纳 2016-04-08 15:54:14

dplyr汇总和group_by获取唯一值

问题描述

1 个解决方案

解决方案1 10 已采纳 2016-04-08 15:54:14

解决方案1
10 已采纳 2016-04-08 15:54:14