繁体   English   中英

使用dplyr获取R中data.frame列的总和的更好方法

[英]better way to get the sum of a data.frame column in R with dplyr

要将data.frame列的sum放在变量中,我就这样做了:

library(dplyr)
data <- data.frame("x" = c(1,2,3), "y" = c("a","b","c"))
way01 <- data %>% filter(y == "d") %>% summarise(total = sum(x)) %>% .$total
way02 <- data %>% filter(y == "d") %>% .$x %>% sum

我觉得summarise(total = sum(x)) %>% .$total%>% .$x %>% sum是笨拙的。 还有一种更优雅的方式吗?

我想像%>% sum(.$x) ,但它不起作用。

PS:使用"d"作为过滤器,以处理numeric(0)没有问题的情况。

您可以使用%$%而不是%>%来直接访问列:

> data %>% filter(y == "d") %$% sum(x)
[1] 0

你可能会追随:

way03 <- data %>% filter(y == "d") %>% { sum(.$x) }

使用{ }解释如下:

?magrittr::`%>%`

由于它与摘要一起使用,你总是可以欺骗R并使用脏黑客:

data %>% summarise(total = sum(x[y == "d"])) %>% first()

甚至

data %>% summarise(sum(x[y == "d"])) %>% first()

返回:

[1] 0

同样,这相当于此场景的last()nth(n=1)nth(n=-1)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM