[英]dplyr rowwise by some columns
什么是dplyr方式应用功能rowwise
某些列。 例如,我想抓住所有V,
列,并根据行总和将它们转换为百分比。 我展示了如何在基地做到这一点。 在dplyr链中怎么样? 很高兴看到data.table形式(虽然偏好将在这里转到dplyr解决方案)。
x <- data.frame(A=LETTERS[1:5], as.data.frame(matrix(sample(0:5, 25, T), ncol=5)))
data.frame(x[1], x[-1]/rowSums(x[-1]))
## A V1 V2 V3 V4 V5
## 1 A 0.1428571 0.2142857 0.2142857 0.35714286 0.07142857
## 2 B 0.2000000 0.2000000 0.1500000 0.20000000 0.25000000
## 3 C 0.3571429 0.2857143 0.0000000 0.07142857 0.28571429
## 4 D 0.1904762 0.2380952 0.1904762 0.23809524 0.14285714
## 5 E 0.2000000 0.2500000 0.1500000 0.25000000 0.15000000
library(dplyr)
props <- function(x) round(x/sum(x), 2)
# does not work
x %>%
rowwise()
mutate(props(matches("^.{2}$")))
在data.table中,你可以做到
library(data.table)
setDT(x)
x[, grep("^V",names(DT)) := .SD/Reduce(`+`, .SD), .SDcols = V1:V5]
A V1 V2 V3 V4 V5
1: A 0.28571429 0.0000000 0.2857143 0.07142857 0.35714286
2: B 0.23076923 0.2307692 0.3076923 0.15384615 0.07692308
3: C 0.44444444 0.0000000 0.4444444 0.00000000 0.11111111
4: D 0.07142857 0.3571429 0.1428571 0.07142857 0.35714286
5: E 0.00000000 0.2222222 0.3333333 0.44444444 0.00000000
为了计算忽略NA值的分母,我猜rowSums
是一个选项,但它会强制.SD
到矩阵作为中间步骤。
你可以结合tidyr的spread
并与dplyr一起gather
以获得以下单个管道:
x <- data.frame(A=LETTERS[1:5], as.data.frame(matrix(sample(0:5, 25, T), ncol=5)))
y <- x %>%
gather(V, val, -A) %>%
group_by(A) %>%
mutate(perc = val / sum(val)) %>%
select(-val) %>%
spread(V, perc)
通过整洁的数据,可以很容易地获得任何分组总和(行,列或任何嵌套的索引级别)并计算百分比。 spread
和gather
将使您进出输入数据格式。
另一个“tidyverse”解决方案是在mutate
使用select
。 例如
library(tidyverse)
x <- data.frame(A=LETTERS[1:5], as.data.frame(matrix(sample(0:5, 25, T), ncol=5)))
x %>%
mutate(row_counts = select_if(., is.numeric) %>% rowSums()) %>%
mutate_at(vars(contains("V")), funs(./row_counts)) %>%
select(-row_counts)
#> A V1 V2 V3 V4 V5
#> 1 A 0.0000000 0.14285714 0.1428571 0.5714286 0.1428571
#> 2 B 0.0000000 0.62500000 0.1250000 0.1250000 0.1250000
#> 3 C 0.2222222 0.11111111 0.2222222 0.1111111 0.3333333
#> 4 D 0.3000000 0.50000000 0.1000000 0.1000000 0.0000000
#> 5 E 0.3333333 0.06666667 0.1333333 0.3333333 0.1333333
由reprex包创建于2019-02-16(v0.2.1)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.