使用cross或c_across计算行计数

Question

给定数据框：input_df

  num_col_1 num_col_2 text_col_1 text_col_2
1         1         4        yes        yes
2         2         5         no        yes
3         3         6         no       <NA>

这段代码

library(dplyr)    
df %>%
  mutate(sum_yes = rowSums(.[c("text_col_1", "text_col_2")] == "yes"))

将生产这个新的 dataframe

> output_df
  num_col_1 num_col_2 text_col_1 text_col_2 sum_yes
1         1         4        yes        yes       2
2         2         5         no        yes       1
3         3         6         no       <NA>       0

问题是，你如何对现代的 dplyr 动词 cross 和c_across做同样的事情？

谢谢你。

Answer 1

1) c_across这里c_across返回一个包含由其参数指示的列的单行 tibble。

library(dplyr)

input_df %>%
  rowwise %>%
  mutate(sum = sum( c_across(starts_with("text")) == "yes", na.rm = TRUE)) %>%
  ungroup

给予：

# A tibble: 3 x 5
  num_col_1 num_col_2 text_col_1 text_col_2   sum
      <int>     <int> <chr>      <chr>      <int>
1         1         4 yes        yes            2
2         2         5 no         yes            1
3         3         6 no         <NA>           0

2）cross这给出了相同的结果。 cross 返回一个仅包含其参数指示across列的小标题。

input_df %>%
  mutate(sum = rowSums( across(starts_with("text")) == "yes", na.rm = TRUE))

将分数相加为是

如果有兴趣将对应于 yes 值的分数求和：

3) c_across

library(dplyr)

input_df %>%
  rowwise %>%
  mutate(sum = sum( c_across(starts_with("num")) * 
    (c_across(starts_with("text")) == "yes"), na.rm = TRUE)) %>%
  ungroup

给予：

  # A tibble: 3 x 5
  num_col_1 num_col_2 text_col_1 text_col_2   sum
      <int>     <int> <chr>      <chr>      <int>
1         1         4 yes        yes            5
2         2         5 no         yes            5
3         3         6 no         <NA>           0

4）跨output同（3）。

input_df %>%
  mutate(sum = rowSums(across(starts_with("num")) * 
                 (across(starts_with("text")) == "yes"), na.rm = TRUE))

笔记

可重现形式的输入：

Lines <- "  num_col_1 num_col_2 text_col_1 text_col_2
1         1         4        yes        yes
2         2         5         no        yes
3         3         6         no         NA"
input_df <- read.table(text = Lines)

使用cross或c_across计算行计数

问题描述

1 个解决方案

解决方案1
3 2021-02-19 00:16:32

将分数相加为是

笔记

使用cross或c_across计算行计数

问题描述

1 个解决方案

解决方案1 3 2021-02-19 00:16:32

将分数相加为是

笔记

解决方案1
3 2021-02-19 00:16:32