理解 rowwise() 和 c_across()

Question

你好：誰能提供一個外行的解釋，為什么這兩種嘗試計算行平均值的方法不同？ 謝謝。

library(tidyverse)
var1<-rnorm(100)
var2<-rnorm(100)
var3<-rnorm(100)

df<-data.frame(var1, var2, var3)

#ADD IN A MISSING VALUE
df[1,1]<-NA

#I thought this would work
df %>% 
  select(starts_with('var')) %>% 
  rowwise() %>% 
  mutate(avg=mean(., na.rm=T))
#This does work but I don't understand why
df %>% 
  rowwise() %>% 
  mutate(avg=
           mean(
             c_across(starts_with('var')), na.rm=T)
         )

Answer 1

. 代表整個數據集而不是分組數據。
此外， mean不適用於數據幀。 （見mean(mtcars) ）

由於dplyr 1.0.0（或更高版本），您可以使用cur_data()獲取組中的數據，但要使用它mean您需要將其更改為 vector ，這可以使用unlist或as.matrix 。 所以嘗試：

library(dplyr)

df %>% 
  select(starts_with('var')) %>% 
  rowwise() %>% 
  mutate(avg=mean(unlist(cur_data()), na.rm=T))

但是，您的第二種方法是使用rowwise的正確方法。

理解 rowwise() 和 c_across()

問題描述

1 個解決方案

解決方案1
4 已采納 2020-10-09 15:25:35

理解 rowwise() 和 c_across()

問題描述

1 個解決方案

解決方案1 4 已采納 2020-10-09 15:25:35

解決方案1
4 已采納 2020-10-09 15:25:35