dplyr 的 rowwise + replace_NAs：用其他列的值替换多列中的 NA

Question

我有兴趣用同一行的参考值替换一行中的所有 NA。 以下代码有效，但对于我的实际用例来说太慢了：

df = data.frame(ref = c(1,3,4,2,5), var1 = c(NA,3,4,2,1), var2 = c(1,3,NA,5,5))
for (i in 1:nrow(df)) {
  ref_value = as.character(df$ref[i])
  df[i,] = df[i,] %>% mutate_all(replace_na, replace = ref_value) }

我尝试通过以下修改加快该过程，并得到以下错误。

df = data.frame(ref = c(1,3,4,2,5), var1 = c(NA,3,4,2,1), var2 = c(1,3,NA,5,5))
df %>% rowwise() %>% mutate_all(replace_na, replace = ref)

错误：

错误： mutate()输入ref有问题。 x 替换data的长度是 2，而不是长度 1 ℹ 输入ref是(function (data, replace, ...)... . ℹ 第 1 行出现错误。

有什么建议么？

Answer 1

我们可以使用coalesce 。 循环遍历 'var' 列并使用循环列和 'ref' 的coalesce ，这样无论哪里有NA ，它都会被 'ref' 中的相应元素替换，而其他非 NA 元素保持原样

library(dplyr) #>= 1.0.0
df %>% 
     mutate(across(starts_with('var'), ~ coalesce(., ref)))
#   ref var1 var2
#1   1    1    1
#2   3    3    3
#3   4    4    4
#4   2    2    5
#5   5    1    5

Answer 2

这也可以：

library(dplyr)

df %>%
  mutate(across(c(var1:var2),~ ifelse(is.na(.), ref, .)))

Output：

  ref var1 var2
1   1    1    1
2   3    3    3
3   4    4    4
4   2    2    5
5   5    1    5

dplyr 的 rowwise + replace_NAs：用其他列的值替换多列中的 NA

问题描述

2 个解决方案

解决方案1
1 已采纳 2020-08-18 20:25:55

解决方案2
0 2020-08-18 20:30:14

dplyr 的 rowwise + replace_NAs：用其他列的值替换多列中的 NA

问题描述

2 个解决方案

解决方案1 1 已采纳 2020-08-18 20:25:55

解决方案2 0 2020-08-18 20:30:14

解决方案1
1 已采纳 2020-08-18 20:25:55

解决方案2
0 2020-08-18 20:30:14