如何使用 R 中的跨函数更改多列中的值？

Question

我有一个数据框，我想在其中遍历所有以_qc结尾的列，如果值为“4”，则将 NA 设置为没有_qc后缀的相应列。

例如，如果名为chla_adjusted_qc == 4的列的值， chla_adjusted的值设置为 NA。

library(tidyverse)


df <- tibble(
  chla_adjusted = c(100, 2),
  chla_adjusted_qc = c("4", "1"),
  bbp_adjusted = c(0.1, 9999),
  bbp_adjusted_qc = c("2", "4")
)

df
#> # A tibble: 2 × 4
#>   chla_adjusted chla_adjusted_qc bbp_adjusted bbp_adjusted_qc
#>           <dbl> <chr>                   <dbl> <chr>          
#> 1           100 4                         0.1 2              
#> 2             2 1                      9999   4

所需的输出将是

tibble(
  chla_adjusted = c(NA, 2),
  chla_adjusted_qc = c("4", "1"),
  bbp_adjusted = c(0.1, NA),
  bbp_adjusted_qc = c("2", "4")
)
#> # A tibble: 2 × 4
#>   chla_adjusted chla_adjusted_qc bbp_adjusted bbp_adjusted_qc
#>           <dbl> <chr>                   <dbl> <chr>          
#> 1            NA 4                         0.1 2              
#> 2             2 1                        NA   4

到目前为止我所做的是获取当前列名并找到我要在其中设置 NA 值的相应列。

df |>
  mutate(across(ends_with("_qc"), \(var) {
    # If var is chla_adjusted_qc, then lets modify the value in chla_adjusted
    col <- str_remove(cur_column(), "_qc")

    # if (var == "4") {
    #   # What to do here?
    # }
  }))
#> # A tibble: 2 × 4
#>   chla_adjusted chla_adjusted_qc bbp_adjusted bbp_adjusted_qc
#>           <dbl> <chr>                   <dbl> <chr>          
#> 1           100 chla_adjusted             0.1 bbp_adjusted   
#> 2             2 chla_adjusted          9999   bbp_adjusted

谢谢你。

^{创建于 2022-12-20，使用reprex v2.0.2}

Answer 1

df %>%
  mutate(across(ends_with("_qc"),
                ~ replace(cur_data()[[ sub("_qc$", "", cur_column()) ]], . == 4L, NA),
                .names = "{sub('_qc$', '', .col)}"))
# # A tibble: 2 × 4
#   chla_adjusted chla_adjusted_qc bbp_adjusted bbp_adjusted_qc
#           <dbl> <chr>                   <dbl> <chr>          
# 1            NA 4                         0.1 2              
# 2             2 1                        NA   4

Answer 2

基础 R 解决方案：

for(v in grep("_qc$",names(df), value=TRUE)){
  df[[sub("_qc$","",v)]][df[[v]]==4] <- NA
}


> df
# A tibble: 2 × 4
  chla_adjusted chla_adjusted_qc bbp_adjusted bbp_adjusted_qc
          <dbl> <chr>                   <dbl> <chr>          
1            NA 4                         0.1 2              
2             2 1                        NA   4              
>

Answer 3

我们可以使用across2中的dplyover

library(dplyover)
df %>% 
   mutate(across2(ends_with('adjusted'), ends_with('_qc'), 
    ~ case_when(.y !=4 ~ .x ), .names = "{xcol}"))

-输出

# A tibble: 2 × 4
  chla_adjusted chla_adjusted_qc bbp_adjusted bbp_adjusted_qc
          <dbl> <chr>                   <dbl> <chr>          
1            NA 4                         0.1 2              
2             2 1                        NA   4

如何使用 R 中的跨函数更改多列中的值？

问题描述

3 个解决方案

解决方案1
4 已采纳 2022-12-20 14:39:56

解决方案2
3 2022-12-20 14:41:31

解决方案3
1 2022-12-20 17:57:54

如何使用 R 中的跨函数更改多列中的值？

问题描述

3 个解决方案

解决方案1 4 已采纳 2022-12-20 14:39:56

解决方案2 3 2022-12-20 14:41:31

解决方案3 1 2022-12-20 17:57:54

解决方案1
4 已采纳 2022-12-20 14:39:56

解决方案2
3 2022-12-20 14:41:31

解决方案3
1 2022-12-20 17:57:54