使用 dplyr 替換來自不同 dataframe 的多個列

Question

我有兩個數據框，其中一個包含 ID 的子集和另一個的列（但具有不同的值）。

ds1 <- data.frame(id = c(1:4),
                      d1 = "A",
                      d2 = "B",
                      d3 = "C")


ds2 <- data.frame(id = c(1,2),
                     d1 = "W",
                     d2 = "X")

我希望在 d1 上使用 dplyr 來查找共享列，並將它們的值替換為 d2 中找到的值，匹配 ID。 我可以像這樣一次改變它們：

ds1 %>% 
  mutate(d1 = ifelse(id %in% ds2$id, ds2$d1[ds2$id==id],d1),
         d2 = ifelse(id %in% ds2$id, ds2$d2[ds2$id==id],d2))

然而，在我的實際情況下，我需要這樣做 47 次。 憑借 cross across()的穩健性，我覺得有更好的方法。 我也對非 dplyr 解決方案持開放態度。

Answer 1

您可能需要使用dplyr和stringr （也可以在沒有stringr的情況下完成）


library(tidyverse)

ds1 %>% left_join(ds2, by = 'id') %>%
  mutate(across(ends_with('.y'), ~ coalesce(., get(str_replace(cur_column(), '.y', '.x'))))) %>%
  select(!ends_with('.x')) %>%
  rename_with(~str_remove(., '.y'), ends_with('.y'))

#>   id d3 d1 d2
#> 1  1  C  W  X
#> 2  2  C  W  X
#> 3  3  C  A  B
#> 4  4  C  A  B

^{由代表 package (v2.0.0) 於 2021 年 5 月 10 日創建}

Answer 2

這有點類似於我的朋友親愛的@AnilGoyal 發布的，與你的相比也有點冗長，你可以將它用於更大的數據集：

library(dplyr)
library(stringr)


ds1 %>%
  left_join(ds2, by = "id") %>% 
  mutate(across(ends_with(".x"), ~ ifelse(!is.na(get(str_replace(cur_column(), ".x", ".y"))), 
                                          get(str_replace(cur_column(), ".x", ".y")), 
                                          .x))) %>%
  select(!ends_with(".y")) %>%
  rename_with(~ str_remove(., ".x"), ends_with(".x"))


  id d1 d2 d3
1  1  W  X  C
2  2  W  X  C
3  3  A  B  C
4  4  A  B  C

Answer 3

使用rows_update

library(tidyverse)
ds1 <- data.frame(id = c(1:4),
                  d1 = "A",
                  d2 = "B",
                  d3 = "C")


ds2 <- data.frame(id = c(1,2),
                  d1 = "W",
                  d2 = "X")

rows_update(x = ds1, y = ds2, by = "id")
#>   id d1 d2 d3
#> 1  1  W  X  C
#> 2  2  W  X  C
#> 3  3  A  B  C
#> 4  4  A  B  C

^{由代表 package (v2.0.0) 於 2021 年 5 月 11 日創建}

使用 dplyr 替換來自不同 dataframe 的多個列

問題描述

3 個解決方案

解決方案1
3 2021-05-10 15:35:33

解決方案2
2 2021-05-10 16:16:44

解決方案3
2 已采納 2021-05-11 10:32:13

使用 dplyr 替換來自不同 dataframe 的多個列

問題描述

3 個解決方案

解決方案1 3 2021-05-10 15:35:33

解決方案2 2 2021-05-10 16:16:44

解決方案3 2 已采納 2021-05-11 10:32:13

解決方案1
3 2021-05-10 15:35:33

解決方案2
2 2021-05-10 16:16:44

解決方案3
2 已采納 2021-05-11 10:32:13