![](/img/trans.png)
[英]Merging two dataframes with left_join produces NAs in 'right' columns
[英]left_join R dataframes, merging two columns with NAs
我的问题如下:假设我有一个包含以下列的现有数据框:UID,foo,结果。 结果已经部分填充。 现在,第二个模型可以预测其他行,从而生成包含UID和结果列的第二个数据框:(在底部复制的代码)
## df_main
## UID foo result
## <dbl> <chr> <chr>
## 1 1 moo Cow
## 2 2 rum <NA>
## 3 3 oink <NA>
## 4 4 woof Dog
## 5 5 hiss <NA>
## new_prediction
## UID result
## <dbl> <chr>
## 1 3 Pig
## 2 5 Snake
我现在想通过UID left_join新结果以获取以下结果列:
## Cow
## <NA>
## Pig
## Dog
## Snake
但是我无法正常工作,因为left_join(df_main, new_prediction, by="UID")
创建result.x
和result.y
。 有什么方法可以使用dplyr进行此操作,或者可以选择第二步来加入这些列? 我研究了各种功能,但最终决定手动遍历所有行。 我可以肯定,还有更多的“ R”方式可以做到这一点?
数据框代码:
df_main <- tibble(UID = c(1,2,3,4,5), foo=c("moo", "rum", "oink", "woof", "hiss"), result=c("Cow", NA, NA, "Dog", NA))
new_prediction <- tibble(UID = c(3,5), result = c("Pig", "Snake"))
coalesce
是您的第二步。
left_join(df_main, new_prediction, by="UID") %>%
mutate(result = coalesce(result.x, result.y)) %>%
select(-result.x, -result.y)
# # A tibble: 5 x 3
# UID foo result
# <dbl> <chr> <chr>
# 1 1 moo Cow
# 2 2 rum <NA>
# 3 3 oink Pig
# 4 4 woof Dog
# 5 5 hiss Snake
coalesce
将接受您提供的尽可能多的列。 如果存在多个非缺失值,则较早的列具有优先权。
添加使用的格里高尔的回答coalesce
,你也可以“手动”与加盟列ifelse
。
left_join(df_main, new_prediction, by = "UID") %>%
mutate(result = ifelse(is.na(result.x),result.y, result.x)) %>%
select(-c(result.x, result.y))
# A tibble: 5 x 3
# UID foo result
# <dbl> <chr> <chr>
# 1 1.00 moo Cow
# 2 2.00 rum <NA>
# 3 3.00 oink Pig
# 4 4.00 woof Dog
# 5 5.00 hiss Snake
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.