[英]Replacing NA values from another dataframe by id
我有一个数据框df1如下-
ID Count
11 345
22 456
33 786
44 765
55 NA
66 888
77 NA
然后我有一个df2如下-
ID Count
11 536
22 654
33 786
44 999
55 890
66 111
77 654
我希望将df1
NA
值替换为那些特定ID的df2
的值。
产生的df3
应该是:
ID Count
11 345
22 456
33 786
44 765
55 890
66 888
77 654
任何帮助都将非常感谢
您可以使用更新联接来编辑第一个表中的那些行:
library(data.table)
setDT(DF1); setDT(DF2)
DF1[is.na(Count), Count := DF2[.SD, on=.(ID), x.Count]]
这个怎么运作
DF[i, j]
被i
过滤然后j
j
, .SD
使用i
过滤后的数据子集 :=
的j
添加或修改表中的列 x[i, on=, xv]
如该类似答案中所述 使用dplyr
:
library(dplyr)
df1 %>%
left_join(df2, by = c("ID")) %>%
mutate(Count = ifelse(is.na(Count.x), Count.y, Count.x)) %>%
select(-c(Count.x, Count.y))
这产生
ID Count
1 11 345
2 22 456
3 33 786
4 44 765
5 55 890
6 66 888
7 77 654
dplyr::coalesce
使用将使任务更简单。
library(dplyr)
df1 %>% inner_join(df2, by= "ID") %>%
mutate(Count = coalesce(Count.x, Count.y)) %>%
select(ID, Count)
# ID Count
# 1 11 345
# 2 22 456
# 3 33 786
# 4 44 765
# 5 55 890
# 6 66 888
# 7 77 654
数据:
df1 <- read.table(text =
"ID Count
11 345
22 456
33 786
44 765
55 NA
66 888
77 NA",
header = TRUE)
df2 <- read.table(text =
"ID Count
11 536
22 654
33 786
44 999
55 890
66 111
77 654",
header = TRUE)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.