[英]Union dataframes in some way that updates rows with same row.name
我想做两个数据帧的并集,它们共享具有相同rowName的某些行。 对于那些具有通用rowName的行,我想考虑第二个数据框值,而不是第一个。 例如 :
df1 <- data.frame(col1 = c(1,2), col2 = c(2,4), row.names = c("row_1", "row_2"))
df1
# col1 col2
# row_1 1 2
# row_2 2 4
df2 <- data.frame(col1 = c(3,6), col2 = c(10,99), row.names = c("row_3", "row_2"))
df2
# col1 col2
# row_3 3 6
# row_2 10 99
我想要获得的结果将是:
someSpecificRBind(df1,df2, takeIntoAccount=df2)
# col1 col2
# row_1 1 2
# row_2 10 99
# row_3 3 6
函数rbind不能完成工作,实际上它会为通用行更新rowName。
我将其概念化为仅将df1
中尚不存在的行添加到df2
中:
rbind(df2, df1[setdiff(rownames(df1), rownames(df2)), ])
我们得到duplicated
元素的索引,并用它来filter
rbind(df2, df1)[!duplicated(c(row.names(df2), row.names(df1))),]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.