[英]Mean of columns of different dataframes in r
df1 <- data.frame(id=c(1,2,3,4,5,6),val1=c(1,2,3,NA,NA,6))
df2 <- data.frame(id=c(3,4,7,6,8) , val1=c(1,2,3,4,5))
現在想要的是將來自df1和df2的val1的值組合為平均值,即df1$val1
。 例如:
df1$val1 <- mean(df1$val1,df2$val2, na.rm=TRUE) & match(by=id)
df1$val1
應該如下
val1
1
2
2((3+1)/2)
4(4+NA/2)
NA
6
我們試試吧
library(data.table)
rbindlist(list(df1, df2))[, .(val1 = mean(val1, na.rm = TRUE)), id][id %in% df1$id]
或者另一個選擇是
setDT(df1)[df2, val1 := rowMeans(cbind(val1, i.val1), na.rm = TRUE), on = .(id)]
或者@Frank在評論中提到
setDT(df1); setDT(df2)
df1[, v := df2[df1, on=.(id), mean(c(x.val1, i.val1),
na.rm=TRUE), by=.EACHI]$V1]
我的解決方案使用整潔。
library(dplyr)
df1 <- data.frame(id=c(1,2,3,4,5,6),val1=c(1,2,3,NA,NA,6))
df2 <- data.frame(id=c(3,4,7,6,8) , val1=c(1,2,3,4,5))
df1 %>% left_join(df2, by="id") %>% select(2:3) %>%
transmute(val1=rowMeans(., na.rm=T))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.