簡體   English   中英

r中不同數據幀的列的平均值

[英]Mean of columns of different dataframes in r

df1 <- data.frame(id=c(1,2,3,4,5,6),val1=c(1,2,3,NA,NA,6))
df2 <- data.frame(id=c(3,4,7,6,8) , val1=c(1,2,3,4,5))

現在想要的是將來自df1和df2的val1的值組合為平均值,即df1$val1 例如:

df1$val1 <- mean(df1$val1,df2$val2, na.rm=TRUE) & match(by=id)

df1$val1應該如下

val1
1
2
2((3+1)/2)
4(4+NA/2)
NA
6

我們試試吧

library(data.table)
rbindlist(list(df1, df2))[, .(val1 = mean(val1, na.rm = TRUE)), id][id %in% df1$id]

或者另一個選擇是

setDT(df1)[df2, val1 := rowMeans(cbind(val1, i.val1), na.rm = TRUE), on = .(id)]

或者@Frank在評論中提到

setDT(df1); setDT(df2)
df1[, v := df2[df1, on=.(id), mean(c(x.val1, i.val1),
          na.rm=TRUE), by=.EACHI]$V1]

我的解決方案使用整潔。

library(dplyr)
df1 <- data.frame(id=c(1,2,3,4,5,6),val1=c(1,2,3,NA,NA,6))
df2 <- data.frame(id=c(3,4,7,6,8) , val1=c(1,2,3,4,5))

df1 %>% left_join(df2, by="id") %>% select(2:3) %>% 
  transmute(val1=rowMeans(., na.rm=T))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM