计算 R 中数据帧列表的列的平均值？

Question

我有一个如下所示的数据框列表：

$central_nervous_system
     DepMap_ID                Lineage       ABCA2
133 ACH-000025 central_nervous_system  0.06953841
134 ACH-000036 central_nervous_system -0.20757324
135 ACH-000040 central_nervous_system -0.07189173
          ABCA3       ABCA5        ABCB9      ABCC10
133 -0.20215981  0.02591981 -0.124328522 -0.19439091
134 -0.16144270  0.08592305 -0.101500474 -0.01984359
135 -0.06166222 -0.26031989  0.009193998 -0.33360141

总共有 26 个数据帧。 我想生成另一个数据框列表，或者一个表或一个列表，其中包含除前两个之外的所有列的平均值（因为它们不是数字）。 到目前为止，我的方法是：

lineage_avged <- lapply(x,colMeans(x[3:ncol(lineage_data)], na.rm = TRUE))

但它不起作用，我假设因为 lapply 不应该在这里使用。

Answer 1

示例数据：

x <- list(mtcars,mtcars)

代码：

sapply(x, function(df) apply(df[,-(1:2)], 2, mean))

#or use: sapply(x, function(df) colMeans(df[,-(1:2)]))

output：

           [,1]       [,2]
disp 230.721875 230.721875
hp   146.687500 146.687500
drat   3.596563   3.596563
wt     3.217250   3.217250
qsec  17.848750  17.848750
vs     0.437500   0.437500
am     0.406250   0.406250
gear   3.687500   3.687500
carb   2.812500   2.812500

Answer 2

你可以试试这个解决方案。 我还包括一个带有其他数据的示例。

lineage_avged <- lapply(YourList,function(x) colMeans(x[,-c(1,2)], na.rm = TRUE))

例子

#Create list
List <- split(iris,iris$Species)
#Function
lineage_avged <- lapply(List,function(x) colMeans(x[,-5], na.rm = TRUE))

$setosa
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
       5.006        3.428        1.462        0.246 

$versicolor
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
       5.936        2.770        4.260        1.326 

$virginica
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
       6.588        2.974        5.552        2.026

Answer 3

为什么不使用申请？

library(tidyverse)

a <-tribble(~DepMap_ID,                ~Lineage,       ~BCA2,
 "ACH-000025", "central_nervous_system",  0.06953841,
 "ACH-000036", "central_nervous_system", -0.20757324,
 "ACH-000040", "central_nervous_system", -0.07189173)
b <-tribble( ~ABCA3,      ~ABCA5,       ~ABCB9 ,     ~ABCC10,
 -0.20215981,  0.02591981, -0.124328522, -0.19439091,
 -0.16144270,  0.08592305, -0.101500474, -0.01984359,
 -0.06166222, -0.26031989,  0.009193998, -0.33360141)

df <- cbind(a,b)

get_mean <- function(x){
   apply(x[,-c(1,2)], 2, mean, na.rm=T)
}

然后将其应用于所有列表：

lapply(data, get_mean)

计算 R 中数据帧列表的列的平均值？

问题描述

3 个解决方案

解决方案1
3 2020-07-06 12:06:38

解决方案2
2 2020-07-06 12:40:19

解决方案3
0 2020-07-06 11:52:38

计算 R 中数据帧列表的列的平均值？

问题描述

3 个解决方案

解决方案1 3 2020-07-06 12:06:38

解决方案2 2 2020-07-06 12:40:19

解决方案3 0 2020-07-06 11:52:38

解决方案1
3 2020-07-06 12:06:38

解决方案2
2 2020-07-06 12:40:19

解决方案3
0 2020-07-06 11:52:38