計算 R 中數據幀列表的列的平均值？

Question

我有一個如下所示的數據框列表：

$central_nervous_system
     DepMap_ID                Lineage       ABCA2
133 ACH-000025 central_nervous_system  0.06953841
134 ACH-000036 central_nervous_system -0.20757324
135 ACH-000040 central_nervous_system -0.07189173
          ABCA3       ABCA5        ABCB9      ABCC10
133 -0.20215981  0.02591981 -0.124328522 -0.19439091
134 -0.16144270  0.08592305 -0.101500474 -0.01984359
135 -0.06166222 -0.26031989  0.009193998 -0.33360141

總共有 26 個數據幀。 我想生成另一個數據框列表，或者一個表或一個列表，其中包含除前兩個之外的所有列的平均值（因為它們不是數字）。 到目前為止，我的方法是：

lineage_avged <- lapply(x,colMeans(x[3:ncol(lineage_data)], na.rm = TRUE))

但它不起作用，我假設因為 lapply 不應該在這里使用。

Answer 1

示例數據：

x <- list(mtcars,mtcars)

代碼：

sapply(x, function(df) apply(df[,-(1:2)], 2, mean))

#or use: sapply(x, function(df) colMeans(df[,-(1:2)]))

output：

           [,1]       [,2]
disp 230.721875 230.721875
hp   146.687500 146.687500
drat   3.596563   3.596563
wt     3.217250   3.217250
qsec  17.848750  17.848750
vs     0.437500   0.437500
am     0.406250   0.406250
gear   3.687500   3.687500
carb   2.812500   2.812500

Answer 2

你可以試試這個解決方案。 我還包括一個帶有其他數據的示例。

lineage_avged <- lapply(YourList,function(x) colMeans(x[,-c(1,2)], na.rm = TRUE))

例子

#Create list
List <- split(iris,iris$Species)
#Function
lineage_avged <- lapply(List,function(x) colMeans(x[,-5], na.rm = TRUE))

$setosa
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
       5.006        3.428        1.462        0.246 

$versicolor
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
       5.936        2.770        4.260        1.326 

$virginica
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
       6.588        2.974        5.552        2.026

Answer 3

為什么不使用申請？

library(tidyverse)

a <-tribble(~DepMap_ID,                ~Lineage,       ~BCA2,
 "ACH-000025", "central_nervous_system",  0.06953841,
 "ACH-000036", "central_nervous_system", -0.20757324,
 "ACH-000040", "central_nervous_system", -0.07189173)
b <-tribble( ~ABCA3,      ~ABCA5,       ~ABCB9 ,     ~ABCC10,
 -0.20215981,  0.02591981, -0.124328522, -0.19439091,
 -0.16144270,  0.08592305, -0.101500474, -0.01984359,
 -0.06166222, -0.26031989,  0.009193998, -0.33360141)

df <- cbind(a,b)

get_mean <- function(x){
   apply(x[,-c(1,2)], 2, mean, na.rm=T)
}

然后將其應用於所有列表：

lapply(data, get_mean)

計算 R 中數據幀列表的列的平均值？

問題描述

3 個解決方案

解決方案1
3 2020-07-06 12:06:38

解決方案2
2 2020-07-06 12:40:19

解決方案3
0 2020-07-06 11:52:38

計算 R 中數據幀列表的列的平均值？

問題描述

3 個解決方案

解決方案1 3 2020-07-06 12:06:38

解決方案2 2 2020-07-06 12:40:19

解決方案3 0 2020-07-06 11:52:38

解決方案1
3 2020-07-06 12:06:38

解決方案2
2 2020-07-06 12:40:19

解決方案3
0 2020-07-06 11:52:38