繁体   English   中英

将功能应用于数据框

[英]Applying a function to a data frame

我不知道为什么这不起作用。 我有一个5列n行的数据集。 我只想对每行应用一个函数,并将结果以n×1向量返回。

为了测试一切工作原理,我做了一个简单的功能:

f1 <- function(uniqueid,Perspvalue,expvalue,stddevi,stddevc) {
    uniqueid+ Perspvalue- expvalue+ stddevi+stddevc
}

这是我的数据集的前几行:

> data
     uniqueid   Perspvalue    expvalue      stddevi      stddevc
1           1 2.404421e+03  3337239.00 8.266566e+03 3.324624e+03
2           2 1.345307e+03  3276559.87 7.068823e+03 2.648072e+03
3           3 1.345307e+03  3276559.87 7.068823e+03 2.648072e+03

请注意,这是一个数据帧(我认为),而不是矩阵。 我使用read.csv从csv加载了数据。

所以我尝试这样: apply(data,1,f1)

但是我的结果是这样的: Error in uniqueid + Perspvalue : 'Perspvalue' is missing

我期望一个数字而不是一个错误。

你需要使用mapply这一点,甚至更多convienient mdply从plyr包。

一些示例代码:

spam_function = function(a, b) {
  return(a*b)
}

require(plyr)
input_args = data.frame(a = runif(1000), b = runif(1000))
result = mdply(input_args, spam_function)
> head(result)
           a         b         V1
1 0.46902575 0.6865863 0.32202668
2 0.56837805 0.2400993 0.13646717
3 0.07185661 0.2334754 0.01677675
4 0.15589191 0.6636891 0.10346377
5 0.98317092 0.8895609 0.87459042
6 0.46070479 0.4301685 0.19818071

如果只需要结果向量:

result_vector = result$V1

或者,使用mapply的基本R解决方案:

result_mapply = mapply(spam_function, a = input_args$a, b = input_args$b)
> head(result_mapply)
[1] 0.2757767 0.1268879 0.5851026 0.7904186
[5] 0.2186079 0.1091692

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM