[英]Applying a function to a data frame
我不知道为什么这不起作用。 我有一个5列n行的数据集。 我只想对每行应用一个函数,并将结果以n×1向量返回。
为了测试一切工作原理,我做了一个简单的功能:
f1 <- function(uniqueid,Perspvalue,expvalue,stddevi,stddevc) {
uniqueid+ Perspvalue- expvalue+ stddevi+stddevc
}
这是我的数据集的前几行:
> data
uniqueid Perspvalue expvalue stddevi stddevc
1 1 2.404421e+03 3337239.00 8.266566e+03 3.324624e+03
2 2 1.345307e+03 3276559.87 7.068823e+03 2.648072e+03
3 3 1.345307e+03 3276559.87 7.068823e+03 2.648072e+03
请注意,这是一个数据帧(我认为),而不是矩阵。 我使用read.csv从csv加载了数据。
所以我尝试这样: apply(data,1,f1)
但是我的结果是这样的: Error in uniqueid + Perspvalue : 'Perspvalue' is missing
我期望一个数字而不是一个错误。
你需要使用mapply
这一点,甚至更多convienient mdply
从plyr包。
一些示例代码:
spam_function = function(a, b) {
return(a*b)
}
require(plyr)
input_args = data.frame(a = runif(1000), b = runif(1000))
result = mdply(input_args, spam_function)
> head(result)
a b V1
1 0.46902575 0.6865863 0.32202668
2 0.56837805 0.2400993 0.13646717
3 0.07185661 0.2334754 0.01677675
4 0.15589191 0.6636891 0.10346377
5 0.98317092 0.8895609 0.87459042
6 0.46070479 0.4301685 0.19818071
如果只需要结果向量:
result_vector = result$V1
或者,使用mapply
的基本R解决方案:
result_mapply = mapply(spam_function, a = input_args$a, b = input_args$b)
> head(result_mapply)
[1] 0.2757767 0.1268879 0.5851026 0.7904186
[5] 0.2186079 0.1091692
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.