在R中使用ddply（）函数和in for循环

Question

我的问题是关于例如在for循环中如何使用ddply问题。

x<-ddply(data, "variable_name", summarize, event= sum(x)/count(x))

这是正常的ddply但是如果要我在variable_name空间中进行操作，如以下示例所示：

**

数据

** 1. col1,col2,col3,col4
ax 10 1
ax 02 2
ax 40 3
bx 05 8
by 01 10
by 08 6
by 10 8
by 50 6

for(i in 1:2){ result[i]<-ddply(data, name(data[,i]), summarize, event=sum(col3)/count(col4)) }

**

所需的输出：

**结果[col3]

 1. col1 event  
     a    17.33  
     b 14.80

result[col4] 

 1. col2 event  
     x    14.25  
     y    17.25

Answer 1

您总是可以使用这种方法（有些人可能会认为是hacky）来执行此操作：

for(i in 1:ncol(data)) {
     q <-sprintf("x <- ddply(data, .(%s), summarize, event=sum(x)/count(x))", 
              names(data)[i]) 
     parse(eval(text = q)) 
}

Answer 2

用sum(.) / count(.)表示平均值吗？ 我认为summarise不适合count 。 如果您只想要平均值，我建议您使用mean ，这样就可以实现

lapply(c("cyl", "gear"), function(var) ddply(mtcars, var, summarize, mean(mpg)))
#[[1]]
#  cyl      ..1
#1   4 26.66364
#2   6 19.74286
#3   8 15.10000
#
#[[2]]
#  gear      ..1
#1    3 16.10667
#2    4 24.53333
#3    5 21.38000

或者等效地，如果您想使用names和索引，则可以将第一个参数替换为

lapply(names(mtcars)[c(2,10)], ...)

在R中使用ddply（）函数和in for循环

问题描述

2 个解决方案

解决方案1
1 2015-05-23 03:02:41

解决方案2
0 2015-05-28 10:27:13

在R中使用ddply（）函数和in for循环

问题描述

2 个解决方案

解决方案1 1 2015-05-23 03:02:41

解决方案2 0 2015-05-28 10:27:13

解决方案1
1 2015-05-23 03:02:41

解决方案2
0 2015-05-28 10:27:13