通过汇总数据帧的列来计算相关性

Question

我有以下数据框：

y <- data.frame(group = letters[1:5], a = rnorm(5) , b = rnorm(5), c = rnorm(5), d = rnorm(5) )

如何获得一个数据框，该数据框为我提供每一行的a，b和c，d列之间的相关性？

类似于： sapply(y, function(x) {cor(x[2:3],x[4:5])})

谢谢S

Answer 1

您可以使用apply

> apply(y[,-1],1,function(x) cor(x[1:2],x[3:4]))
[1] -1 -1  1 -1 1

或ddply （尽管这可能会过大，并且如果两行具有相同的group ，它将对这两行进行a＆b和c＆d列的关联）：

> ddply(y,.(group),function(x) cor(c(x$a,x$b),c(x$c,x$d)))
  group V1
1     a -1
2     b -1
3     c  1
4     d -1
5     e  1

Answer 2

您可以使用apply将函数应用于矩阵，数组或data.frame的每一行（或每一列）。

apply(
  y[,-1], # Remove the first column, to ensure that u remains numeric
  1,      # Apply the function on each row
  function(u) cor( u[1:2], u[3:4] )
)

（只有2个观察值，相关性只能是+1或-1。）

Answer 3

差不多了：您只需要使用apply而不是sapply ，并删除不必要的列。

apply(y[-1], 1, function(x) cor(x[1:2], x[3:4])

当然，两个长度为2的向量之间的相关性不是非常有用。

通过汇总数据帧的列来计算相关性

问题描述

3 个解决方案

解决方案1
2 已采纳 2012-01-13 03:03:00

解决方案2
1 2012-01-13 03:01:13

解决方案3
1 2012-01-13 03:02:14

通过汇总数据帧的列来计算相关性

问题描述

3 个解决方案

解决方案1 2 已采纳 2012-01-13 03:03:00

解决方案2 1 2012-01-13 03:01:13

解决方案3 1 2012-01-13 03:02:14

解决方案1
2 已采纳 2012-01-13 03:03:00

解决方案2
1 2012-01-13 03:01:13

解决方案3
1 2012-01-13 03:02:14