计算r中特定于日期的相关性（导致潜在的时间序列）

Question

我有一个看起来像这样的数据集（实际的数据集是〜150000行，其中包含绒毛信息的其他列，例如公司名称等）：

Date         return1   return2   rank
01/31/2008   0.05434   0.23413   3
01/31/2008   0.03423   0.43423   4
01/31/2008   0.65277   0.23423   1
01/31/2008   0.02342   0.47234   4
02/31/2008   0.01463   0.01231   4
02/31/2008   0.13456   0.52552   2
02/31/2008   0.34534   0.36663   1
02/31/2008   0.00324   0.56463   3
...
12/31/2015   0.21234   0.02333   2
12/31/2015   0.07245   0.87234   1
12/31/2015   0.47282   0.12998   1
12/31/2015   0.99022   0.03445   2

基本上，我需要计算return1和rank之间的特定于日期的相关性（所以更正了01/31 / 2008、02 / 31/2008等）。 我知道我可以使用split()函数拆分数据，但是我不确定如何获取特定于日期的相关性。 实际数据每个日期大约有260个条目，大约68个日期，因此手动设置原始表的子集并执行计算很耗时，但更重要的是更容易出错。

我的最终目标是创建不同日期的相关性的时间序列。

先感谢您！

Answer 1

早些时候我也遇到过同样的问题，只是我没有计算相关性。 我会做的是

a %>% group_by(Date) %>% summarise(Correlation = cor(return1, rank))

它将为每个日期提供return1和rank之间的相关值。 不要忘记，您可以指定所需的关联类型（例如Spearman）。

计算r中特定于日期的相关性（导致潜在的时间序列）

问题描述

1 个解决方案

解决方案1
0 已采纳 2016-06-08 19:57:46

计算r中特定于日期的相关性（导致潜在的时间序列）

问题描述

1 个解决方案

解决方案1 0 已采纳 2016-06-08 19:57:46

解决方案1
0 已采纳 2016-06-08 19:57:46