繁体   English   中英

计算r中特定于日期的相关性(导致潜在的时间序列)

[英]calculating date specific correlation in r (leading to a potential time series)

我有一个看起来像这样的数据集(实际的数据集是〜150000行,其中包含绒毛信息的其他列,例如公司名称等):

Date         return1   return2   rank
01/31/2008   0.05434   0.23413   3
01/31/2008   0.03423   0.43423   4
01/31/2008   0.65277   0.23423   1
01/31/2008   0.02342   0.47234   4
02/31/2008   0.01463   0.01231   4
02/31/2008   0.13456   0.52552   2
02/31/2008   0.34534   0.36663   1
02/31/2008   0.00324   0.56463   3
...
12/31/2015   0.21234   0.02333   2
12/31/2015   0.07245   0.87234   1
12/31/2015   0.47282   0.12998   1
12/31/2015   0.99022   0.03445   2

基本上,我需要计算return1rank之间的特定于日期的相关性(所以更正了01/31 / 2008、02 / 31/2008等)。 我知道我可以使用split()函数拆分数据,但是我不确定如何获取特定于日期的相关性。 实际数据每个日期大约有260个条目,大约68个日期,因此手动设置原始表的子集并执行计算很耗时,但更重要的是更容易出错。

我的最终目标是创建不同日期的相关性的时间序列。

先感谢您!

早些时候我也遇到过同样的问题,只是我没有计算相关性。 我会做的是

a %>% group_by(Date) %>% summarise(Correlation = cor(return1, rank))

它将为每个日期提供return1rank之间的相关值。 不要忘记,您可以指定所需的关联类型(例如Spearman)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM