[英]calculating date specific correlation in r (leading to a potential time series)
我有一个看起来像这样的数据集(实际的数据集是〜150000行,其中包含绒毛信息的其他列,例如公司名称等):
Date return1 return2 rank
01/31/2008 0.05434 0.23413 3
01/31/2008 0.03423 0.43423 4
01/31/2008 0.65277 0.23423 1
01/31/2008 0.02342 0.47234 4
02/31/2008 0.01463 0.01231 4
02/31/2008 0.13456 0.52552 2
02/31/2008 0.34534 0.36663 1
02/31/2008 0.00324 0.56463 3
...
12/31/2015 0.21234 0.02333 2
12/31/2015 0.07245 0.87234 1
12/31/2015 0.47282 0.12998 1
12/31/2015 0.99022 0.03445 2
基本上,我需要计算return1
和rank
之间的特定于日期的相关性(所以更正了01/31 / 2008、02 / 31/2008等)。 我知道我可以使用split()
函数拆分数据,但是我不确定如何获取特定于日期的相关性。 实际数据每个日期大约有260个条目,大约68个日期,因此手动设置原始表的子集并执行计算很耗时,但更重要的是更容易出错。
我的最终目标是创建不同日期的相关性的时间序列。
先感谢您!
早些时候我也遇到过同样的问题,只是我没有计算相关性。 我会做的是
a %>% group_by(Date) %>% summarise(Correlation = cor(return1, rank))
它将为每个日期提供return1
和rank
之间的相关值。 不要忘记,您可以指定所需的关联类型(例如Spearman)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.