繁体   English   中英

如何使用 dplyr 计算同一分组变量中每个变量的相关性?

[英]How i can calculate the correlation of each variable within the same grouping variable using dplyr?

假设我有一个属于 3 个类别的 8 只股票的金融历史数据集。我想使用 dplyr 包计算 R 中每个组内每只股票的相关性。

library(tidyverse)
library(tidyquant)
Category = c("Social","Social","Internet","Technology",
             "Technology","Internet","Internet")
symbol = c("TWTR","FB","GOOG","TSLA","NOK","AMZN","AAPL")
A = tibble(Category,symbol)
B = tq_get(symbol, 
       from = "2021-01-01", 
       to = "2022-01-01")
BA = left_join(B,A,by="symbol")
BA%>%select(symbol,Category,close)

几天前我发布了这个类似的问题,但分组变量是数字,我的真实世界数据集不适用。 理想的输出是这样的:

类别 库存1 库存2 心电图
社会的 TWTR 脸书 心(TWTR,FB)
互联网 谷歌 亚马逊 科尔(谷歌,亚马逊)
互联网 谷歌 苹果 科尔(谷歌,亚马逊)
互联网 亚马逊 苹果 科尔(谷歌,苹果)
技术 特斯拉 挪威克朗 科尔(TSLA,挪威克朗)

关于我如何使用 dplyr 在 R 中做到这一点的任何帮助?

可选数据

var2 = c(rep("A",3),rep("B",3),rep("C",3),rep("D",3),rep("E",3),rep("F",3),
         rep("H",3),rep("I",3))

y2 = c(-1.23, -0.983, 1.28, -0.268, -0.46, -1.23,
       1.87, 0.416, -1.99, 0.289, 1.7, -0.455,
       -0.648, 0.376, -0.887,0.534,-0.679,-0.923,
       0.987,0.324,-0.783,-0.679,0.326,0.998);length(y2)
group2 = as.character(c(rep("xx",6),rep("xy",6),rep("xz",6),rep("xx",6)))
data2 = tibble(var2,group2,y2);data2

一个简单的辅助函数,

fun <- function(ticker, value, ...) {
  com <- combn(unique(ticker), 2)
  L <- split(value, ticker)
  data.frame(
    Stock1 = com[1,], Stock2 = com[2,],
    Corr = mapply(function(a, b) cor(a, b, ...), L[com[1,]], L[com[2,]])
  )
}

和工作:

library(dplyr)
data2 %>%
  group_by(group2) %>%
  summarize(fun(var2, y2), .groups = "drop")
# # A tibble: 8 x 4
#   group2 Stock1 Stock2   Corr
#   <chr>  <chr>  <chr>   <dbl>
# 1 xx     A      B      -0.995
# 2 xx     A      H      -0.958
# 3 xx     A      I       0.853
# 4 xx     B      H       0.982
# 5 xx     B      I      -0.901
# 6 xx     H      I      -0.967
# 7 xy     C      D       0.469
# 8 xz     E      F      -0.186

快速验证:

cor(filter(data2, var2 == "A")$y2, filter(data2, var2 == "B")$y2)
# [1] -0.9949738

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM