繁体   English   中英

如何在R Studio中使用dplyr创建关联

[英]How to create correlation using dplyr in R studio

我有一个数据集,其中包含3个属性(组织层次结构区域-区域-领土,领土是最低的谷物)加上两个数字字段(销售数量和人数)。

如何生成销售数量和地区人员之间的关联,并按地区,区域和地区显示关联?

我使用dplyr包,g = group_by(mydataset,区域,区域,领土),然后进行汇总(g,cor(sales_qty,人数)。显示效果不错,但所有相关性均为“ NA”。如果我省略了领土,则结果看起来正确(按区域和区域分组)即使地区是最低级别,我仍然可以使用“ group_by”功能吗?为什么显示不适用?

感谢您的帮助!

如果不查看代码,很难说出您要尝试什么。 我不能评论你在做什么错。 这是我尝试与组之间建立关联的方法。 它运作良好。

set.seed(1234)
df <- data.frame(group = rep(1:5, 100), x = rnorm(500) , y = rnorm(500) )
library(dplyr)

df %>% 
  group_by(group) %>% 
  do(data.frame(x=cor(.$x,.$y)))

输出:

 group             x
  <int>         <dbl>
1     1  0.1293551648
2     2  0.0006703073
3     3  0.2021294935
4     4 -0.0162522307
5     5  0.0995898089

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM