[英]How to create correlation using dplyr in R studio
我有一个数据集,其中包含3个属性(组织层次结构区域-区域-领土,领土是最低的谷物)加上两个数字字段(销售数量和人数)。
如何生成销售数量和地区人员之间的关联,并按地区,区域和地区显示关联?
我使用dplyr包,g = group_by(mydataset,区域,区域,领土),然后进行汇总(g,cor(sales_qty,人数)。显示效果不错,但所有相关性均为“ NA”。如果我省略了领土,则结果看起来正确(按区域和区域分组)即使地区是最低级别,我仍然可以使用“ group_by”功能吗?为什么显示不适用?
感谢您的帮助!
如果不查看代码,很难说出您要尝试什么。 我不能评论你在做什么错。 这是我尝试与组之间建立关联的方法。 它运作良好。
set.seed(1234)
df <- data.frame(group = rep(1:5, 100), x = rnorm(500) , y = rnorm(500) )
library(dplyr)
df %>%
group_by(group) %>%
do(data.frame(x=cor(.$x,.$y)))
输出:
group x
<int> <dbl>
1 1 0.1293551648
2 2 0.0006703073
3 3 0.2021294935
4 4 -0.0162522307
5 5 0.0995898089
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.