繁体   English   中英

计算分组频率数据的R中的密度()

[英]Computing density() in R for grouped frequency data

这应该是一个非常简单的问题,但我无法在任何地方找到答案(部分原因是因为我不确定要查询什么)。

在R中,很容易计算密度:

c(1, 2, 2, 2, 3, 5, 5, 7, 8, 10, 10, 10)

你这样做:

density(c(1, 2, 2, 2, 3, 5, 5, 7, 8, 10, 10, 10))

问题是,如果我的数据有这样一个“未组合”的矢量,那么对于R(或构建数据集的查询引擎)来说,这将太大了。 所以我需要在初始查询中使用GROUP BYCOUNT(*)来压缩我的结果(因此,使用rep()来扩展计数没有帮助)。 给定“计数”这样的数据框,我如何计算框架的密度(对于KDE图),如:

Value Count
1     1
2     3
3     1
5     2
7     1
8     1
10    3

而且要清楚,我确实需要密度图, 而不是直方图。

只需使用权重参数

density(d$Value, weights=d$Count/sum(d$Count))

(编辑为第一评论)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM