簡體   English   中英

計算分組頻率數據的R中的密度()

[英]Computing density() in R for grouped frequency data

這應該是一個非常簡單的問題,但我無法在任何地方找到答案(部分原因是因為我不確定要查詢什么)。

在R中,很容易計算密度:

c(1, 2, 2, 2, 3, 5, 5, 7, 8, 10, 10, 10)

你這樣做:

density(c(1, 2, 2, 2, 3, 5, 5, 7, 8, 10, 10, 10))

問題是,如果我的數據有這樣一個“未組合”的矢量,那么對於R(或構建數據集的查詢引擎)來說,這將太大了。 所以我需要在初始查詢中使用GROUP BYCOUNT(*)來壓縮我的結果(因此,使用rep()來擴展計數沒有幫助)。 給定“計數”這樣的數據框,我如何計算框架的密度(對於KDE圖),如:

Value Count
1     1
2     3
3     1
5     2
7     1
8     1
10    3

而且要清楚,我確實需要密度圖, 而不是直方圖。

只需使用權重參數

density(d$Value, weights=d$Count/sum(d$Count))

(編輯為第一評論)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM