[英]Computing density() in R for grouped frequency data
這應該是一個非常簡單的問題,但我無法在任何地方找到答案(部分原因是因為我不確定要查詢什么)。
在R中,很容易計算密度:
c(1, 2, 2, 2, 3, 5, 5, 7, 8, 10, 10, 10)
你這樣做:
density(c(1, 2, 2, 2, 3, 5, 5, 7, 8, 10, 10, 10))
問題是,如果我的數據有這樣一個“未組合”的矢量,那么對於R(或構建數據集的查詢引擎)來說,這將太大了。 所以我需要在初始查詢中使用GROUP BY
和COUNT(*)
來壓縮我的結果(因此,使用rep()
來擴展計數沒有幫助)。 給定“計數”這樣的數據框,我如何計算框架的密度(對於KDE圖),如:
Value Count
1 1
2 3
3 1
5 2
7 1
8 1
10 3
而且要清楚,我確實需要密度圖, 而不是直方圖。
只需使用權重參數
density(d$Value, weights=d$Count/sum(d$Count))
(編輯為第一評論)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.