簡體   English   中英

kde2d密度比較

[英]kde2d density comparison

我有一個關於kde2d (Kernel density estimator). 我在同一個變量空間中為兩組不同的數據計算兩個不同的kde2d。 當我將它們與filled.contour2或輪廓進行比較時,我發現散點圖中點數密度較低的集合(總計中的點數較少,因子為10)對於輪廓值具有較高的密度。 我期望具有更高點密度的集合將具有更高的密度輪廓值,但是如上所述並非如此。 它必須與帶寬(h)的選擇? 我使用等於h,我試圖改變,但結果並沒有改變很多。 我的錯誤是什么?

一個例子

a <-  runif(1000, 5.0, 7.5)
b <-  runif(1000, 2.0, 3.0)
c <-  runif(100000,5.0, 7.5)
d <-  runif(100000, 2.0, 3.0)
library(MASS)
abdens <- kde2d(a,b,n=100,h=0.5)
cddens <- kde2d(c,d,n=100,h=0.5)
mylevels <- seq(-2.4,30,0.9)
filled.contour2(abdens,xlab="a",ylab="b",xlim=c(5,7.5),ylim=c(2,3), 
                col=hsv(seq(0,1,length=length(mylevels))))
 plot(a,b)
contour(abdens,nlevels=5,add=T,col="blue")
plot(c,d)
contour(cddens,nlevels=5,add=T,col="orange")

我不確定我是否同意在統一案件中密度應該不同。 我原本期望從正態分布中獲得更多隨機抽取點的集合,以獲得對極端區域的更多支持,從而在中心具有更低(估計)的密度。 這種影響也可能偶爾會出現,而bibariate Uniform得分為1,000分,而不是100,000分。 我希望我的代碼修改是可以接受的。 如果在繪圖之后完成,則更容易看到contour

(理論密度在這兩種情況下都是相同的,因為密度分布被歸一化為1.0的積分。我們只看到具有一些預期偽影來自“邊緣”效應的估計。在單變量密度的情況下添加關於可以使用package :: logspline中的desity函數完成邊界。)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM