kde2d密度比較

Question

我有一個關於kde2d (Kernel density estimator). 我在同一個變量空間中為兩組不同的數據計算兩個不同的kde2d。 當我將它們與filled.contour2或輪廓進行比較時，我發現散點圖中點數密度較低的集合（總計中的點數較少，因子為10）對於輪廓值具有較高的密度。 我期望具有更高點密度的集合將具有更高的密度輪廓值，但是如上所述並非如此。 它必須與帶寬（h）的選擇？ 我使用等於h，我試圖改變，但結果並沒有改變很多。 我的錯誤是什么？

一個例子

a <-  runif(1000, 5.0, 7.5)
b <-  runif(1000, 2.0, 3.0)
c <-  runif(100000,5.0, 7.5)
d <-  runif(100000, 2.0, 3.0)
library(MASS)
abdens <- kde2d(a,b,n=100,h=0.5)
cddens <- kde2d(c,d,n=100,h=0.5)
mylevels <- seq(-2.4,30,0.9)
filled.contour2(abdens,xlab="a",ylab="b",xlim=c(5,7.5),ylim=c(2,3), 
                col=hsv(seq(0,1,length=length(mylevels))))
 plot(a,b)
contour(abdens,nlevels=5,add=T,col="blue")
plot(c,d)
contour(cddens,nlevels=5,add=T,col="orange")

Answer 1

我不確定我是否同意在統一案件中密度應該不同。 我原本期望從正態分布中獲得更多隨機抽取點的集合，以獲得對極端區域的更多支持，從而在中心具有更低（估計）的密度。 這種影響也可能偶爾會出現，而bibariate Uniform得分為1,000分，而不是100,000分。 我希望我的代碼修改是可以接受的。 如果在繪圖之后完成，則更容易看到contour 。

（理論密度在這兩種情況下都是相同的，因為密度分布被歸一化為1.0的積分。我們只看到具有一些預期偽影來自“邊緣”效應的估計。在單變量密度的情況下添加關於可以使用package :: logspline中的desity函數完成邊界。）

kde2d密度比較

問題描述

1 個解決方案

解決方案1
0 2013-06-28 22:14:29

kde2d密度比較

問題描述

1 個解決方案

解決方案1 0 2013-06-28 22:14:29

解決方案1
0 2013-06-28 22:14:29