擬合經驗數據的分布

Question

我正在嘗試將 beta 分布擬合到根據經驗數據創建的直方圖。

我遇到的問題是擬合分布比原始直方圖中的條形高得多。

原始數據在 [0,1] 的范圍之外，這是可以評估 beta 分布的范圍，所以我重新調整原始數據，使其位於 [0,1] 區間內。

這是我的代碼：

 load("https://www.dropbox.com/s/c3psxx8jjbc20mo/data.Rdata?dl=0")

  #create histogram with values normalized between 0 and 1
  h <- hist((data-min(data)) / (max(data)-min(data)),lty="blank",col="grey")
  #normalize the density so the y-axis goes from 0 to 1
  h$density <- h$counts/max(h$counts)
  #plot the results
  plot(h,freq=FALSE,cex.main=1,cex.axis=1,yaxt='n',ylim=c(0,1.5),col='grey',lty='blank',xaxt='n')
  axis(2,at=seq(0,1,0.5),labels=seq(0,1,0.5))
  axis(1,at=seq(0,1,0.5),labels=seq(0,1,0.5))

  #fit beta distribution
  a <- (data-min(data)) / (max(data)-min(data))
  a[a==1] <- 0.9999
  a[a==0] <- 0.0001
  fit.beta <- suppressWarnings(fitdistr(a, "beta", start = list( shape1=0.1, shape2=0.1 ) ))

  #overlay curve from beta distribution
  alpha <- fit.beta$estimate[1]
  beta <- fit.beta$estimate[2]
  b <- rbeta(length(data),alpha,beta)
  lines(density(b))

我錯過了什么？

Answer 1

首先，您需要使用hist(..., freq=TRUE)作為直方圖。 然后，為了正確設置 y 軸范圍，您可以計算 Beta 分布的最大值（參見例如此處）。 最后，使用dbeta比生成隨機樣本然后估計密度要好得多：

maxibeta <- dbeta((alpha-1)/(alpha+beta-2), alpha, beta)
hist( (data-min(data)) / (max(data)-min(data)), 
      prob=TRUE, col="grey", border="white", ylim=c(0, maxibeta), 
      main="Histogram + fitted distribution")
plot(function(x) dbeta(x,alpha,beta), add=TRUE, col=2, lwd=2)

編輯：一個更通用的解決方案，但這讓我有點難過，因為它沒有使用 beta 發行版的好屬性：

fbeta <- function(x)  dbeta(x,alpha,beta)
maxibeta <- optimize(fbeta, interval = c(0,1), maximum = TRUE)$objective

histo <- hist((data-min(data)) / (max(data)-min(data)), plot = FALSE)

plot(histo, freq=FALSE, col="grey", border="white", 
     ylim=c(0, max(maxibeta, max(histo$density))), 
     main="Histogram + fitted distribution")
plot(fbeta, add=TRUE, col=2, lwd=2)

擬合經驗數據的分布

問題描述

1 個解決方案

解決方案1
0 已采納 2016-05-26 08:27:19

擬合經驗數據的分布

問題描述

1 個解決方案

解決方案1 0 已采納 2016-05-26 08:27:19

解決方案1
0 已采納 2016-05-26 08:27:19