簡體   English   中英

MATLAB 中的歸一化直方圖不正確?

[英]Normalized histogram in MATLAB incorrect?

我有以下一組數據:

X=[4.692
   6.328
   4.677
   6.836
   5.032
   5.269
   5.732
   5.083
   4.772
   4.659
   4.564
   5.627
   4.959
   4.631
   6.407
   4.747
   4.920
   4.771
   5.308
   5.200
   5.242
   4.738
   4.758
   4.725
   4.808
   4.618
   4.638
   7.829
   7.702
   4.659]; % Sample set

我使用最大似然方法對此進行了帕累托分布的擬合,並獲得了下圖:

在此處輸入圖片說明

以下代碼用於繪制直方圖:

[N,edges,bin] = histcounts(X,'BinMethod','auto');
bin_middles=mean([edges(1:end-1);edges(2:end)]);
f_X_sample=N/trapz(bin_middles,N);
bar(bin_middles,f_X_sample,1);;

我這樣做對嗎? 我檢查了 100 次,帕累托分布確實是最優的,但它似乎與直方圖截然不同。 是否存在可能導致此問題的錯誤? 謝謝!

我同意@tashuhka 的評論,即您需要考慮如何對數據進行分箱。

想象一下極端情況,您將所有東西都放在一個 bin 中,然后嘗試將該單個點擬合到一個分布中。 您的 PDF 看起來與您的單個方形條完全不同。 分成兩個 bin,現在擬合仍然很糟糕,但至少一個條形(可能)比另一個大一點,等等。在另一個極端,每個數據點都有自己的條形,條形圖是只是一個只有一個計數的隨機酒吧森林。

有多種不同的策略可用於選擇“最佳”bin 大小,以最小化bin數量但最大化底層 PDF 的表示。

最后,請注意這里只有 30 分,所以您的另一個問題可能是您沒有收集足夠的數據來真正確定底層 PDF。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM