簡體   English   中英

使用不同樣本量的數據擬合 R 中的二項分布

[英]Fitting Binomial Distribution in R using data with varying sample sizes

我有一些看起來像這樣的數據:

    x    y
1:  3    1
2:  6    1
3:  1    0
4: 31    8
5:  1    0
---

(編輯:如果有幫助,這里是 x 和 y 的樣本向量

    x = c(3, 6, 1, 31, 1, 18, 73, 29, 2, 1)

    y = c(1, 1, 0, 8, 0, 0, 8, 1, 0, 0)

左側 (x) 列是我的樣本大小,右側 (y) 列是每個樣本中發生的成功次數。

我想使用二項式分布擬合這些數據,以便找到成功的概率 (p)。 到目前為止,我發現的所有擬合二項式分布的示例都假設所有數據點的樣本大小 (n) 不變,但在這里我有不同的樣本大小。

  1. 我如何將這些具有不同樣本量的數據擬合為二項式分布? 期望的結果是 p,即在樣本量為 1 時觀察到成功的概率。

  2. 我如何使用 R 完成這樣的擬合?

(編輯 #2:下面的響應概述了解決方案和相關的 R 代碼,如果我假設每個樣本中觀察到的事件可以被假定為獨立的,除了假設樣本本身也是獨立的。這適用於我的數據 - 謝謝! )

如何計算成功的經驗概率

x <- c(3, 6, 1, 31, 1, 18, 73, 29, 2, 1)
y <-  c(1, 1, 0, 8, 0, 0, 8, 1, 0, 0)

avr.sample <- mean(x)
avr.success <- mean(y)

p <- avr.success/avr.sample
[1] 0.1151515

或者使用binom.test

z <- x-y # number of fails
binom.test(x = c(sum(y), sum(z)))
Exact binomial test

data:  c(sum(y), sum(z))
number of successes = 19, number of trials = 165, p-value < 2.2e-16
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.07077061 0.17397215
sample estimates:
probability of success 
             0.1151515 

但是,這假設:

  1. 行對應的事件相互獨立
  2. 同一行中的事件也是相互獨立的

這意味着在實驗的每次迭代k (即x行)中,我們執行一個動作,例如扔x[k]相同的骰子(不一定是公平的骰子),成功意味着獲得一個給定(預定)的數字n 1:6 .

如果我們假設在每次迭代k拋出x[k]骰子時嘗試獲得1時獲得上述結果,那么可以說獲得1的經驗概率為 (~) 0.1151515

最后,所討論的分布將是B(sum(x), p)

PS:在上圖中,骰子不僅在任何給定迭代中彼此相同,而且在所有迭代中都是相同的。

library(bbmle)

x = c(3, 6, 1, 31, 1, 18, 73, 29, 2, 1)
y = c(1, 1, 0, 8, 0, 0, 8, 1, 0, 0)

mf = function(prob, x, size){
  -sum(dbinom(x, size, prob, log=TRUE))
}

m1 = mle2(mf, start=list(prob=0.01), data=list(x=y, size=x))
print(m1)

系數:概率 0.1151535

對數似然:-13.47

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM