使用不同样本量的数据拟合 R 中的二项分布

Question

我有一些看起来像这样的数据：

（编辑：如果有帮助，这里是 x 和 y 的样本向量

    x = c(3, 6, 1, 31, 1, 18, 73, 29, 2, 1)

    y = c(1, 1, 0, 8, 0, 0, 8, 1, 0, 0)

左侧 (x) 列是我的样本大小，右侧 (y) 列是每个样本中发生的成功次数。

我想使用二项式分布拟合这些数据，以便找到成功的概率 (p)。 到目前为止，我发现的所有拟合二项式分布的示例都假设所有数据点的样本大小 (n) 不变，但在这里我有不同的样本大小。

我如何将这些具有不同样本量的数据拟合为二项式分布？ 期望的结果是 p，即在样本量为 1 时观察到成功的概率。
我如何使用 R 完成这样的拟合？

（编辑 #2：下面的响应概述了解决方案和相关的 R 代码，如果我假设每个样本中观察到的事件可以被假定为独立的，除了假设样本本身也是独立的。这适用于我的数据 - 谢谢！ )

Answer 1

如何计算成功的经验概率

x <- c(3, 6, 1, 31, 1, 18, 73, 29, 2, 1)
y <-  c(1, 1, 0, 8, 0, 0, 8, 1, 0, 0)

avr.sample <- mean(x)
avr.success <- mean(y)

p <- avr.success/avr.sample
[1] 0.1151515

或者使用binom.test

z <- x-y # number of fails
binom.test(x = c(sum(y), sum(z)))
Exact binomial test

data:  c(sum(y), sum(z))
number of successes = 19, number of trials = 165, p-value < 2.2e-16
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.07077061 0.17397215
sample estimates:
probability of success 
             0.1151515

但是，这假设：

行对应的事件相互独立
同一行中的事件也是相互独立的

这意味着在实验的每次迭代k （即x行）中，我们执行一个动作，例如扔x[k]相同的骰子（不一定是公平的骰子），成功意味着获得一个给定（预定）的数字n 1:6 .

如果我们假设在每次迭代k抛出x[k]骰子时尝试获得1时获得上述结果，那么可以说获得1的经验概率为 (~) 0.1151515 。

最后，所讨论的分布将是B(sum(x), p) 。

PS：在上图中，骰子不仅在任何给定迭代中彼此相同，而且在所有迭代中都是相同的。

Answer 2

library(bbmle)

x = c(3, 6, 1, 31, 1, 18, 73, 29, 2, 1)
y = c(1, 1, 0, 8, 0, 0, 8, 1, 0, 0)

mf = function(prob, x, size){
  -sum(dbinom(x, size, prob, log=TRUE))
}

m1 = mle2(mf, start=list(prob=0.01), data=list(x=y, size=x))
print(m1)

系数：概率 0.1151535

对数似然：-13.47

使用不同样本量的数据拟合 R 中的二项分布

问题描述

2 个解决方案

解决方案1
0 已采纳 2018-03-26 20:33:29

解决方案2
0 2021-01-02 02:59:35

使用不同样本量的数据拟合 R 中的二项分布

问题描述

2 个解决方案

解决方案1 0 已采纳 2018-03-26 20:33:29

解决方案2 0 2021-01-02 02:59:35

解决方案1
0 已采纳 2018-03-26 20:33:29

解决方案2
0 2021-01-02 02:59:35