![](/img/trans.png)
[英]How to generate a negative binomial distribution with different sample sizes for power analyses in R?
[英]Fitting Binomial Distribution in R using data with varying sample sizes
我有一些看起来像这样的数据:
x y
1: 3 1
2: 6 1
3: 1 0
4: 31 8
5: 1 0
---
(编辑:如果有帮助,这里是 x 和 y 的样本向量
x = c(3, 6, 1, 31, 1, 18, 73, 29, 2, 1)
y = c(1, 1, 0, 8, 0, 0, 8, 1, 0, 0)
左侧 (x) 列是我的样本大小,右侧 (y) 列是每个样本中发生的成功次数。
我想使用二项式分布拟合这些数据,以便找到成功的概率 (p)。 到目前为止,我发现的所有拟合二项式分布的示例都假设所有数据点的样本大小 (n) 不变,但在这里我有不同的样本大小。
我如何将这些具有不同样本量的数据拟合为二项式分布? 期望的结果是 p,即在样本量为 1 时观察到成功的概率。
我如何使用 R 完成这样的拟合?
(编辑 #2:下面的响应概述了解决方案和相关的 R 代码,如果我假设每个样本中观察到的事件可以被假定为独立的,除了假设样本本身也是独立的。这适用于我的数据 - 谢谢! )
如何计算成功的经验概率
x <- c(3, 6, 1, 31, 1, 18, 73, 29, 2, 1)
y <- c(1, 1, 0, 8, 0, 0, 8, 1, 0, 0)
avr.sample <- mean(x)
avr.success <- mean(y)
p <- avr.success/avr.sample
[1] 0.1151515
或者使用binom.test
z <- x-y # number of fails
binom.test(x = c(sum(y), sum(z)))
Exact binomial test
data: c(sum(y), sum(z))
number of successes = 19, number of trials = 165, p-value < 2.2e-16
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.07077061 0.17397215
sample estimates:
probability of success
0.1151515
但是,这假设:
这意味着在实验的每次迭代k
(即x
行)中,我们执行一个动作,例如扔x[k]
相同的骰子(不一定是公平的骰子),成功意味着获得一个给定(预定)的数字n
1:6
.
如果我们假设在每次迭代k
抛出x[k]
骰子时尝试获得1
时获得上述结果,那么可以说获得1
的经验概率为 (~) 0.1151515
。
最后,所讨论的分布将是B(sum(x), p)
。
PS:在上图中,骰子不仅在任何给定迭代中彼此相同,而且在所有迭代中都是相同的。
library(bbmle)
x = c(3, 6, 1, 31, 1, 18, 73, 29, 2, 1)
y = c(1, 1, 0, 8, 0, 0, 8, 1, 0, 0)
mf = function(prob, x, size){
-sum(dbinom(x, size, prob, log=TRUE))
}
m1 = mle2(mf, start=list(prob=0.01), data=list(x=y, size=x))
print(m1)
系数:概率 0.1151535
对数似然:-13.47
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.