繁体   English   中英

如何计算在R中的随机子样本中获得特定值的概率?

[英]How to calculate the probability of getting a specific value in a random subsample in R?

我有73栋房屋被归为某种疾病的阳性(1)或阴性(0)。 每行(73)是一栋房子,只有一列带有值。

house
1 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 1 0 0

我想知道如果我随机选择10栋房屋,至少有一个正数(1)的可能性。

我使用以下代码:

test <- replicate(1000, sample(house, size=10, replace = FALSE))
m <- sum(colSums(matrix(test %in% c("1"), nrow = 10)) > 0)
m/1000

m
[1] 0.909

我得到+/- 0.90的概率

然后我使用函数prop.test来获得置信区间

prop.test(m, 1000, conf.level=0.95, correct = FALSE)

1-sample proportions test without continuity correction

data:  m out of 1000, null probability 0.5
X-squared = 669.12, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
 0.8895744 0.9252953
sample estimates:
    p 
0.909 

我想知道是否可以通过此过程确认在10个样本中至少获得1个阳性的概率为0.909(CI 0.890-0.9250)

提前致谢!

首先,如果您要发布涉及随机抽样的代码,请确保设置种子,以便其他人可以跟随您的脚步:

set.seed(8675309)

我的意思不是嘴,但此问题的表达方式使您很难确切地说出您想在这里学习什么。

您已经给我们提供了一些数据,并询问了有关计算特定概率的信息,但是目前尚不清楚您是要对某些总体进行推断还是只是对计算所询问的概率感兴趣。

当然可以使用采样技术来估计概率,但这类似于购买整个乐高玩具只是为了得到一些特定的零件。

根据您的问题,我认为您的房屋清单中有15个“阳性”。 您只需要计算:

1 - phyper(0, 15, 73-15, 10)

0.916019

这就是您感兴趣的概率(an = 10样本中至少有一个阳性)。 另请注意,该数字不具有“可变性” 简单而简单的概率; 没有“不确定性”。 考虑到这一点,这种可能性真的是您追求的吗? 还是您要从某些理论人群中推断出1 +“正”的概率? 这73个房屋是该人群样本吗?

这是关于概率的问题。 在您的情况下,它是关于超几何分布的,可以通过以下方式来解析

phyper(1-0.5,length(dat[dat==1]),length(dat[dat==0]),10,lower.tail=F)
[1] 0.916019

这是获得至少1个标签为“ 1”的球的概率。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM