繁体   English   中英

引导示例意味着在 R 中使用引导包,为 boot() 函数创建统计函数

[英]Bootstrapping sample means in R using boot Package, Creating the Statistic Function for boot() Function

我有一个包含 15 个密度计算的数据集,每个来自不同的横断面。 我想用替换对这些重新采样,从 15 个横断面中随机抽取 15 个样本,然后获得这些重新采样的平均值。 在此过程中,每个样带都应该有自己的个人概率被采样。 这应该做5000次。 我有一个代码可以在不使用引导函数的情况下执行此操作,但是如果我想使用引导包计算 BCa 95% CI,则需要首先通过引导函数完成引导。 我一直在尝试创建一个函数,但我无法得到任何似乎有效的函数。 我希望引导程序从某个列 (data$xs) 中进行选择,并且要使用的概率在列 data$prob 中。

我认为可能工作的功能是;

library(boot)
meanfun <- function (data, i){
    d<-data [i,]
    return (mean (d))   }
bo<-boot (data$xs, statistic=meanfun, R=5000)
#boot.ci (bo, conf=0.95, type="bca")  #obviously `bo` was not made

但这告诉我“维数不正确”

我理解如何在正常意义上创建一个函数,但该函数在 boot 中的工作方式似乎很奇怪。 由于该函数仅通过名称来引导,并且没有指定要传递给函数的参数,因此我似乎仅限于引导本身将作为参数传递的内容(例如,我无法将 data$xs 作为参数传递给函数)数据,我无法将 data$prob 作为概率参数传递,等等)。 它似乎真的限制了可以做的事情。 也许我错过了什么?

感谢您的任何帮助

此错误的原因是data$xs返回一个向量,然后您尝试按data [i, ]进行子集化。

解决此问题的一种方法是将其更改为data[i]或使用data[, "xs", drop = FALSE]代替。 drop = FALSE避免了类型强制,即。 将其保留为data.frame

我们尝试

data <- data.frame(xs = rnorm(15, 2))

library(boot)
meanfun <- function(data, i){
  d <- data[i, ]
  return(mean(d))   
}
bo <- boot(data[, "xs", drop = FALSE], statistic=meanfun, R=5000)
boot.ci(bo, conf=0.95, type="bca")

并获得:

BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 5000 bootstrap replicates

CALL : 
boot.ci(boot.out = bo, conf = 0.95, type = "bca")

Intervals : 
Level       BCa          
95%   ( 1.555,  2.534 )  
Calculations and Intervals on Original Scale

可以使用 boot.array 提取所有或一部分重采样集。 在这种情况下:

bo.ci<-boot.ci(boot.out = bo, conf = 0.95, type = "bca")


resampled.data<-boot.array(bo,1)

提取第一组和第二组重采样数据:

resample.1<-resampled.data[1,]
resample.2<-resampled.data[2,]

然后继续从任何子集中提取您想要的单个统计信息。 例如,如果您假设正常,您可以在第一个子集上运行学生的 t.test:

t.test(resample.1)

对于这个例子和特定的种子值给出:

数据:resample.1
t = 6.5216,df = 14,p 值 = 1.353e-05
备择假设:真实均值不等于 0
95% 置信区间:
5.234781 10.365219
样本估计:
x 的平均值
7.8

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM