簡體   English   中英

通過引導程序的唯一標識符對R塊進行重采樣

[英]R block resampling by unique identifier for bootstrap

我正在嘗試使用R阻止引導數據集。我在縣中有公司的數據框。 我想對要替換的縣進行抽樣,然后用該縣的樣本中的所有公司構建數據集(並進行替換)。 我對新數據集進行回歸。 然后我再次采樣。

我有一個for循環,其工作方式如下:

for(j in 1:10000){
y=NULL
for(i in 1:length(unique(data$firm_id))){
    y=rbind(y, data[which(data$county_id==sample(unique(data$county_id), replace=T)[i]),])
}
    a=rbind(a, lm(profit~employees, data=y)$coefficients)
}

不幸的是,R中的這種for循環非常慢並且計算量很大。 是否可以使用更有效的套用功能來實現?

這樣的事情可能會有所幫助:

positions<-replicate(1000, sample(1:nrow(df), nrow(df), T))

apply(positions, 2, function(i) lm(yvar[i]~xvar[i], df)$coef)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM