[英]Combining regression summary outputs from multiple samples into a single dataframe in R
[英]R regression on multiple samples
我正在使用 R
隨着時間的推移,我有一個面板數據集,其中包含 250 個人的約 5000 次觀察。
我需要在差異回歸中建立差異,因此我對每個人進行隨機觀察並運行回歸:
lm(x ~ x1 + x2 + ... , data = ddply(df,.(individual),function(x) x[sample(nrow(x),1),]))
在生成的樣本上。
我需要對n 個不同的隨機樣本計算n
次回歸,並計算每個估計量的平均值。
有沒有一種方法可以在不手動計算和平均n
回歸的情況下有效地做到這一點?
解決了:
我希望找到一個特定的 package 來完成它,但我卻構建了一個 function。 例如,對於 n = 700
fun <- function(alfa){
alfa <-ddply(df,.(individual),function(x) x[sample(nrow(x),1),])
beta <- lm(x ~ x1 + x2 + ... , data = alfa )$coefficients
return(beta)
}
df.full <- replicate(700,fun(alfa))
這樣就創建了一個 700 行的數據集,系數名稱為行。 我什至可以做這樣的事情:
fun <- function(alfa){
alfa <-ddply(df,.(individual),function(x) x[sample(nrow(x),1),])
beta <- lm(x ~ x1 + x2 + ... , data = alfa)
gamma <- summary(beta)[["coefficients"]][,1]
return(gamma)
}
df.full <- replicate(700,fun(alfa))
將 [,1] 更改為 [,2] 我將獲得標准錯誤。 在此之后,直接進行手段的計算。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.