簡體   English   中英

R - 通過自舉帶線性模型計算R平方和殘差標准誤差的95%置信區間

[英]R - calculating 95% confidence interval for R-squared and residual standard error by boot strap linear model

我是R的新手,我試圖計算R平方值的95%置信區間,線性模型的殘差標准誤差是通過使用bootstrap方法重新采樣響應變量形成的,然后通過回歸創建999個線性模型這些999引導響應變量在原始解釋變量上。

首先,我不確定是否應該為ORIGINAL線性模型(沒有自舉數據)計算R平方和殘差標准誤差的95%CI,因為這沒有意義 - R平方值對於該線性模型是100%精確,並且為它計算CI沒有意義。

那是對的嗎?

重要的是,我不確定如何計算我從自舉創建的999線性模型的R平方值和殘差標准誤差值的CI。

你絕對可以使用啟動包來執行此操作。 但是因為我可能會對你想要的東西感到困惑,我會一步一步走。

我編造了一些假數據

n=10
x=rnorm(n)
realerror=rnorm(n,0,.9)
beta=3
y=beta*x+realerror

建立一個空位來捕捉我感興趣的統計數據。

rsquared=NA
sse=NA

然后創建一個for循環,重新采樣數據,運行回歸並為每次迭代收集兩個統計信息。

for(i in 1:999)
{
   #create a vector of the index to resample data row-wise with replacement.
  use=sample(1:n,replace=T)

  lm1=summary(lm(y[use]~x[use]))  

  rsquared[i]=lm1$r.squared

  sse[i]=sum(lm1$residuals^2)
}

現在我想弄清楚置信區間,所以我訂購了它們並報告了(n * .025)th和(n * .975)第一順序統計

 sse=sse[order(sse)]
 rsquared=rsquared[order(rsquared)]

然后第25個是置信下限,第975個是置信上限

> sse[c(25,975)]
[1]  2.758037 18.027106
> rsquared[c(25,975)]
[1] 0.5613399 0.9795167

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM