獲取由lm（）返回的“ mlm”對象的回歸系數的置信區間

Question

我正在使用2個結果變量和5個預測變量進行多元回歸。 我想獲得所有回歸系數的置信區間。 通常我使用函數lm但它似乎不適用於多元回歸模型（對象mlm ）。

這是一個可復制的示例。

library(car)
mod <- lm(cbind(income, prestige) ~ education + women, data=Prestige)
confint(mod) # doesn't return anything.

還有其他替代方法嗎？ （我可以只使用標准誤差的值乘以正確的臨界t值，但我想知道是否有更簡單的方法來做到這一點）。

Answer 1

這來自predict.lm示例。 您需要interval = 'confidence'選項。

x <- rnorm(15)
y <- x + rnorm(15)
predict(lm(y ~ x))
new <- data.frame(x = seq(-3, 3, 0.5))
predict(lm(y ~ x), new, se.fit = TRUE)
pred.w.clim <- predict(lm(y ~ x), new, interval = "confidence")
matplot(new$x, pred.w.clim,
        lty = c(1,2,2,3,3), type = "l", ylab = "predicted y")

Answer 2

confint不會返回任何信息，因為不支持“ mlm”方法：

methods(confint)
#[1] confint.default confint.glm*    confint.lm      confint.nls*

如您所說，我們可以正負一些標准誤差，以得到置信區間的上限/下限。 您可能打算通過coef(summary(mod)) ，然后使用一些*apply方法提取標准錯誤。 但是，我對獲得lm()返回的“ mlm”對象的回歸系數的標准誤差的標准答案，為您提供了一種無需查看summary即可獲得標准誤差的高效方法。 將std_mlm應用於示例模型可以得到：

se <- std_mlm(mod)
#                 income   prestige
#(Intercept) 1162.299027 3.54212524
#education    103.731410 0.31612316
#women          8.921229 0.02718759

現在，我們定義另一個小函數來計算上下限：

## add "mlm" method to generic function "confint"
confint.mlm <- function (model, level = 0.95) {
  beta <- coef(model)
  se <- std_mlm (model)
  alpha <- qt((1 - level) / 2, df = model$df.residual)
  list(lower = beta + alpha * se, upper = beta - alpha * se)
  }

## call "confint"
confint(mod)

#$lower
#                 income    prestige
#(Intercept) -3798.25140 -15.7825086
#education     739.05564   4.8005390
#women         -81.75738  -0.1469923
#
#$upper
#                income    prestige
#(Intercept)  814.25546 -1.72581876
#education   1150.70689  6.05505285
#women        -46.35407 -0.03910015

這很容易解釋。 例如，對於響應income ，所有變量的95％置信區間為

#(intercept)    (-3798.25140, 814.25546)
#  education    (739.05564, 1150.70689)
#      women    (-81.75738, -46.35407)

Answer 3

似乎最近（2018年7月）在R-devel列表上對此進行了討論，因此希望在R的下一版本中將其修復。 該列表上建議的解決方法是使用：

confint.mlm <- function (object, level = 0.95, ...) {
  cf <- coef(object)
  ncfs <- as.numeric(cf)
  a <- (1 - level)/2
  a <- c(a, 1 - a)
  fac <- qt(a, object$df.residual)
  pct <- stats:::format.perc(a, 3)
  ses <- sqrt(diag(vcov(object)))
  ci <- ncfs + ses %o% fac
  setNames(data.frame(ci),pct)
}

測試：

fit_mlm <- lm(cbind(mpg, disp) ~ wt, mtcars)
confint(fit_mlm)

得到：

                       2.5 %     97.5 %
mpg:(Intercept)    33.450500  41.119753
mpg:wt             -6.486308  -4.202635
disp:(Intercept) -204.091436 -58.205395
disp:wt            90.757897 134.198380

就個人而言，我喜歡用干凈的方式（使用broom::tidy會更好，但當前存在問題）

library(tidyverse)
confint(fit_mlm) %>% 
  rownames_to_column() %>% 
  separate(rowname, c("response", "term"), sep=":")

得到：

  response        term       2.5 %     97.5 %
1      mpg (Intercept)   33.450500  41.119753
2      mpg          wt   -6.486308  -4.202635
3     disp (Intercept) -204.091436 -58.205395
4     disp          wt   90.757897 134.198380

獲取由lm（）返回的“ mlm”對象的回歸系數的置信區間

問題描述

3 個解決方案

解決方案1
0 2015-02-10 21:46:41

解決方案2
0 已采納 2016-10-07 23:13:50

解決方案3
0 2018-10-11 16:38:05

獲取由lm（）返回的“ mlm”對象的回歸系數的置信區間

問題描述

3 個解決方案

解決方案1 0 2015-02-10 21:46:41

解決方案2 0 已采納 2016-10-07 23:13:50

解決方案3 0 2018-10-11 16:38:05

解決方案1
0 2015-02-10 21:46:41

解決方案2
0 已采納 2016-10-07 23:13:50

解決方案3
0 2018-10-11 16:38:05