在R中使用coeftest加速线性回归

Question

我开发了一个R代码，该代码需要计算超过1000万次相同的多元回归模型（15个变量）。 我需要为每个模型提取仅针对一个自变量的t统计量。 我需要为每个模型应用异方差一致的协方差矩阵估计器，并且正在通过coeftest和vcovHC使用怀特估计器进行此操作，但是我注意到此操作增加了仿真所需的计算时间。 因此，我想知道是否有一种方法可以加快代码速度，因为我只需要第二个变量的t统计量即可。

以下是我在每次迭代中所做的一个玩具示例：

   model <- lm(y ~ a + b + c, data = data)
   model <- coeftest(model, vcov. = vcovHC(model, type = "HC"))
   t[i] <- summary(MUR)$coef[2, 3]

所涉及的变量总是相同的，但是我正在随机排列它们的值。 换句话说，我置换模型矩阵X。

Answer 1

使用car包装的hccm函数然后直接提取t值，可以减少约30％的处理异方差校正的协方差矩阵的计算。 请参见下面的模拟：

library(lmtest)
library(sandwich)
library(microbenchmark)
library(ggplot2)
library(car)

microbenchmark(
    hccm =   {
    m <- lm(cty ~ displ + cyl, data = mpg)
    V <- hccm(m, "hc0")
    cfs <- m$coefficients
    ses <- sqrt(diag(V))
    cfs / ses
  },
  coeftest = {
    m <- lm(cty ~ displ + cyl, data = mpg) 
    coeftest(m, vcov. = vcovHC(m, type = "HC0"))
  }
)

输出：

Unit: milliseconds
     expr      min       lq     mean   median       uq      max neval cld
     hccm 1.695146 1.777919 1.939631 1.822293 1.891840 10.65045   100  a 
 coeftest 2.557013 2.650025 2.735701 2.684586 2.764373  3.37536   100   b

在R中使用coeftest加速线性回归

问题描述

1 个解决方案

解决方案1
0 2019-08-01 20:28:58

在R中使用coeftest加速线性回归

问题描述

1 个解决方案

解决方案1 0 2019-08-01 20:28:58

解决方案1
0 2019-08-01 20:28:58