繁体   English   中英

如何在R中为统计模型对象编写S3公式方法

[英]How to write an S3 formula method for a statistical model object in R

我有一个函数可以对多元线性模型中的协方差矩阵的相等性进行Box的M检验。 我想使用公式方法将其转换为S3泛型函数,这是最自然的接口。

完整的当前代码位于https://gist.github.com/friendly/749b5a69a067e02b87dd 我可以将其全部粘贴到此处,但是也许该链接就足够了。

我不了解访问模型对象组件的函数中使用的很多魔术。 我将在leveneTest中的car包装中找到的代码用作模板,它解决了单变量模型的类似问题。

这是使用默认方法boxM.default的快速测试:

data(iris)
res <- boxM(iris[, 1:4], iris[, "Species"])
res

这给出了预期的结果:

>     data(iris)
>     res <- boxM(iris[, 1:4], iris[, "Species"])
>     res

        Box's M-test for Homogeneity of Covariance Matrices

data:  iris[, 1:4]
Chi-Sq (approx.) = 140.94, df = 20, p-value < 2.2e-16
> 

当我尝试直接调用公式方法boxM.formula ,它也起作用,给出与上述相同的输出。

boxM( cbind(Sepal.Length, Sepal.Width, Petal.Length, Petal.Width) ~ Species, data=iris)

但是,对boxM.lm方法的测试失败:

> iris.mod <- lm(cbind(Sepal.Length, Sepal.Width, Petal.Length, Petal.Width) ~ Species, data=iris)
> boxM(iris.mod)
Error in cbind(Sepal.Length, Sepal.Width, Petal.Length, Petal.Width) : 
  object 'Sepal.Length' not found
> traceback()
8: cbind(Sepal.Length, Sepal.Width, Petal.Length, Petal.Width)
7: eval(expr, envir, enclos)
6: eval(predvars, data, env)
5: model.frame.default(form, data)
4: model.frame(form, data) at boxM.R#59
3: boxM.formula(formula(y), data = model.frame(y), ...) at boxM.R#76
2: boxM.lm(iris.mod) at boxM.R#2
1: boxM(iris.mod)
>

我想我理解为什么会失败---与在model.frame()查找变量的环境有关,但与如何纠正它无关。

有人可以帮忙吗?

您设计的boxM函数可以将lm对象作为输入。 该实现尝试从lm提取公式和model.frame并与boxM.formula一起使用。

似乎model.frame(iris.mod)此问题的原因是因为model.frame(iris.mod)不会返回原始data.frame而是返回一个两列data.frame,其中第一列包含左侧变量矩阵,第二个是右侧的向量 您可以通过以下方式检查

class(model.frame(iris.mod))
dim(model.frame(iris.mod))
names(model.frame(iris.mod))
model.frame(iris.mod)[,1]
model.frame(iris.mod)[,2]

由于model.frame(iris.mod)已将数据解析为可计算格式, boxM.formula当输入lm对象时,可以应用boxM.default而不是boxM.formula 例如,这似乎起作用:

boxM.default(Y = model.frame(iris.mod)[,1], 
             group = model.frame(iris.mod)[,2])

#    Box's M-test for Homogeneity of Covariance Matrices

#data:  model.frame(iris.mod)[, 1]
#Chi-Sq (approx.) = 140.94, df = 20, p-value < 2.2e-16

解决此问题的同事说:“您被不规范的评估所咬。”

这是一个可行的解决方案,并且更普遍地符合模型对象的S3方法。 它在模型公式的环境中查找data

boxM.lm <- function(y, ...) {
  data <- getCall(y)$data
  y <- if (!is.null(data)) {
    data <- eval(data, envir = environment(formula(y)))
    update(y, formula(y), data = data)
  }
  else update(y, formula(y))

  boxM.formula(formula(y), data=eval(data, envir = environment(formula(y))), ...)
}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM