使用分类预测变量进行回归的标准化系数：出了点问题

Question

据我了解，标准化系数可以用作效果大小的指标（可以使用经验法则，例如Cohen's 1988）。 我还了解到，标准化系数以标准偏差表示，这使它们相对接近Cohen的d。

我还了解，获取标准化系数的一种方法是预先对数据进行标准化。 另一个方法是使用MuMIn包中的std.coef函数。

使用线性预测变量时，这两种方法是等效的：

library(tidyverse)
library(MuMIn) # For stds coefs


df <- iris %>% 
  select(Sepal.Length, Sepal.Width) %>% 
  scale() %>% 
  as.data.frame() %>% 
  mutate(Species = iris$Species)


fit <- lm(Sepal.Length ~ Sepal.Width, data=df)
round(coef(fit), 2)
round(MuMIn::std.coef(fit, partial.sd = TRUE), 2)

在这两种情况下，系数均为-0.12。 我将其解释为： 对于Sepal.Width的每1标准偏差增加，Sepal.Length减小其SD的0.12 。

但是，这两种方法在分类预测器中得出的结果不同 ：

fit <- lm(Sepal.Length ~ Species, data=df)
round(coef(fit), 2)
round(MuMIn::std.coef(fit, partial.sd = TRUE), 2)

相比于setosa（截距），1.12和0.46，其给出对于云芝的效果。

我应该说什么能说“ 杂色和setosa之间的区别是Sepal.Length的SD的……”？ 非常感谢

Answer 1

您没有标准化与Species相关的隐式变量，因此这些系数不会标准化。

您可以这样做，如下所示：

dummies <- scale(contrasts(df$Species)[df$Species,])
fit <- lm(Sepal.Length ~ dummies, data = df)
round(coef(fit), 2)
#      (Intercept) dummiesversicolor  dummiesvirginica 
#             0.00              0.53              0.90

如果将partial.sd参数设置为FALSE则这与MuMIn::std.coef的结果一致。

使用分类预测变量进行回归的标准化系数：出了点问题

问题描述

1 个解决方案

解决方案1
2 已采纳 2018-07-11 16:25:22

使用分类预测变量进行回归的标准化系数：出了点问题

问题描述

1 个解决方案

解决方案1 2 已采纳 2018-07-11 16:25:22

解决方案1
2 已采纳 2018-07-11 16:25:22