解释R如何在Logistic回归中编写虚拟响应变量

Question

我是新手，在解释逻辑回归的输出时遇到麻烦。 我的响应变量有两个值-“ Multiplex”和“ subterraneus”。 当在“ microtus.train”数据帧上使用factor（）函数时，我将依次获得“多重和地下”。 在拟合模型并预测响应后，我很难理解概率的含义。 这些概率是否表示观测结果为“地下”的概率？ 当我使用“ contrasts（microtus.train $ Group）”语句时，得到了下表。

> contrasts(microtus.train$Group)
             subterraneus
multiplex               0
subterraneus            1

基于此表，我认为该模型正在尝试预测“地下神经”的概率（而不是“多重”概率），因为“ 1”是针对“地下神经”的伪编码。 我的假设正确吗？

下面提供了我的代码，非常感谢您的帮助。

library(Flury)
data(microtus, package = "Flury")

str(microtus)
summary(microtus)

# Creating training & test data frames
microtus.train <- subset(microtus, 
                     microtus$Group %in% c("multiplex", "subterraneus"), 
                     select = c("Group", "M1Left", "M2Left", "M3Left", 
                                "Foramen", "Pbone","Length", "Height",
                                "Rostrum") )

# Drop 3rd factor level
microtus.train$Group = droplevels(microtus.train$Group)
factor(microtus.train$Group)


nullModel.GLM <- glm(Group ~ 1, data = microtus.train, 
                     family = binomial())
fullModel.GLM <- glm(Group ~ ., data = microtus.train, 
                     family = binomial())
summary(nullModel.GLM)
summary(fullModel.GLM)

stepFwd.GLM <- step(nullModel.GLM, scope = list(upper = fullModel.GLM), 
                    direction = 'forward', k = 2)
stepFwd.GLM.fitResults <- predict(stepFwd.GLM, type = 'response')
stepFwd.GLM.fitResults

contrasts(microtus.train$Group)

Answer 1

关键不是对比度，而是因子级别的顺序（对比度指定预测变量如何编码为虚拟变量）。 来自?glm ：

对于“二项式”和“准二项式”族，也可以将响应指定为“因子”（当第一级表示失败而其他所有级别都表示成功时）

由于R默认情况下按字母顺序定义因子的级别，“（可能）是第一个级别，而“地下”是第二个级别，因此逻辑回归预测了“地下”的可能性。 您可以使用levels(microtus$Group) ，并在必要时通过将factor()显式设置为levels参数来进行调整。

解释R如何在Logistic回归中编写虚拟响应变量

问题描述

1 个解决方案

解决方案1
1 已采纳 2017-12-10 01:43:11

解释R如何在Logistic回归中编写虚拟响应变量

问题描述

1 个解决方案

解决方案1 1 已采纳 2017-12-10 01:43:11

解决方案1
1 已采纳 2017-12-10 01:43:11