评估逻辑回归中的预测器性能（glm、glmnet R）

Question

我想评估逻辑回归模型 (mymodel1) 中每个预测器的性能。 这些是预测变量的显着性分数，所有值都 < .05。 这意味着所有预测变量都是显着的（同样重要？？）。 我如何衡量从每个人获得的重要性/信息？

z <- summary(mymodel1)$coefficients/summary(mymodel1)$standard.errors
p <- (1 - pnorm(abs(z), 0, 1)) * 2
p
(Intercept)        alpha         beta gamma theta
2 0.000000e+00 0.000000e+00 0.000000e+00     0     0
3 0.000000e+00 0.000000e+00 0.000000e+00     0     0
4 2.644718e-05 4.905187e-11 7.112932e-06     0     0
5 0.000000e+00 0.000000e+00 0.000000e+00     0     0
6 0.000000e+00 0.000000e+00 0.000000e+00     0     0

Answer 1

围绕这个话题有很多争论。 对一种方法投票而不是另一种方法真的很难。 尽管如此，我还是列出了一些用于评估单个预测变量贡献的方法。

标准化回归系数

绝对值越高贡献越大。 我也看到了以下表格

= 标准化 Co.Eff 的绝对值/总和（所有标准化 Co.Eff 的绝对值）

卡方统计

卡方值越高，贡献越大。 但是，卡方值并不能说明大小。

对数似然值

您使用单个预测器运行回归并将对数似然值 (-2LL) 与完整模型对数似然进行比较。

注意：这些都是近似值，我还没有遇到一种严格的方法来计算预测变量的贡献

Answer 2

为了确定预测器性能（也称为特征重要性），您可以考虑在样本中混洗每个预测器变量的值（基本上创建一个随机变量）...

在样本中混洗或随机化一个预测变量
创建模型并使用适当的指标评分……如果您可以使用不同的交叉折叠迭代创建多个模型来构建评分分布，则最好。 记录分数。
对每个预测变量重复过程（步骤 1 和 2）。
使用统计数据查看和/或测量导致模型性能下降幅度最大的变量。

本质上，您刚刚通过“删除”它来确定为模型贡献最多信息的变量。

评估逻辑回归中的预测器性能（glm、glmnet R）

问题描述

2 个解决方案

解决方案1
1 2015-08-21 18:32:25

解决方案2
0 2020-03-06 23:33:58

评估逻辑回归中的预测器性能（glm、glmnet R）

问题描述

2 个解决方案

解决方案1 1 2015-08-21 18:32:25

解决方案2 0 2020-03-06 23:33:58

解决方案1
1 2015-08-21 18:32:25

解决方案2
0 2020-03-06 23:33:58