繁体   English   中英

解释R中glmnet中的系数名称

[英]Interpreting coefficient names in glmnet in R

我使用glmnet使用以下代码基于一组5个功能预测概率。 我需要实际的公式,因为我需要在不同的(非R)程序中使用它。

deg = 3

glmnet.fit <- cv.glmnet(poly(train.matrix,degree=deg),train.result,alpha=0.05,family='binomial')

结果系数的名称有五个位置(我假设这是每个特征之一),并且它们中的每一个都是0到3之间的数字(我假设这是多项式的次数)。 但我仍然对如何重建公式感到困惑。

以这些为例:

> coef(glmnet.fit,s= best.lambda)  
(Intercept) -2.25e-01  
...
0.1.0.0.1    3.72e+02
1.1.0.0.1    9.22e+04
0.2.0.0.1    6.17e+02
...

我们称之为A,B,C,D,E。 这是如何解释公式的?

Y =
-2.25e-01 +
...
(3.72e+02 * (B * E) +
(9.22e+04 * (A * B * E) +
(6.17e+02 * (B^2 + E)
...

如果这不正确我该如何解释呢?

我看到了以下问题和答案,但它没有解决这些类型的系数名称。

在此先感谢您的帮助。

通常,我们使用预测函数。 在您的情况下,您需要在另一个程序中使用系数。 我们可以检查使用预测和数据乘以系数的结果之间的一致性。

# example data

library(ElemStatLearn) 
library(glmnet) 
data(prostate) 

# training data 

data.train <- prostate[prostate$train,] 
y <- data.train$lpsa 

# isolate predictors

data.train <- as.matrix(data.train[,-c(9,10)]) 

# test data

data.test <- prostate[!prostate$train,] 
data.test <-  as.matrix(data.test[,-c(9,10)]) 

# fit training model 

myglmnet =cv.glmnet(data.train,y) 

# predictions by using predict function 

yhat_enet <- predict(myglmnet,newx=data.test, s="lambda.min") 

#  get predictions by using coefficients 

beta  <- as.vector( t(coef(myglmnet,s="lambda.min"))) 

# Coefficients are returned on the scale of the original data. 
# note we need to add column  of 1s for intercept

testX <- cbind(1,data.test) 
yhat2  <- testX %*% beta 

# check by plotting predictions  

plot(yhat2,yhat_enet)

因此,每个系数对应于训练数据中的一列。 第一个对应截距。 总之,您可以提取系数并乘以测试数据以获得您感兴趣的结果。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM