约束 H2O GLM 中的截距项

Question

我熟悉如何在h2o.glm() 约束 Betas （回归参数h2o.glm() ，但很难理解如何扩展它以约束截距。

（我知道intercept=FALSE将其约束为零，但我对非零约束感兴趣。）

概念示例数据集：

n <- 100

set.seed(1)

getPoints <- function(n){
    rbind(
        data.frame(col= factor('red', levels=c('red','blue')), 
                   x1 = rnorm(n=n,mean=11,sd = 2), 
                   x2 = rnorm(n=n,mean=5,sd=1)),
        data.frame(col='blue', 
                   x1 = rnorm(n=n,mean=13,sd = 2), 
                   x2 = rnorm(n=n,mean=7,sd=1))
        )
}

df1     <- getPoints(n)

示例约束：

param_names <- c('Intercept', 'x1', 'x2')
param_vals  <- c(       27.5, -1.1, -2.7)

beta_const_df <- data.frame(names = c('Intercept','x1','x2'),
                            lower_bounds = param_vals-0.1,
                            upper_bounds = param_vals+0.1,
                            beta_start   = param_vals)

如果我省略“拦截”约束，约束将起作用：

glm1 <- h2o.glm(x=c('x1','x2'),
                y='col',
                family='binomial',
                lambda=0,
                alpha=0,
                training_frame = 'df1',
                beta_constraints=beta_const_df[-1,] 
                )
glm1@model$coefficients
# Intercept        x1        x2 
#  27.68408  -1.00000  -2.60000

但是如果我包含一个“拦截”约束，其他约束也会失败。

glm2 <- h2o.glm(x=c('x1','x2'),
                y='col',
                family='binomial',
                lambda=0,
                alpha=0,
                training_frame = 'df1',
                beta_constraints=beta_const_df)   
glm2@model$coefficients
#  Intercept          x1          x2 
# 0.67783085 -0.01185921 -0.03083395

限制拦截的正确语法是什么？

Answer 1

尝试将standardize参数设置为等于 False（如下面的代码所示），您可以在此处阅读有关 beta_constraints 参数的更多信息：

glm1 <- h2o.glm(x=c('x1','x2'),
                y='col',
                family='binomial',
                lambda=0,
                alpha=0,
                training_frame = as.h2o(df1),
                beta_constraints=beta_const_df,
                standardize = F
)
glm1@model$coefficients
> glm1@model$coefficients
#Intercept        x1        x2 
#27.6      -1.0      -2.6

Answer 2

如果所有约束都严格相等，则解决方法

我可以对偏离beta_given造成严重的 L2 惩罚rho ，似乎这里支持Intercept ：

beta_const_df <- data.frame(names = c('Intercept','x1','x2'),
                            #lower_bounds = param_vals-0.1, #don't bound
                            #upper_bounds = param_vals+0.1,
                            #beta_start   = param_vals, # use beta_given
                            beta_given   = param_vals, # new
                            rho          = 1e9 )       # new

然后这有效：

glm2 <- h2o.glm(x=c('x1','x2'),
                y='col',
                family='binomial',
                lambda=0,
                alpha=0,
                training_frame = 'df1',
                beta_constraints=beta_const_df)

glm2@model$coefficients
# Intercept        x1        x2 
#      27.5      -1.1      -2.7 
all.equal(glm2@model$coefficients, param_vals, check.names=FALSE) # TRUE

这仅在您具有所有相等约束（不明确的上限和下限）时才有效。

无论哪种方式，仍然想知道是否有更简单的方法来做到这一点。

约束 H2O GLM 中的截距项

问题描述

2 个解决方案

解决方案1
1 已采纳 2019-01-16 23:40:55

解决方案2
0 2019-01-16 19:39:59

约束 H2O GLM 中的截距项

问题描述

2 个解决方案

解决方案1 1 已采纳 2019-01-16 23:40:55

解决方案2 0 2019-01-16 19:39:59

解决方案1
1 已采纳 2019-01-16 23:40:55

解决方案2
0 2019-01-16 19:39:59