簡體   English   中英

通過分類變量級別估計h2o glm系數

[英]estimate h2o glm coefficients by a categorical variable level

我想通過h2o glm中的分類變量級別來估計預測變量的系數。 例如,如果我的數據框具有產品價格(連續變量)和產品類型(類別變量),那么我想估計按產品價格的系數。 在SAS中,您可以通過將模型效果指定為price * type來輕松完成此操作。 如何在h2o或R中做同樣的事情?

有一個interacts()函數,但是它不能處理連續變量和分類變量之間的相互作用。 有什么技巧可以解決這個問題?

非常感謝,

set.seed(1234)
x1 = rnorm(100,0,1)
x2 = as.factor(rep(c("A","B","C","D"), each = 25))
y = as.factor(rep(0:1, each = 50))
data = data.frame(x1 = x1, x2 = x2, y = y)

可以在公式參數中使用“:”指定互動

# glm base example
fit <- glm(data = data, y ~ x1 + x2 + x1:x2, family = "binomial")
print(fit)

使用h2o.glm成對交互可以通過將列索引傳遞給interacts參數來指定

# h2o.glm example
library("h2o")
h2o.init(nthreads = -1)
data.hex = as.h2o(data)
h2o_fit <- h2o.glm(x = 1:2, y = 3, training_frame = data.hex, family = "binomial", interactions = 1:2)
h2o_fit@model$coefficients_table
h2o.shutdown(prompt = F)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM