cost 111 ms
在 h2O 中使用分类特征时如何获得适当的特征重要性信息 - How to get proper feature importance information when using categorical feature in h2O

当我的数据集中有分类特征时, h20表示单热编码并开始训练过程。 当我调用summary方法来查看特征重要性时,它会将每个编码的分类特征视为一个特征。 我的问题是如何获取原始特征的特征重要性信息? 运行 model 后,这里是h20报告的功能重要性摘要。 有没有一种方法可以让我获得第0列的特征重要性 ...

H2O 中的热编码数据会以某种方式影响 model 吗? - Will Hot encoded data in H2O effect the model somehow?

我分别有热编码数据(单个主变量和30个变量下有多个类别)。 我想知道这是否会影响 H2O 中的 GB、GL、DRF。 文档说 XGBOOST 它在内部编码为单热对于深度学习模型,我可以使用所有因子参数,但我找不到如何停止隐式热编码或让它成为结果相同的方法? 我已经阅读了 amazonaws 发布的 ...

如何保存基于 parsnip/agua 的 H2O 对象并再次检索它 - How to save parsnip/agua based H2O object and retrieve it again

赏金将在 5 天后到期。 此问题的答案有资格获得+50声望赏金。 littleworth正在寻找可靠来源的答案。 我有以下使用 tidymodels 的 agua 包的脚本: 在那里我试图将auto_fit对象保存到一个文件中。 但是当我试图检索它并用它来预测测试数据时: 我收到一个错误: 有什 ...

H2O Python 因子列的 relevel 与 relevel_by_frequency - H2O Python relevel vs relevel_by_frequency for factor columns

根据 H2O 的文档,似乎relevel('most_frequency_category')和relevel_by_frequency()应该完成同样的事情。 但是,系数估计值会有所不同,具体取决于使用哪种方法来设置因子列的参考水平。 使用来自 sklearn 的开源数据集演示了在使用两种重新调 ...

H2O sklearn 包装器:如何从中获取 H2OAutoML object 并运行 explain()? - H2O sklearn wrapper: how to get H2OAutoML object out of it and run explain()?

我正在使用来自 python 的h2o automl 库和 scikit-learn 包装器来创建一个管道来训练我的 model。我按照官方文档推荐的这个例子: 所以,我已经训练了我的管道/模型,现在我想从H2OAutoMLClassifier包装器中获取一个H2OAutoML object 来调 ...

H2O 中的负二项式偏差计算 - Negative Binomial Deviance Calculation in H2O

我一直在研究 H2O 中负二项式 model 的偏差计算( 代码行 580/959),我很难解释为什么当 yr 或 ym 为 0 时它为 0。 偏差计算公式如下(来自H2O 文档): 与数学一起,我看不到偏差为 0,除非 yr 和 ym 都为 0。 有谁碰巧知道是否存在特殊情况,当 yr 和 ym ...

2022-08-03 02:34:07   1   29    glm / h2o  

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM