标签[h2o] - 堆栈内存溢出

无法连接到 http://localhost:54321 - Can't connect to http://localhost:54321

我喜欢使用 lilikoi R package 提供的模拟数据运行 lilikoi 示例代码，但是，由于与 H2O 的连接错误，我被困在 lilikoi.machine_learning() 命令中。我下载了 H2O 文件并在 R 终端中解压缩，但现在我无法连接到 http://localhos ...

在 h2O 中使用分类特征时如何获得适当的特征重要性信息 - How to get proper feature importance information when using categorical feature in h2O

当我的数据集中有分类特征时， h20表示单热编码并开始训练过程。当我调用summary方法来查看特征重要性时，它会将每个编码的分类特征视为一个特征。我的问题是如何获取原始特征的特征重要性信息？运行 model 后，这里是h20报告的功能重要性摘要。有没有一种方法可以让我获得第0列的特征重要性 ...

如何将 H2O 苏打水模型保存到磁盘 - How do I save H2O Sparkling Water models to disk

我有一个 PySpark 代码来训练 H2o DRF model。我需要将这个 model 保存到磁盘然后加载它。我找不到关于此的任何文件，所以我在这里问这个问题。 ...

H2O 中的热编码数据会以某种方式影响 model 吗？ - Will Hot encoded data in H2O effect the model somehow?

我分别有热编码数据（单个主变量和30个变量下有多个类别）。我想知道这是否会影响 H2O 中的 GB、GL、DRF。文档说 XGBOOST 它在内部编码为单热对于深度学习模型，我可以使用所有因子参数，但我找不到如何停止隐式热编码或让它成为结果相同的方法？我已经阅读了 amazonaws 发布的 ...

调用 OneHotEncoding 结果变成 Java Heap Space Error - Calling OneHotEncoding results into Java Heap Space Error

在H2o中运行xGboost Package 时会抛出 Java 堆空间错误。但是当手动清除 memory 时，它工作正常。我经常使用 del df del something import gc gc.collect() 为了清除 memory。任何想法表示赞赏。错误跟踪： ...

如何保存基于 parsnip/agua 的 H2O 对象并再次检索它 - How to save parsnip/agua based H2O object and retrieve it again

赏金将在 5 天后到期。此问题的答案有资格获得+50声望赏金。 littleworth正在寻找可靠来源的答案。我有以下使用 tidymodels 的 agua 包的脚本：在那里我试图将auto_fit对象保存到一个文件中。但是当我试图检索它并用它来预测测试数据时：我收到一个错误：有什 ...

H2O 错误：“没有名称“领导者”的插槽 - Error with H2O: "no slot of name "leader"

在 Rstudio 的分类二进制问题中尝试使用 H2o Package 获取最重要的变量后，出现以下错误。 h（simpleError（msg，call））中的错误：在为 function 'h2o.varimp' 选择方法时评估参数 'object' 时出错：class“H2OBinomialM ...

H2O Python 因子列的 relevel 与 relevel_by_frequency - H2O Python relevel vs relevel_by_frequency for factor columns

根据 H2O 的文档，似乎relevel('most_frequency_category')和relevel_by_frequency()应该完成同样的事情。但是，系数估计值会有所不同，具体取决于使用哪种方法来设置因子列的参考水平。使用来自 sklearn 的开源数据集演示了在使用两种重新调 ...

H2O sklearn 包装器：如何从中获取 H2OAutoML object 并运行 explain()？ - H2O sklearn wrapper: how to get H2OAutoML object out of it and run explain()?

我正在使用来自 python 的h2o automl 库和 scikit-learn 包装器来创建一个管道来训练我的 model。我按照官方文档推荐的这个例子：所以，我已经训练了我的管道/模型，现在我想从H2OAutoMLClassifier包装器中获取一个H2OAutoML object 来调 ...

H2O 的 RMSE 性能报告不一致 - H2O's RMSE performance report not consistent

我想知道为什么h2o.performance报告与测试数据上rmse的标准定义不同。 h2o的业绩报告似乎夸大了。下面是一个代表。 iris_h2o = as.h2o(iris) parts = h2o.splitFrame(iris_h2o, ratios = c(0.5,0.25), see ...

Python h2o 生成错误：捕获异常：java.lang.NullPointerException - Python h2o generates Error: Caught exception: java.lang.NullPointerException

这是我的代码：它返回： h2o 服务器似乎运行良好。我不确定如何排除故障。更新根据下面的建议，这里是日志（可从 web gui 获得）。这个仅作为完整日志的部分日志文件不适合： ...

H2O XGboost 中 reg_alpha 和 reg_lambda 的可接受范围是多少？ - What's the acceptable range for reg_alpha and reg_lambda in H2O XGboost?

H2O 文档没有详细说明这两个超参数。它只说这些是 L1 和 L2 正则化参数，默认值为 0 和 1。我也找不到更多信息谷歌搜索它。有人可以提供任何见解吗？蒂亚！ ...

h2o xgboost 不平衡数据的糟糕表现 - Terrible performance with h2o xgboost imbalanced data

我有一个大约 1M 行的数据集，高度不平衡（743 / 1072780）。我正在使用以下参数在 h2o 中训练 xgboost model，它看起来像是过拟合 output 是：我使用的是 h2o 3.32.0.1 版本（因为这是一个要求），xgboost h2o 不支持 balance_cl ...

h20.init() 不工作给 h20connectionerror 和 h20startuperror - h20.init() Not working giving h20connectionerror and h20startuperror

嘿，我正在使用 anaconda 环境，并已成功安装 h20-py 库等。只是当我尝试运行 h2o.init() 时，它给了我以下错误任何帮助，将不胜感激。 PS我正在使用Jupyter Notebook ...

如何在 h2o automl pysparkling water 中获得领导者特征的重要性 - How to get the leader feature importances in h2o automl pysparkling water

我正在使用 spark 独立集群并在其中运行 h2o pysparkling。我找不到 function 来获取领导者特征的重要性。请帮忙代码： ...

Model_id 列铅板 H2O - Model_id Column Leadboard H2O

我无法理解H20 automl生成的模型！ output是这样的，例如： StackedEnsemble_AllModels_1_AutoML_1_20220809_134944 我如何知道堆叠使用了哪些基本模型？ ...

在 pysparkling 独立集群中设置 spark.ext.h2o.backend.cluster.mode=external 时出错 - Getting error while setting spark.ext.h2o.backend.cluster.mode=external in pysparkling standalone cluster

代码：火花提交命令： spark-submit --master spark://local:7077 --py-files sparkling-water-3.36.1.3-1-3.2/py/h2o_pysparkling_3.2-3.36.1.3-1-3.2.zip --conf "spar ...

H2O 中的负二项式偏差计算 - Negative Binomial Deviance Calculation in H2O

我一直在研究 H2O 中负二项式 model 的偏差计算（代码行 580/959），我很难解释为什么当 yr 或 ym 为 0 时它为 0。偏差计算公式如下（来自H2O 文档）：与数学一起，我看不到偏差为 0，除非 yr 和 ym 都为 0。有谁碰巧知道是否存在特殊情况，当 yr 和 ym ...

在 python spark 脚本中定义 H2OContext 时出现错误 - I am getting error while defining H2OContext in python spark script

代码：我正在使用 spark 独立集群 3.2.1 并尝试在 python 文件中启动 H2OContext。尝试使用 spark-submit 运行脚本时，出现以下错误：火花提交命令： spark-submit --master spark://local:7077 --packages ...

比较 Automl 的 output - comparing the output of Automl

当我在 azure、google 和 h2o 中运行 automl 时，我得到了不同的 output 的功能重要性。即使数据相同并且所有功能也相同。是什么原因造成的。有没有其他方法来比较模型 ...