我喜欢使用 lilikoi R package 提供的模拟数据运行 lilikoi 示例代码,但是,由于与 H2O 的连接错误,我被困在 lilikoi.machine_learning() 命令中。 我下载了 H2O 文件并在 R 终端中解压缩,但现在我无法连接到 http://localhos ...
我喜欢使用 lilikoi R package 提供的模拟数据运行 lilikoi 示例代码,但是,由于与 H2O 的连接错误,我被困在 lilikoi.machine_learning() 命令中。 我下载了 H2O 文件并在 R 终端中解压缩,但现在我无法连接到 http://localhos ...
当我的数据集中有分类特征时, h20表示单热编码并开始训练过程。 当我调用summary方法来查看特征重要性时,它会将每个编码的分类特征视为一个特征。 我的问题是如何获取原始特征的特征重要性信息? 运行 model 后,这里是h20报告的功能重要性摘要。 有没有一种方法可以让我获得第0列的特征重要性 ...
我有一个 PySpark 代码来训练 H2o DRF model。我需要将这个 model 保存到磁盘然后加载它。 我找不到关于此的任何文件,所以我在这里问这个问题。 ...
我分别有热编码数据(单个主变量和30个变量下有多个类别)。 我想知道这是否会影响 H2O 中的 GB、GL、DRF。 文档说 XGBOOST 它在内部编码为单热对于深度学习模型,我可以使用所有因子参数,但我找不到如何停止隐式热编码或让它成为结果相同的方法? 我已经阅读了 amazonaws 发布的 ...
在H2o中运行xGboost Package 时会抛出 Java 堆空间错误。 但是当手动清除 memory 时,它工作正常。 我经常使用 del df del something import gc gc.collect() 为了清除 memory。任何想法表示赞赏。 错误跟踪: ...
赏金将在 5 天后到期。 此问题的答案有资格获得+50声望赏金。 littleworth正在寻找可靠来源的答案。 我有以下使用 tidymodels 的 agua 包的脚本: 在那里我试图将auto_fit对象保存到一个文件中。 但是当我试图检索它并用它来预测测试数据时: 我收到一个错误: 有什 ...
在 Rstudio 的分类二进制问题中尝试使用 H2o Package 获取最重要的变量后,出现以下错误。 h(simpleError(msg,call))中的错误:在为 function 'h2o.varimp' 选择方法时评估参数 'object' 时出错:class“H2OBinomialM ...
根据 H2O 的文档,似乎relevel('most_frequency_category')和relevel_by_frequency()应该完成同样的事情。 但是,系数估计值会有所不同,具体取决于使用哪种方法来设置因子列的参考水平。 使用来自 sklearn 的开源数据集演示了在使用两种重新调 ...
我正在使用来自 python 的h2o automl 库和 scikit-learn 包装器来创建一个管道来训练我的 model。我按照官方文档推荐的这个例子: 所以,我已经训练了我的管道/模型,现在我想从H2OAutoMLClassifier包装器中获取一个H2OAutoML object 来调 ...
我想知道为什么h2o.performance报告与测试数据上rmse的标准定义不同。 h2o的业绩报告似乎夸大了。 下面是一个代表。 iris_h2o = as.h2o(iris) parts = h2o.splitFrame(iris_h2o, ratios = c(0.5,0.25), see ...
这是我的代码: 它返回: h2o 服务器似乎运行良好。 我不确定如何排除故障。 更新根据下面的建议,这里是日志(可从 web gui 获得)。 这个仅作为完整日志的部分日志文件不适合: ...
H2O 文档没有详细说明这两个超参数。 它只说这些是 L1 和 L2 正则化参数,默认值为 0 和 1。我也找不到更多信息谷歌搜索它。 有人可以提供任何见解吗? 蒂亚! ...
我有一个大约 1M 行的数据集,高度不平衡(743 / 1072780)。 我正在使用以下参数在 h2o 中训练 xgboost model,它看起来像是过拟合 output 是: 我使用的是 h2o 3.32.0.1 版本(因为这是一个要求),xgboost h2o 不支持 balance_cl ...
嘿,我正在使用 anaconda 环境,并已成功安装 h20-py 库等。 只是当我尝试运行 h2o.init() 时,它给了我以下错误 任何帮助,将不胜感激。 PS我正在使用Jupyter Notebook ...
我正在使用 spark 独立集群并在其中运行 h2o pysparkling。 我找不到 function 来获取领导者特征的重要性。 请帮忙代码: ...
我无法理解H20 automl生成的模型! output是这样的,例如: StackedEnsemble_AllModels_1_AutoML_1_20220809_134944 我如何知道堆叠使用了哪些基本模型? ...
代码: 火花提交命令: spark-submit --master spark://local:7077 --py-files sparkling-water-3.36.1.3-1-3.2/py/h2o_pysparkling_3.2-3.36.1.3-1-3.2.zip --conf "spar ...
我一直在研究 H2O 中负二项式 model 的偏差计算( 代码行 580/959),我很难解释为什么当 yr 或 ym 为 0 时它为 0。 偏差计算公式如下(来自H2O 文档): 与数学一起,我看不到偏差为 0,除非 yr 和 ym 都为 0。 有谁碰巧知道是否存在特殊情况,当 yr 和 ym ...
代码: 我正在使用 spark 独立集群 3.2.1 并尝试在 python 文件中启动 H2OContext。 尝试使用 spark-submit 运行脚本时,出现以下错误: 火花提交命令: spark-submit --master spark://local:7077 --packages ...
当我在 azure、google 和 h2o 中运行 automl 时,我得到了不同的 output 的功能重要性。 即使数据相同并且所有功能也相同。 是什么原因造成的。 有没有其他方法来比较模型 ...