这可能是一个幼稚的问题,但我想对随机森林 model 使用递归特征消除,并想看看我是否可以根据提供最小 RMSE 的特征集终止(如caret中的这个数字)? 我查看了文档,如果我没记错的话,它似乎默认终止于所选功能的一半? ...
这可能是一个幼稚的问题,但我想对随机森林 model 使用递归特征消除,并想看看我是否可以根据提供最小 RMSE 的特征集终止(如caret中的这个数字)? 我查看了文档,如果我没记错的话,它似乎默认终止于所选功能的一半? ...
我不想做 CV 并多次训练随机森林,而是想使用 OOB 误差作为广义误差的无偏估计。 对于少数数据点(几千个),使用 OOB 错误而不是 CV 是否有意义,因为可能只有少数数据点是 oob? 到目前为止,我只能从 mlr 的这个问题线程https://github.com/mlr-org/mlr/ ...
我的目标是使用使用某种滚动 CV 的mlr3 package 创建重采样。 更具体地说,我想在训练集中使用 n 个月的数据(比如 6 个月),在测试集中使用一个月的数据。 这是我的数据集的示例: 现在,我想在训练集中使用 20141 和 20142 月份,在测试集中使用 20143 月份。 我认为 ...
我想使用 R 的mlr3*包以可重现的方式构建 ML 算法。 我尝试将regr.glmboost学习器与mbo调谐器和run_time终止器一起使用。 我玩过 HPO 部分,但无法在更高的运行时间下重现它。 我go哪里错了? 这是关于这种现象的代表: 这些是我得到的有点不同的超参数: 家庭纽兰停止 ...
我是梯度提升 (XGBoost) 的新手。 我已经阅读了 mlr3 的手册,如果我理解正确,我想先调整我的超参数。 我不确定如何设置 term_evals? 在本教程中,它使用了一个非常小的数字,并表示对于实际应用程序需要更大的数字。 我怎么知道我选择的数字是否足够高? 非常感谢我用不同数量的 t ...
假设我有以下ParamSet object: 是否可以在不更改任何其他内容的情况下将minsplit重命名为survTree.minsplit ? 这样做的原因是我使用一些学习者作为GraphLearner的一部分,因此他们的参数名称发生了变化,我希望有一些代码在参数前面添加learner$id以 ...
我在 R 中使用 mlr3 package 创建多个分类学习器,并在相同的二进制分类任务上对它们进行基准测试。 我想用多种性能指标来评估学习者:召回、AUC、准确性和训练经过的时间。 我能够执行基准测试并获得所有测量的正确结果,除了经过时间,所有学习者报告为 0。 下面是我正在使用的代码: 我是否错 ...
我基于以下示例构建了一个自动化机器学习系统: https://mlr-org.com/gallery/2021-03-11-practical-tuning-series-build-an-automated-machine-learning-system/ 我使用了学习器 xgboost 和 R ...
我尝试在 mlr3 基准测试中用交互项和/或二次项拟合线性 model。 不幸的是,我没有在 github 或 stackexchange 上找到可能性。 这是一个例子: 这是版本信息: 谢谢! ...
我想使用 mlr3 交叉拟合半参数 model(如 TMLE 或 AIPW)中的有害参数。 交叉拟合过程类似于 k 折交叉验证; 将数据分成大小相等的 K 组,使用剩余组中的数据获得每个组的预测,以进行 model 训练。 但是,通过交叉拟合,我对 model 评估不感兴趣。 相反,我需要重用 K ...
我想调整一个xgboost学习器并将参数nrounds设置为参数early_stopping_rounds的 10%(以每次生成的为准)。 一般来说应该是一件简单的事情(即调整一个相对于另一个参数的参数),但我不能让它工作,见下面的例子:library(mlr3verse) #> Loadi ...
在研究了描述mlr3的源并查看了给定的示例之后,我仍然找不到任何关于如何在回归任务期间估算目标变量的答案,当它有缺失时。 我想使用 Ranger,但它无法处理目标变量中的缺失。 Output: 多亏了教程和 mlr3book,我很快就能够将缺失的指标和插补作为 pipeOp 包含在我的工作流程中, ...
日期:2022-08-17。 R 版本:4.0.3。 平台:x86_64-apple-darwin17.0(64位) 问题:在 mlr3(classif.task,学习者:随机森林)中,我使用自动超参数优化(HPO;mtry 在 1 和数据中的特征数量之间的范围内)和自动特征选择(单一标准:ms ...
我在 1 个数据集上构建了一个包含 4 个图形学习器的基准。 基准测试结果的 learner_id 很长,因为我有一些预处理。 我如何设置学习者 ID 以使其不会太长。 这是我的代码: 该结果中的learner_id太长,对autoplot(bmr)也不利。 如何设置 learner_id 以使 ...
我正在尝试使用超频带调整xgboost ,并且我想使用mlr3tuningspaces包中建议的默认调整空间。 但是,我没有找到如何在使用lts时用“预算”标记超参数。 下面,我复制了mlr3hyperband包示例来说明我的问题: library(mlr3verse) library(mlr3h ...
有一个 function 来调整这里描述的二进制分类的阈值: https://mlr3pipelines.mlr-org.com/reference/mlr_pipeops_t.nethreshold.html 这是我失败的尝试: 这在我的 mlr3 管道中不起作用,我没有在任何地方找到任何解释的 ...
我正在尝试从使用 mlr3proba 构建的生存模型构建一个 survxai 解释器。 我在创建解释器所需的 predict_function 时遇到问题。 有没有人尝试过构建这样的东西? 到目前为止,我的代码如下: 它引发以下错误: [.data.table (r6_private(back ...
我正在使用 mlr3 处理具有两类响应变量的不平衡数据集。 我想应用 SMOTE 方法对少数人进行过采样。 我了解到这种方法应该只在训练集上使用,而不是在测试集上使用。 但是,如果我没有误解的话,mlr3 管道会在设置任务之前操作整个数据集,在此任务期间数据集被拆分为训练集和测试集。 我想知道如何仅 ...
我正在使用带有 mlr3 的参数优化(随机搜索),但它给了我以下错误。 我也尝试过其他模型(kknn),但出现了同样的错误。 ...
我如何将grpreg package 与 mlr3(尤其是重采样等)一起使用? 我进行了搜索,发现了 create_learner function,但发现 arguments 令人困惑(我不知道使用 grpreg 函数时正确的 create_learner 参数值是什么)。 grpreg 与 ...