
[英]Cannot tune the mtry parameter in my random forest (with ranger) using Tidy models R
我正在尝试使用 tune() 和 R 中的 Tidy model 环境调整随机森林 model 的参数。我使用 ranger 作为引擎,这是一个分类 model,但我无法调整 mtry 参数。 我试过: 它适用于树和 min_n 参数,但如果我尝试使用 mtry = tune(),然后创建网格,则 ...
[英]Cannot tune the mtry parameter in my random forest (with ranger) using Tidy models R
我正在尝试使用 tune() 和 R 中的 Tidy model 环境调整随机森林 model 的参数。我使用 ranger 作为引擎,这是一个分类 model,但我无法调整 mtry 参数。 我试过: 它适用于树和 min_n 参数,但如果我尝试使用 mtry = tune(),然后创建网格,则 ...
[英]How can I get cuML RandomForestClassifier leafs?
我是cuML的新手,我有一个使用 scikit 学习的决策树分类器。 我想使用 GPU 执行一些超参数搜索,所以我开始寻找cuML 。 cuML 中没有DecisionTreeClassifier ,但据我在其他 SO 帖子中所读,它可以通过使用具有 1 棵树且没有引导程序的RandomFore ...
[英]How to classify ARFF file with no labels using a trained Random Forest model?
我有一个训练和测试 ARFF 文件数据集。 我通过从 6 波段图像和与每个坐标相关的标签中提取感兴趣区域来创建以下数据集。 使用上述数据,我训练了 RandomForest 并获得了一些看起来符合我预期的结果。 我有一个 ARFF 文件数据集。 它没有任何 class 属性 这是逐行生成的实际图像 ...
[英]why max_features hyperparameter is in this class sklearn.ensemble.RandomForestClassifier?
这个 class 是这样工作的: 考虑每个节点的“max_features”,以选择拆分然后 select 随机从“max_features”中选出一个特征。 (参考:书籍:使用 Scikit-Learn、Keras 和 Tensorflow 进行机器学习实践,第 199 页的页脚) 然后找到该 ...
[英]Use of which.max function to find and store a node value from a list of lists
使用 R 中的caret R ,我正在尝试微调和运行随机森林 (RF) 回归。 我正在关注本教程。 在微调过程中,我正在运行多个模型(保存在列表中),我正在搜索哪个max.nodes值给出 model 最高的R-squared 。 运行str(summary(results_mtry)) : 我想将 ...
[英]Error: Missing data in columns: pop when running random forest regression using the ranger package
我正在尝试使用 R 中的ranger R实现随机森林 (RF) 回归,但我收到此错误: Error: Missing data in columns: pop ( pop是我的自变量)在运行predict function 时。 作为参考,当使用randomForest package 时,我可以 ...
[英]scikit-learn RandomForestClassifier list all variables of an estimator tree?
我训练一个RandomForestClassifier作为 其中X和y是一些特征向量和标签。 完成拟合后,我可以列出森林中每个估计器生长的所有树木的深度,如下所示: 现在我想找出所有其他公共变量(除了max_depth )一个estimator stores 中的tree_ 。 所以我尝试了: 但 ...
[英]Export random forest regression residuals as a single raster?
我的目标是使用克里金方法缩小回归 model 的残差。 我在 R 中使用 randomForest package 来执行回归。 我的数据集包含一个因变量和一个自变量(栅格格式)。 当我导出随机森林 (RF) 回归的残差时,output 是一个堆叠栅格(500 个栅格,作为树的数量)。 我的问题是 ...
[英]Assigning weights to variables in random forest model in R
我正在尝试使用“tidymodels”中的“ranger”来拟合随机森林 model,并在为预测变量分配权重时出错。 在下面的可重现代码中,来自“iris”数据集的“Petal.Length”和“Petal.Width”是预测变量,我试图将它们分别乘以 1 和 2,因为我知道 Petal.Width ...
[英]Does n_jobs=-1 in scikit-learn use all cores? Or all available cores?
我正在使用 RandomForestRegressor,我想在不增加总运行时间的情况下使用最大数量的树。 我的可疑假设是,如果我的计算机有 100 个内核,通过指定数量为 100 的倍数的树,我将获得最大的收益。 这一定是真的吗? 回归任务是在超参数优化过程中执行的,并且由于我为此调整过程指定了 ...
[英]How can I predict time series data using random forest model in R?
当我尝试使用 function 'xts(x,order.by=as.yearmon)' 将年份和月份作为索引时,我遇到了一个问题。此外,我如何使用滞后值将数据拆分为训练和测试。 我对此没有任何意义。 我该怎么做? 是否有任何其他选项或方法可以让我使用随机森林 model 预测时间序列数据。请帮我 ...
[英]Random Forest Classifier predicts lower proportion of positive cases compared to the actual
我正在使用 scikit-learn 随机森林分类器来处理具有不平衡类的二元分类问题(负 class:80%,正 class:20%)。 当我将 model 应用于相同的训练数据集或测试数据集时,预测阳性 class 的比例明显低于数据中的实际比例(16% 对 20%)。 我希望预测类别的比例始终接 ...
[英]How to import Missingpy in Python
我已经尝试了论坛上发布的所有答案,但我一直收到此错误 我该如何更正此错误? 我已经尝试过这里发布的回复No module named 'sklearn.neighbors.base' still existed after all the suggestions what I can take但我 ...
[英]How can I select one plot from the partial dependence plot in R?
这是部分依赖 plot 的代码。我为此使用示例数据。 首先,我做了一个随机森林model。然后我做了一个部分依赖plot。 然后我得到如下结果。 我成功地获得了组合成一个大 plot 的多张图像。但是,我需要 select 这些情节中的任何一个。 有什么办法可以试试吗? ...
[英]how to show every each of the bootstrapped data / sampled data in random forest sklearn?
根据我对随机森林 alogirthm 的了解,该算法随机对原始数据集进行采样以构建新的采样/自举数据集。 采样数据集然后变成决策树。 在 scikit learn 中,您可以可视化随机森林中的每一棵树。 但我的问题是,如何显示每棵树的采样/自举数据集? 我想查看用于构建每棵树的特征和数据行。 ...
[英]RandomForestClassifier can't give me repdoucible results
我的问题是,即使我为RandomForestClassifier本身和 Train-Test-Split 实现了 Random_state(即使我认为这不是必需的,因为我正在使用shuffle = False - 由于时间序列数据). 请在下面找到我的代码,我已经尝试了以下问题的解决方案,但没有成功 ...
[英]Extracting estimates with ranger decision trees
我收到错误消息Error: No tidy method for objects of class ranger在尝试提取回归 model 的估计值时,该回归是使用 R 中的 ranger package 构建的。 这是我的代码: 下面是数据集中每个标记化术语的估计表(这是用于演示目的的脏数据集) ...
[英]What does ".best_estimator_" return? Why do 'best_estimator_[0]', 'best_estimator_[1]' show different random_state?
我正在尝试从“RandomizedSearchCV”中获取“best_estimator_”(最终我正在尝试从中获取 plot SHAP 图)。 为什么它返回可以通过索引访问的内容? 我知道它正在返回“搜索选择的估计器,即在遗漏数据上给出最高分的估计器”。 它不应该只返回一个估计器,而不是索引可以 ...
[英]R random forest aggregate vs individual prediction
请考虑这个随机森林回归估计的最小可重现示例 我期望通过rf_predict$aggregate和predict_mean获得相同的值这个假设在哪里以及为什么我错了? 我的最终目标是获得预测值的置信区间。 ...
[英]Get OOB score within a pipeline for Random Forest
我想知道机器学习项目:是否可以在管道内实施RandomForestRegressor ? 具体来说,我需要从RandomForestRegressor确定 OOB 分数。 但是我的数据需要大量的预处理。 我尝试了几件事,这是迄今为止最接近的:# Creation of the pipeline ...