[英]XGBoost decision tree selection
我有一个问题,我应该从XGBoost
选择XGBoost
。
我将使用以下代码作为示例。
#import packages
import xgboost as xgb
import matplotlib.pyplot as plt
# create DMatrix
df_dmatrix = xgb.DMatrix(data = X, label = y)
# set up parameter dictionary
params = {"objective":"reg:linear", "max_depth":2}
#train the model
xg_reg = xgb.train(params = params, dtrain = df_dmatrix, num_boost_round = 10)
#plot the tree
xgb.plot_tree(xg_reg, num_trees = n) # my question related to here
我在xg_reg
模型中创建了10棵树,并且可以通过在上一个代码中将n
设置为等于树的索引来绘制其中的任何一棵。
我的问题是:我怎么知道哪棵树最能解释数据集? 它总是最后一个吗? 还是应该确定要包含在树中的要素,然后选择包含要素的树?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.