如何更改XGboost中的损耗矩阵（在R中）？

Question

我想将误报成本高于误报成本的二进制变量分类。

在rpart包中，我们使用损失矩阵，添加parms = list(loss=matrix(c(0,1,5,0),nrow=2))来将错误的示例错误分类为正值是正值的5倍而不是将一个正面的例子错误地归类为负面的代价。

如何使用XGboost做到这XGboost ？

Answer 1

您在寻找scale_pos_weight参数吗？

https://github.com/dmlc/xgboost/blob/master/doc/parameter.md

scale_pos_weight，[默认值= 1]控制正负权重的平衡，对不平衡类很有用。 需要考虑的典型值：sum（负数）/ sum（正数）有关更多讨论，请参见参数调整。 另请参见Higgs Kaggle竞争演示示例：R，py1，py2，py3

您可以使用类似：

clf = xgb.XGBRegressor(objective='binary:logistic', 
                       scale_pos_weight= 5,
                       max_depth=3,
                       n_estimators=100)

在python中，sklearn api。

Answer 2

假设您正在使用xgboost包，则可以使用watchlist参数。 它是xgb.DMatrix的列表，每个标签都标记有一个名称。 您可以使用eval.metric参数，也可以使用多个评估指标。

watchlist <- list(train=dtrain, test=dtest)

bst <- xgb.train(data=dtrain, max.depth=2, eta=1, nthread = 2,
eval.metric = "error", eval.metric = "logloss", nround=2,
watchlist=watchlist, objective = "binary:logistic")

如果xgboost github页面中的大量指标无法满足您的需求，那么正如他们所说，您可以生成自己的指标，例如，假阳性和假阴性的加权总和，其中假阳性的权重是假阴性的五倍。

如何更改XGboost中的损耗矩阵（在R中）？

问题描述

2 个解决方案

解决方案1
1 2017-04-12 22:13:53

解决方案2
-1 2016-01-25 13:48:38

如何更改XGboost中的损耗矩阵（在R中）？

问题描述

2 个解决方案

解决方案1 1 2017-04-12 22:13:53

解决方案2 -1 2016-01-25 13:48:38

解决方案1
1 2017-04-12 22:13:53

解决方案2
-1 2016-01-25 13:48:38