繁体   English   中英

科学工具分类阈值

[英]Sci-kit Classifying Thresholds

因此,我正在使用scikit-learn进行一些二进制分类,现在我正在尝试使用Logistic回归分类器。 在训练了分类器之后,我打印出分类结果以及它们在每个班级中的概率:

logreg = LogisticRegression()
logreg.fit(X_train,y_train)
print logreg.predict(X_test)
print logreg.predict_proba(X_test)

所以我得到类似:

[-1 1 1 -1 1 -1...-1]
[[  8.64625237e-01   1.35374763e-01]
 [  3.57441028e-01   6.42558972e-01]
 [  1.67970096e-01   8.32029904e-01]
 [  9.20026249e-01   7.99737513e-02]
 [  1.20456011e-02   9.87954399e-01]
 [  6.48565595e-01   3.51434405e-01]...]

等等...因此,只要概率超过0.5,就将其归类为该对象。 我正在寻找一种调整此数字的方法,例如,要被归类为1级,出现这种情况的概率必须超过0.7。 有没有办法做到这一点? 我一直在查看一些参数,例如“ tol”和“ weight”,但不确定它们是否在我想要的范围内,或者它们是否在起作用...

您可以像这样设置您的THRESHOLD

THRESHOLD = 0.7
preds = np.where(logreg.predict_proba(X_test)[:,1] > THRESHOLD, 1, 0)

请参考sklearn LogisticRegression并更改默认分类阈值

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM