科學工具分類閾值

Question

因此，我正在使用scikit-learn進行一些二進制分類，現在我正在嘗試使用Logistic回歸分類器。 在訓練了分類器之后，我打印出分類結果以及它們在每個班級中的概率：

logreg = LogisticRegression()
logreg.fit(X_train,y_train)
print logreg.predict(X_test)
print logreg.predict_proba(X_test)

所以我得到類似：

[-1 1 1 -1 1 -1...-1]
[[  8.64625237e-01   1.35374763e-01]
 [  3.57441028e-01   6.42558972e-01]
 [  1.67970096e-01   8.32029904e-01]
 [  9.20026249e-01   7.99737513e-02]
 [  1.20456011e-02   9.87954399e-01]
 [  6.48565595e-01   3.51434405e-01]...]

等等...因此，只要概率超過0.5，就將其歸類為該對象。 我正在尋找一種調整此數字的方法，例如，要被歸類為1級，出現這種情況的概率必須超過0.7。 有沒有辦法做到這一點？ 我一直在查看一些參數，例如“ tol”和“ weight”，但不確定它們是否在我想要的范圍內，或者它們是否在起作用...

Answer 1

您可以像這樣設置您的THRESHOLD

THRESHOLD = 0.7
preds = np.where(logreg.predict_proba(X_test)[:,1] > THRESHOLD, 1, 0)

請參考sklearn LogisticRegression並更改默認分類閾值

科學工具分類閾值

問題描述

1 個解決方案

解決方案1
0 2018-09-10 08:16:04

科學工具分類閾值

問題描述

1 個解決方案

解決方案1 0 2018-09-10 08:16:04

解決方案1
0 2018-09-10 08:16:04