[英]Sci-kit Classifying Thresholds
因此,我正在使用scikit-learn進行一些二進制分類,現在我正在嘗試使用Logistic回歸分類器。 在訓練了分類器之后,我打印出分類結果以及它們在每個班級中的概率:
logreg = LogisticRegression()
logreg.fit(X_train,y_train)
print logreg.predict(X_test)
print logreg.predict_proba(X_test)
所以我得到類似:
[-1 1 1 -1 1 -1...-1]
[[ 8.64625237e-01 1.35374763e-01]
[ 3.57441028e-01 6.42558972e-01]
[ 1.67970096e-01 8.32029904e-01]
[ 9.20026249e-01 7.99737513e-02]
[ 1.20456011e-02 9.87954399e-01]
[ 6.48565595e-01 3.51434405e-01]...]
等等...因此,只要概率超過0.5,就將其歸類為該對象。 我正在尋找一種調整此數字的方法,例如,要被歸類為1級,出現這種情況的概率必須超過0.7。 有沒有辦法做到這一點? 我一直在查看一些參數,例如“ tol”和“ weight”,但不確定它們是否在我想要的范圍內,或者它們是否在起作用...
您可以像這樣設置您的THRESHOLD
THRESHOLD = 0.7
preds = np.where(logreg.predict_proba(X_test)[:,1] > THRESHOLD, 1, 0)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.