簡體   English   中英

Scipy / Numpy / scikits - 根據兩個數組計算精確度/召回分數

[英]Scipy/Numpy/scikits - calculating precision/recall scores based on two arrays

  • 我適合Logistic回歸模型,並使用以下內容基於訓練數據集訓練模型
 import scikits as sklearn from sklearn.linear_model import LogisticRegression lr = LogisticRegression(C=0.1, penalty='l1') model = lr.fit(training[:,0:-1], training[:,-1) 
  • 我有一個交叉驗證數據集,其中包含與輸入矩陣相關聯的標簽,可以作為

CV [:, - 1]

  • 我針對訓練的模型運行交叉驗證數據集,該模型根據預測返回0和1的列表

cv_predict = model.predict(cv [:,0:-1])

我想根據實際標簽和預測標簽計算精度和召回分數。 是否有標准的方法來使用numpy / scipy / scikits?

謝謝

是的,請參閱文檔: http//scikit-learn.org/stable/modules/classes.html#classification-metrics

您還應該查看sklearn.metrics.classification_report實用程序:

>>> from sklearn.metrics import classification_report
>>> from sklearn.linear_model import SGDClassifier
>>> from sklearn.datasets import load_digits

>>> digits = load_digits()
>>> n_samples, n_features = digits.data.shape
>>> n_split = n_samples / 2

>>> clf = SGDClassifier().fit(digits.data[:n_split], digits.target[:n_split])

>>> predictions = clf.predict(digits.data[n_split:])
>>> expected = digits.target[n_split:]

>>> print classification_report(expected, predictions)
             precision    recall  f1-score   support

          0       0.90      0.98      0.93        88
          1       0.81      0.69      0.75        91
          2       0.94      0.98      0.96        86
          3       0.94      0.85      0.89        91
          4       0.90      0.93      0.91        92
          5       0.92      0.92      0.92        91
          6       0.92      0.97      0.94        91
          7       1.00      0.85      0.92        89
          8       0.71      0.89      0.79        88
          9       0.89      0.83      0.86        92

avg / total       0.89      0.89      0.89       899

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM