多類分類的每類 F1 分數

Question

我正在使用 python 和 scikit-learn 處理多類分類問題。 目前，我正在使用classification_report函數來評估classification_report的性能，獲得如下報告：

>>> print(classification_report(y_true, y_pred, target_names=target_names))
             precision    recall  f1-score   support

    class 0       0.50      1.00      0.67         1
    class 1       0.00      0.00      0.00         1
    class 2       1.00      0.67      0.80         3

avg / total       0.70      0.60      0.61         5

為了做進一步的分析，我對獲得每個可用類的每類 f1 分數很感興趣。 也許是這樣的：

>>> print(calculate_f1_score(y_true, y_pred, target_class='class 0'))
0.67

scikit-learn 上有類似的東西嗎？

Answer 1

取自f1_score 文檔。

from sklearn.metrics import f1_score
y_true = [0, 1, 2, 0, 1, 2]
y_pred = [0, 2, 1, 0, 0, 1]

f1_score(y_true, y_pred, average=None)

輸出：

array([ 0.8,  0. ,  0. ])

這是每個班級的分數。

Answer 2

如果您只有混淆矩陣C ，行對應於預測，列對應於事實，則可以使用以下函數計算 F1 分數：

def f1(C):
    num_classes = np.shape(C)[0]
    f1_score = np.zeros(shape=(num_classes,), dtype='float32')
    weights = np.sum(C, axis=0)/np.sum(C)

    for j in range(num_classes):
        tp = np.sum(C[j, j])
        fp = np.sum(C[j, np.concatenate((np.arange(0, j), np.arange(j+1, num_classes)))])
        fn = np.sum(C[np.concatenate((np.arange(0, j), np.arange(j+1, num_classes))), j])
#         tn = np.sum(C[np.concatenate((np.arange(0, j), np.arange(j+1, num_classes))), np.concatenate((np.arange(0, j), np.arange(j+1, num_classes)))])

        precision = tp/(tp+fp) if (tp+fp) > 0 else 0
        recall = tp/(tp+fn) if (tp+fn) > 0 else 0
        f1_score[j] = 2*precision*recall/(precision + recall)*weights[j] if (precision + recall) > 0 else 0

    f1_score = np.sum(f1_score)
    return f1_score

Answer 3

您只需要使用 pos_label 作為參數並分配要打印的類值。

f1_score(ytest, ypred_prob, pos_label=0)# default is pos_label=1

Answer 4

我會使用f1_score和labels參數

from sklearn.metrics import f1_score
y_true = [0, 1, 2, 0, 1, 2]
y_pred = [0, 2, 1, 0, 0, 1]
labels = [0, 1, 2]

f1_scores = f1_score(y_true, y_pred, average=None, labels=labels)
f1_scores_with_labels = {label:score for label,score in zip(labels, f1_scores)}

輸出：

{0: 0.8, 1: 0.0, 2: 0.0}

多類分類的每類 F1 分數

問題描述

4 個解決方案

解決方案1
27 已采納 2016-06-03 14:51:46

解決方案2
0 2019-10-01 01:23:22

解決方案3
0 2020-11-03 20:26:40

解決方案4
0 2021-12-17 10:48:57

多類分類的每類 F1 分數

問題描述

4 個解決方案

解決方案1 27 已采納 2016-06-03 14:51:46

解決方案2 0 2019-10-01 01:23:22

解決方案3 0 2020-11-03 20:26:40

解決方案4 0 2021-12-17 10:48:57

解決方案1
27 已采納 2016-06-03 14:51:46

解決方案2
0 2019-10-01 01:23:22

解決方案3
0 2020-11-03 20:26:40

解決方案4
0 2021-12-17 10:48:57