使用 Gaussian NB 的多类分类，给出相同的 output 的准确度、精度和 f1 分数

Question

我是 Python 和分类算法的新手。 我正在使用 GaussianNB 进行 NSL KDD 数据集的多类分类，最后我需要获得精度、召回率、f1 分数的值。

from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import recall_score
from sklearn.metrics import f1_score
from sklearn.metrics import confusion_matrix, zero_one_loss
from sklearn.metrics import classification_report

from sklearn.naive_bayes import GaussianNB

gnb = GaussianNB()
y_pred = gnb.fit(train_x, train_Y).predict(test_x)

results_nm = confusion_matrix(test_Y,y_pred)
#print(results_nm)
print(classification_report(test_Y,y_pred))
print(accuracy_score(test_Y,y_pred))
print("Precision Score : ",precision_score(test_Y,y_pred, 
                                           pos_label='positive',
                                           average='micro'))
print("Recall Score : ",recall_score(test_Y,y_pred, 
                                           pos_label='positive',
                                           average='micro'))
print(f1_score(test_Y,y_pred,average='micro'))

我按照sklearn metrics for multiclass classification的类似问题中的说明进行操作。

output 如下，但我得到的所有三个都是相同的 output。 这可能是什么原因？

Answer 1

这可能会发生，正如您在混淆矩阵中看到的那样，所有 3 个指标的微观平均值实际上是相同的。

在微平均法中，你对不同集合的系统的个体真阳性、假阳性和假阴性求和，并应用它们来获得统计数据。 例如，对于一组数据，系统的

True positive (TP1)  = 12
False positive (FP1) = 5
False negative (FN1) = 10

那么精度 (P1) 和召回率 (R1) 将是 (12/(12+5)) 和 (12/(12+10))

如果 FP1 == FN1，那么它们都是一样的。

对于不同的数据集，系统的

True positive (TP2)  = 50
False positive (FP2) = 7
False negative (FN2) = 7

那么精度（P2）和召回率（R2）将是相同的。

现在，使用微平均方法的系统的平均精度和召回率为

微平均 F 分数将只是这两个数字的调和平均值。

因此，对于FP和FN的特定值，所有这些指标都可能相同。 从方程中，我们可以说，如果FP1 + FP2 == FN1 + FN2 ，那么微平均精度和召回率将是相同的。

您可以通过多种方式将值放入等式中，以便所有 3 个指标给出相同的值，因此您可以尝试宏观平均或加权平均。

使用 Gaussian NB 的多类分类，给出相同的 output 的准确度、精度和 f1 分数

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-05-02 01:21:29

使用 Gaussian NB 的多类分类，给出相同的 output 的准确度、精度和 f1 分数

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-05-02 01:21:29

解决方案1
1 已采纳 2020-05-02 01:21:29