簡體   English   中英

從 pd.crosstab 中的混淆矩陣中找到准確度

[英]Finding the accuracy from the confusion matrix in pd.crosstab

使用pd.crosstab ,我可以從我的預測數據中生成一個混淆矩陣。 我使用以下行來生成混淆矩陣:

pd.crosstab(test_data['class'], test_data['predicted'], margins = True)

同樣在 R 中,我可以使用下面的行生成混淆矩陣

confusion_matrix <- table(truth = data.test$class, prediction = predict(model, data.test[,-46], type = 'class'))

在 R 我可以使用這條線找到我的 model 的精度

sum(diag(confusion_matrix)) / sum(confusion_matrix)

在 Python 中,是否有sum(diag(confusion_matrix)) / sum(confusion_matrix)的等價物來計算我的混淆矩陣的准確性?

我寧願不使用除 pandas 以外的任何庫(例如 Scikit learn)。

您需要使用numpy ,首先在交叉表產品上使用np.diag以獲得對角線的總和,然后在求和之前將交叉表產品轉換為 numpy 數組:

import numpy as np
np.random.seed(123)
test_data = pd.DataFrame({'class':np.random.randint(0,2,10),
                        'predicted':np.random.randint(0,2,10)})

tab = pd.crosstab(test_data['class'], test_data['predicted'])

predicted   0   1
class       
0   4   3
1   0   3

tab = pd.crosstab(test_data['class'], test_data['predicted'])
np.diag(tab).sum() / tab.to_numpy().sum()
0.7

還是硬編碼? 不知道你為什么要這樣做:

(tab.iloc[0,0] + tab.iloc[1,1]) / tab.to_numpy().sum()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM