如何在Decision tree sklearn中计算精确回忆？

Question

I try to predict in standard dataset "iris.csv" 我尝试在标准数据集“iris.csv”中进行预测

import pandas as pd
from sklearn import tree
df = pd.read_csv('iris.csv')
df.columns = ['X1', 'X2', 'X3', 'X4', 'Y']
df.head()

# Decision tree
from sklearn.model_selection import train_test_split
decision = tree.DecisionTreeClassifier(criterion='gini')
X = df.values[:, 0:4]
Y = df.values[:, 4]
trainX, testX, trainY, testY = train_test_split(X, Y, test_size=0.25)
decision.fit(trainX, trainY)
y_score = decision.score(testX, testY)
print('Accuracy: ', y_score)


# Compute the average precision score
from sklearn.metrics import average_precision_score
average_precision = average_precision_score(testY, y_score)

print('Average precision-recall score: {0:0.2f}'.format(
      average_precision))

And i have valueerror 我有价值感

File "C:/Users/Ultra/PycharmProjects/poker_ML/decision_tree.py", line 20, in <module>
    average_precision = average_precision_score(testY, y_score)
  File "C:\Users\Ultra\PycharmProjects\poker_ML\venv\lib\site-packages\sklearn\metrics\ranking.py", line 241, in average_precision_score
    average, sample_weight=sample_weight)
  File "C:\Users\Ultra\PycharmProjects\poker_ML\venv\lib\site-packages\sklearn\metrics\base.py", line 74, in _average_binary_score
    raise ValueError("{0} format is not supported".format(y_type))
ValueError: multiclass format is not supported

How can I compute precision-recall for 3 class? 如何计算3级的精确召回？ How works precision-recall for decision tree in sklearn. 如何在sklearn中对决策树进行精确调用。 Maybe I have a mistake in calculation "y_score"? 也许我在计算“y_score”时有错误？

Answer 1

According to scikit-learn docs average_precision_score cannot handle multiclass classification. 根据scikit-learn docs， average_precision_score无法处理多类分类。

Instead, you may use precision_score like this: 相反，您可以像这样使用precision_score ：

# Decision tree
...
y_pred = decision.predict(testX)
y_score = decision.score(testX, testY)
print('Accuracy: ', y_score)

# Compute the average precision score
from sklearn.metrics import precision_score
micro_precision = precision_score(y_pred, testY, average='micro')
print('Micro-averaged precision score: {0:0.2f}'.format(
      micro_precision))

macro_precision = precision_score(y_pred, testY, average='macro')
print('Macro-averaged precision score: {0:0.2f}'.format(
      macro_precision))

per_class_precision = precision_score(y_pred, testY, average=None)
print('Per-class precision score:', per_class_precision)

Note, that you need to specify how to average the scores. 请注意，您需要指定如何平均分数。 This is especially relevant, if your dataset shows label imbalance (which iris does not). 如果您的数据集显示标签不平衡（ iris没有），这尤其相关。

如何在Decision tree sklearn中计算精确回忆？

问题描述

1 个解决方案

解决方案1
4 已采纳 2018-12-25 10:53:40

如何在Decision tree sklearn中计算精确回忆？

问题描述

1 个解决方案

解决方案1 4 已采纳 2018-12-25 10:53:40

解决方案1
4 已采纳 2018-12-25 10:53:40