f-score：ValueError：分类指标无法处理多标签指标和连续多输出目标的混合

Question

我正在尝试为我的模型所做的预测计算微 F 度量。 我使用带有 Keras 和 Tensorflow 的 word2vec Vectors 训练模型。 我使用 scikit 库来计算 mirco F 度量。

但该函数抛出此消息：

ValueError: Classification metrics can't handle a mix of multilabel-indicator and continuous-multioutput targets

另外，我做的预测正确吗？ 我在x_train(wordVectors)和y_train(resultVectors)上训练了模型，并使用x_test和y_test验证。

现在我对x_test进行了预测，并想使用y_test评估预测。 到目前为止我做得对吗？

预测数组如下所示：

[[ 1.7533608e-02  5.8055294e+01  2.2185498e-03 ... -1.2394511e-03
   1.0454212e+00 -1.6698670e-03]
 [ 1.7539740e-02  5.8173992e+01  2.1747553e-03 ... -1.2764656e-03
   1.0475068e+00 -1.6941782e-03]
 [ 1.7591618e-02  5.8222389e+01  2.2053251e-03 ... -1.2856000e-03
   1.0484750e+00 -1.6668942e-03] ...

真实值如下所示：

[[0 0 0 ... 0 0 0]
 [0 0 0 ... 0 0 0]
 [0 0 0 ... 0 0 0]...

我已经尝试将两个数组转换为二进制值（使用np.argmax(..., axis=1) ）。 然后没有错误，我得到了大约 0.59 的微 F 测量值......这太高了，所以我认为我犯了一个错误。 我的问题是是否有另一种转换数据的方法？ 我可以将预测转换为多标签指标值吗？

model = load_model('model.h5')
prediction = model.predict(x_test)

prediction_binary = np.argmax(prediction, axis=1)
y_test_binary = np.argmax(y_test, axis=1)

print(f1_score(y_test_binary, prediction_binary, average='micro'))

我期望输出 <0.20 但相反，我得到 0.59，这是一个太好的值。

Answer 1

问题是您仅在输出向量的最高值预测的标签上计算指标，并且只有一个测试向量值。

事实上， np.argmax只返回一个值，即使向量有几个最小值。 例如np.argmax([0,0,1,0,1,1])将只返回 2。

由于您的问题包含一个多标签分类问题，您希望您的输入可能被分类为多个类别。 为此，您必须将分类器的输出向量转换为与测试向量相同的形状。

你可以这样做：

prediction_int = np.zeroes_like(prediction)
prediction_int[prediction > 0.5] = 1

f-score：ValueError：分类指标无法处理多标签指标和连续多输出目标的混合

问题描述

1 个解决方案

解决方案1
0 已采纳 2019-06-07 10:13:09

f-score：ValueError：分类指标无法处理多标签指标和连续多输出目标的混合

问题描述

1 个解决方案

解决方案1 0 已采纳 2019-06-07 10:13:09

解决方案1
0 已采纳 2019-06-07 10:13:09