如何使用 Python 绘制 ROC 曲线和准确度？

Question

从由 va1、val1 和权重组成的数据帧中，我创建了一个训练集和一个测试集。 我使用了一些指标并将它们与测试集进行了比较。 相应的（真）值保存在 True_positive_df 数据帧内，而不匹配的值保存在 False_positive_df 数据帧内。

True_positive_df:

val1  val2  weight
123   345   67.09
453   256   43.51
...   ...   ...

False_positive_df:

val1  val2 weight
789   878 90.23
782   293  62.53 
...   ...  ...

我想创建一条 ROC 曲线并计算计算的准确性。 我如何使用这两个数据框来做到这一点？

我知道通常要创建 ROC 曲线，您需要像这样的参数 x 和 y：

import scikitplot as skplt
import matplotlib.pyplot as plt

y_true = # ground truth labels
y_probas = # predicted probabilities generated by sklearn classifier
skplt.metrics.plot_roc_curve(y_true, y_probas)
plt.show()

数据和目标，但我不清楚我应该准确绘制什么，插入什么数据和哪个数据框

Answer 1

根据代码片段中的数据框判断，您正在处理回归问题，而不是分类问题。 这意味着您不是要预测观察的类别，而是要预测特定值（我假设是weight变量）。
由于您没有尝试对观察结果进行分类，因此未明确定义真阳性或假阳性率等度量。 因此，无法在回归问题的上下文中创建 ROC 曲线。

您可以在此处找到更多信息。

如何使用 Python 绘制 ROC 曲线和准确度？

问题描述

1 个解决方案

解决方案1
0 2021-07-11 20:29:04

如何使用 Python 绘制 ROC 曲线和准确度？

问题描述

1 个解决方案

解决方案1 0 2021-07-11 20:29:04

解决方案1
0 2021-07-11 20:29:04