繁体   English   中英

如何使用 Python 绘制 ROC 曲线和准确度?

[英]How to plot the ROC Curve and Accuracy using Python?

从由 va1、val1 和权重组成的数据帧中,我创建了一个训练集和一个测试集。 我使用了一些指标并将它们与测试集进行了比较。 相应的(真)值保存在 True_positive_df 数据帧内,而不匹配的值保存在 False_positive_df 数据帧内。

True_positive_df:

val1  val2  weight
123   345   67.09
453   256   43.51
...   ...   ...

False_positive_df:

val1  val2 weight
789   878 90.23
782   293  62.53 
...   ...  ...

我想创建一条 ROC 曲线并计算计算的准确性。 我如何使用这两个数据框来做到这一点?

我知道通常要创建 ROC 曲线,您需要像这样的参数 x 和 y:

import scikitplot as skplt
import matplotlib.pyplot as plt

y_true = # ground truth labels
y_probas = # predicted probabilities generated by sklearn classifier
skplt.metrics.plot_roc_curve(y_true, y_probas)
plt.show()

数据和目标,但我不清楚我应该准确绘制什么,插入什么数据和哪个数据框

根据代码片段中的数据框判断,您正在处理回归问题,而不是分类问题。 这意味着您不是要预测观察的类别,而是要预测特定值(我假设是weight变量)。
由于您没有尝试对观察结果进行分类,因此未明确定义真阳性或假阳性率等度量。 因此,无法在回归问题的上下文中创建 ROC 曲线。

您可以在此处找到更多信息。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM