繁体   English   中英

如何删除 Pandas 系列 (pandas.core.series.Series) 的索引以返回 numpy.ndarray?

[英]How can I drop the index of a Pandas Series (pandas.core.series.Series) to return a numpy.ndarray?

我正在尝试显示预测测试数据(二进制文本分类)的混淆矩阵。 但是在运行model.predict()后,我无法让y_pred匹配y_test

首先,让我们看一下测试/真实数据:

y_test = (y_test > 0.5)
print(y_test)
print(type(y_test))

输出:

2       False
17       True
18       True
...
4980     True
4986    False
4990     True
pandas.core.series.Series

缺失的索引包含在训练集中。

当我们根据测试数据进行预测时,会发生以下情况:

y_pred = model.predict(data_test)
y_pred = (y_pred > 0.5)
print(y_pred)
print(type(y_pred))

输出:

[[ True]
 [ True]
 [ True]
 [False]
 ...
 [ True]
 [ True]
 [ True]]
numpy.ndarray

测试/真实数据:

y_test = (y_test > 0.5)
print(y_test)

输出:

2       False
17       True
18       True
...
4980     True
4986    False
4990     True

最终,我希望构建一个混淆矩阵,但数据格式不同。

from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test, y_pred)

你有什么建议吗?

迄今为止的尝试:

y_test_np = y_test.values

输出:

[False  True  True ... True False  True]

更接近,但看起来我需要每个项目也是一个数组(例如[[ True] [False] [ True]] )。 如何对齐数组?

只是为了说明,让我们创建一些示例数据。

y_test = pd.Series([True, False])
y_pred = np.array([[True], [False]])

您可以将熊猫系列y_test转换为 numpy 数组

y_test.values

squeeze numpy 数组y_pred以获得相同的形状

numpy.squeeze(y_pred)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM