[英]Index of numpy.ndarray
我拆分了numpy.ndarray對象:
array([[1, 0, 0, ..., 0, 0, 0],
[1, 0, 0, ..., 0, 0, 0],
[0, 0, 0, ..., 0, 0, 0]])
通過測試和訓練樣本(使用sklearn.model_selection.train_test_split
)。 之后,我需要確定測試樣本的哪些元素與父樣本的元素相對應。 enter code here
這個怎么做?
您可以將np.array轉換為數據框:
In [13]: data
array([[1, 0, 0, 0, 0, 0],
[1, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0]])
In [14]: data = pd.DataFrame(data)
然后拆分數據和關聯的索引以測試和訓練零件:
In [15]: train, test, train_index, test_index = train_test_split(data, data.index)
In [16]: train
Out[16]:
0 1 2 3 4 5
0 1 0 0 0 0 0
1 1 0 0 0 0 0
In [17]: test
Out[17]:
0 1 2 3 4 5
2 0 0 0 0 0 0
In [18]: train_index
Out[18]: Int64Index([0, 1], dtype='int64')
In [19]: test_index
Out[19]: Int64Index([2], dtype='int64')
然后,您可以按以下方式訪問原始數據框中的訓練行和測試行:
In [24]: data.loc[test_index, :]
Out[24]:
0 1 2 3 4 5
2 0 0 0 0 0 0
In [25]: data.loc[train_index, :]
Out[25]:
0 1 2 3 4 5
0 1 0 0 0 0 0
1 1 0 0 0 0 0
注意:我想這也是@cᴏʟᴅsᴘᴇᴇᴅ在評論中提出的內容。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.