numpy.ndarray的索引

Question

我拆分了numpy.ndarray對象：

array([[1, 0, 0, ..., 0, 0, 0],
       [1, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0]])

通過測試和訓練樣本（使用sklearn.model_selection.train_test_split ）。 之后，我需要確定測試樣本的哪些元素與父樣本的元素相對應。 enter code here

這個怎么做？

Answer 1

您可以將np.array轉換為數據框：

In [13]: data  
array([[1, 0, 0, 0, 0, 0],
       [1, 0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 0]])

In [14]: data = pd.DataFrame(data)

然后拆分數據和關聯的索引以測試和訓練零件：

In [15]: train, test, train_index, test_index = train_test_split(data, data.index)

In [16]: train 
Out[16]: 
   0  1  2  3  4  5
0  1  0  0  0  0  0
1  1  0  0  0  0  0

In [17]: test
Out[17]: 
   0  1  2  3  4  5
2  0  0  0  0  0  0

In [18]: train_index 
Out[18]: Int64Index([0, 1], dtype='int64')

In [19]: test_index 
Out[19]: Int64Index([2], dtype='int64')

然后，您可以按以下方式訪問原始數據框中的訓練行和測試行：

In [24]: data.loc[test_index, :]
Out[24]: 
   0  1  2  3  4  5
2  0  0  0  0  0  0

In [25]: data.loc[train_index, :]
Out[25]: 
   0  1  2  3  4  5
0  1  0  0  0  0  0
1  1  0  0  0  0  0

注意：我想這也是@cᴏʟᴅsᴘᴇᴇᴅ在評論中提出的內容。

numpy.ndarray的索引

問題描述

1 個解決方案

解決方案1
0 已采納 2017-11-24 09:49:49

numpy.ndarray的索引

問題描述

1 個解決方案

解決方案1 0 已采納 2017-11-24 09:49:49

解決方案1
0 已采納 2017-11-24 09:49:49