如何在 Pandas/numpy 中將一系列數組轉換為單個矩陣？

Question

我以某種方式得到了一個包含一堆數組的pandas.Series ，如下面的代碼中的s 。

data = [[1,2,3],[2,3,4],[3,4,5],[2,3,4],[3,4,5],[2,3,4],
        [3,4,5],[2,3,4],[3,4,5],[2,3,4],[3,4,5]]
s = pd.Series(data = data)
s.shape # output ---> (11L,)
# try to convert s to matrix
sm = s.as_matrix()
# but...
sm.shape # output ---> (11L,)

如何將s轉換為形狀為 (11,3) 的矩陣？ 謝謝！

Answer 1

如果出於某種原因，你發現自己對Series憎惡，那么將它恢復到你想要的那種matrix或array是很簡單的：

In [16]: s
Out[16]:
0     [1, 2, 3]
1     [2, 3, 4]
2     [3, 4, 5]
3     [2, 3, 4]
4     [3, 4, 5]
5     [2, 3, 4]
6     [3, 4, 5]
7     [2, 3, 4]
8     [3, 4, 5]
9     [2, 3, 4]
10    [3, 4, 5]
dtype: object

In [17]: sm = np.matrix(s.tolist())

In [18]: sm
Out[18]:
matrix([[1, 2, 3],
        [2, 3, 4],
        [3, 4, 5],
        [2, 3, 4],
        [3, 4, 5],
        [2, 3, 4],
        [3, 4, 5],
        [2, 3, 4],
        [3, 4, 5],
        [2, 3, 4],
        [3, 4, 5]])

In [19]: sm.shape
Out[19]: (11, 3)

但除非它是你無法改變的東西，否則開始使用該系列毫無意義。

Answer 2

另一種方法是提取系列的值並對它們使用numpy.stack。

np.stack(s.values)

PS。 我經常遇到類似的情況。

Answer 3

對於pandas> = 0.24，您還可以使用np.stack(s.to_numpy())或np.concatenate(s.to_numpy()) ，具體取決於您的要求。

Answer 4

我用 5793 個 100D 向量測試了上述方法。 先轉換為列表的舊方法最快。

%time print(np.stack(df.features.values).shape)
%time print(np.stack(df.features.to_numpy()).shape)
%time print(np.array(df.features.tolist()).shape)
%time print(np.array(list(df.features)).shape)

結果

(5793, 100)
CPU times: user 11.7 ms, sys: 3.42 ms, total: 15.1 ms
Wall time: 22.7 ms
(5793, 100)
CPU times: user 11.1 ms, sys: 137 µs, total: 11.3 ms
Wall time: 11.9 ms
(5793, 100)
CPU times: user 5.96 ms, sys: 0 ns, total: 5.96 ms
Wall time: 6.91 ms
(5793, 100)
CPU times: user 5.74 ms, sys: 0 ns, total: 5.74 ms
Wall time: 6.43 ms

如何在 Pandas/numpy 中將一系列數組轉換為單個矩陣？

問題描述

4 個解決方案

解決方案1
13 已采納 2016-11-27 00:45:20

解決方案2
6 2018-02-14 18:29:04

解決方案3
0 2019-02-26 07:16:29

解決方案4
0 2021-12-10 09:23:00

如何在 Pandas/numpy 中將一系列數組轉換為單個矩陣？

問題描述

4 個解決方案

解決方案1 13 已采納 2016-11-27 00:45:20

解決方案2 6 2018-02-14 18:29:04

解決方案3 0 2019-02-26 07:16:29

解決方案4 0 2021-12-10 09:23:00

解決方案1
13 已采納 2016-11-27 00:45:20

解決方案2
6 2018-02-14 18:29:04

解決方案3
0 2019-02-26 07:16:29

解決方案4
0 2021-12-10 09:23:00