繁体   English   中英

将列表的 pandas dataframe 转换为 numpy 数组

[英]Convert pandas dataframe of lists into numpy array

我有以下 dataframe:

import pandas as pd
import numpy as np

df = pd.DataFrame([{'a': [1,3,2]},{'a': [7,6,5]},{'a': [9,8,8]}])
df

df['a'].to_numpy()
df['a'].to_numpy()

=> array([list([1, 3, 2]), list([7, 6, 5]), list([9, 8, 8])], dtype=object)

如何在不编写 for 循环的情况下获得形状为(3,3)的 numpy 数组?

首先创建嵌套列表,然后转换为数组,只需要所有具有相同长度的列表:

arr = np.array(df.a.tolist())
print (arr)
[[1 3 2]
 [7 6 5]
 [9 8 8]]

如果总是有相同的长度

pd.DataFrame(df.a.tolist()).values
array([[1, 3, 2],
       [7, 6, 5],
       [9, 8, 8]])

所有这些答案都集中在单个列而不是整个 Dataframe。如果您有多个列,索引ij处的每个条目都是一个列表,您可以这样做:

df = pd.DataFrame({"A": [[1, 2], [3, 4]], "B": [[5, 6], [7, 8]]})
print(df)

        A       B
0  [1, 2]  [5, 6]
1  [3, 4]  [7, 8]

arrays = df.applymap(lambda x: np.array(x, dtype=np.float32)).to_numpy()

result = np.array(np.stack([np.stack(a) for a in array]))
print(result, result.shape)

array([[[1., 2.],
         [5., 6.]],
 
        [[3., 4.],
         [7., 8.]]], dtype=float32)

我不能说它的速度,因为我在非常少量的数据上使用它。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM