[英]how to convert one column in dataframe into a 2D array in python
我有一个数据框,其中包含观察到的数据:
import pandas as pd
d = {'ID': [0,1,2], 'Value':
[[1,2,1],[5,4,6],[7,20,9]]}
df = pd.DataFrame(data=d)
如何从值中获取数组以形成2D numpy.ndarray
[[1, 2, 1],
[5, 4, 6],
[7, 20, 9]]
形状:(3,3)
我试试
print(df['Value'].values)
但它给了我
[list([1, 2, 1]) list([5, 4, 6]) list([7, 20, 9])]
这不是我想要的
您可以使用以下几种方法提取列列表,然后使用array-ify。
np.array(df['Value'].tolist())
array([[ 1, 2, 1],
[ 5, 4, 6],
[ 7, 20, 9]])
# np.vstack(df['Value'])
np.stack(df['Value'])
array([[ 1, 2, 1],
[ 5, 4, 6],
[ 7, 20, 9]])
如果列表的大小不均匀,则会返回一个常规的2D数组,其中缺少位置的nans。
df['Value'] = [[1, 2], [3], [4, 5, 6]]
df
ID Value
0 0 [1, 2]
1 1 [3]
2 2 [4, 5, 6]
# pd.DataFrame(df['Value'].tolist()).values # < v0.24
pd.DataFrame(df['Value'].tolist()).to_numpy() # v0.24+
array([[ 1., 2., nan],
[ 3., nan, nan],
[ 4., 5., 6.]])
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.