繁体   English   中英

从 Pandas 数据框列单独创建 numpy 数组

[英]Create separately numpy arrays from pandas dataframe columns

我想从我的 Pandas 数据帧列在 Python n 的 numpy 数组中自动创建。 我可以手动执行此操作,例如:

numpy_array_1 = data_frame.column_1.values
numpy_array_2 = data_frame.column_2.values
...
numpy_array_n = data_frame.column_n.values

但我不知道我应该如何编写代码来自动创建这些数组。

您可以简单地使用for并循环遍历它。 请记住,使用(list(data_frame))返回数据框中列名的列表:

np_array = []
for i in list(data_frame):
    np_array.append(data_frame[i].values)

预期输出是一个包含值子列表的列表。 每个子列表与数据框中列的位置相匹配。 因此,您可以制作字典,也可以从中制作一个元组。 字典示例:

np_array_dict = {}
for i in list(data_frame):
    np_array_dict[i] = data_frame[i].values

假设我们有一个简单的 df:

df = pd.DataFrame({"0":[1,2], "1":[3,4]})
df 
   0  1
0  1  3
1  2  4

然后你可以运行:

for (key,value) in df.to_dict("list").items():
    exec("numpy_array_{} = np.array({})".format(key, value))

你会得到:

numpy_array_0
array([1, 2])

numpy_array_1
array([3, 4])

等等。

或者:

for col in list(df):
    exec("numpy_array_{} = df[str({})].values".format(col,col))

您可以获得所有数据帧行和列值的矩阵,就像 df.values 一样简单您真的需要每列不同的数组吗?

这可以在不使用循环的情况下完成:

df = pd.DataFrame({"0":[1,2], "1":[3,4], "2":[5,6]})
print(df)

   0  1  2
0  1  3  5
1  2  4  6

进而:

[*np.transpose(df.values)]

结果是:

[array([1, 2]), array([3, 4]), array([5, 6])]

如果需要一本字典,只需按以下步骤进行:

dict(zip(range(df.shape[1]), [*np.transpose(df.values)]))

这使:

{0: array([1, 2]), 1: array([3, 4]), 2: array([5, 6])}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM