[英]Create separately numpy arrays from pandas dataframe columns
我想从我的 Pandas 数据帧列在 Python n 的 numpy 数组中自动创建。 我可以手动执行此操作,例如:
numpy_array_1 = data_frame.column_1.values
numpy_array_2 = data_frame.column_2.values
...
numpy_array_n = data_frame.column_n.values
但我不知道我应该如何编写代码来自动创建这些数组。
您可以简单地使用for
并循环遍历它。 请记住,使用(list(data_frame))
返回数据框中列名的列表:
np_array = []
for i in list(data_frame):
np_array.append(data_frame[i].values)
预期输出是一个包含值子列表的列表。 每个子列表与数据框中列的位置相匹配。 因此,您可以制作字典,也可以从中制作一个元组。 字典示例:
np_array_dict = {}
for i in list(data_frame):
np_array_dict[i] = data_frame[i].values
假设我们有一个简单的 df:
df = pd.DataFrame({"0":[1,2], "1":[3,4]})
df
0 1
0 1 3
1 2 4
然后你可以运行:
for (key,value) in df.to_dict("list").items():
exec("numpy_array_{} = np.array({})".format(key, value))
你会得到:
numpy_array_0
array([1, 2])
numpy_array_1
array([3, 4])
等等。
或者:
for col in list(df):
exec("numpy_array_{} = df[str({})].values".format(col,col))
您可以获得所有数据帧行和列值的矩阵,就像 df.values 一样简单您真的需要每列不同的数组吗?
这可以在不使用循环的情况下完成:
df = pd.DataFrame({"0":[1,2], "1":[3,4], "2":[5,6]})
print(df)
0 1 2
0 1 3 5
1 2 4 6
进而:
[*np.transpose(df.values)]
结果是:
[array([1, 2]), array([3, 4]), array([5, 6])]
如果需要一本字典,只需按以下步骤进行:
dict(zip(range(df.shape[1]), [*np.transpose(df.values)]))
这使:
{0: array([1, 2]), 1: array([3, 4]), 2: array([5, 6])}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.