[英]create pandas dataframe from different size numpy arrays
我有以下不同形狀的numpy數組。 我想使用熊貓創建一個數據框,以便可以整齊地顯示它,如下所示:
numpy數組:
et_arr: [ 8.94668401e+01 1.66449935e+01 -4.44089210e-14]
ea_arr: [ 100. 21.84087363 1.04031209]
it:
[[ 0.1728 1.0688 1.4848 1.6008 ]
[ 1.36746667 1.62346667 1.63946667 0. ]
[ 1.64053333 1.64053333 0. 0. ]
[ 1.64053333 0. 0. 0. ]]
結果數據框:
一種方法是在所有3個數組之間循環並根據索引進行收集。 我嘗試了numpy.column_stack
和zip並映射到一定程度,但沒有達到期望的結果。
我一直使用pandas數據框來顯示結果,這很容易。 這似乎有些棘手。 我該如何實現。
如果已將數組放入dict data
,則可以遍歷鍵並隨需添加:
data = {"et_arr":[8.94668401e+01,1.66449935e+01,-4.44089210e-14],
"ea_arr":[100.,21.84087363,1.04031209],
"it":[[0.1728,1.0688,1.4848,1.6008],
[1.36746667,1.62346667,1.63946667,0.],
[1.64053333,1.64053333,0.,0.],
[1.64053333,0.,0.,0.]]}
# To keep track of the order of dict indices we'll capture them as we loop:
indices = []
df = pd.DataFrame()
for k in data.keys():
df = pd.concat([df, pd.DataFrame(data[k]).T], ignore_index=True).fillna(0)
if k == "it":
indices.extend([f"n={i+1}" for i in range(len(data[k]))])
else:
indices.append(k)
df.index = indices
df.columns = df.columns + 1
df
1 2 3 4
et_arr 89.46684 16.644994 -4.440892e-14 0.000000
ea_arr 100.00000 21.840874 1.040312e+00 0.000000
n=1 0.17280 1.367467 1.640533e+00 1.640533
n=2 1.06880 1.623467 1.640533e+00 0.000000
n=3 1.48480 1.639467 0.000000e+00 0.000000
n=4 1.60080 0.000000 0.000000e+00 0.000000
或者,您可以將它們手工融合在一起,但是擴展性較差:
df = pd.DataFrame(it)
arr_df = pd.DataFrame([et_arr,ea_arr])
df = pd.concat([df, arr_df], ignore_index=True).fillna(0)
df.columns = range(1,5)
df.columns.name = "iter"
df.index = ["n=1","n=2","n=3","n=4","et","ea"]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.