使用二維numpy數組有效填充熊貓數據幀

Question

我有一個二維的numpy數組，其每行包含三個元素-['dataframe_column_name'，'dataframe_index'，'value']。 現在，我嘗試使用iloc double for循環填充pandas數據幀，但是速度很慢。 有沒有更快的方法可以做到這一點。 我對熊貓有點陌生，因此很抱歉，這是很基本的事情。 這是代碼片段：

my_nparray = [['a', 1, 123], ['b', 1, 230], ['a', 2, 321]]
for r in range(my_nparray.shape[0]):
    [col, ind, value] = my_nparray[r]
    df.iloc[col][ind] = value

my_nparray很大時，這會花費很多時間，還有其他方法嗎？

最初假設我可以創建此數據框：

  'a' 'b'
1 NaN NaN
2 NaN NaN

我希望輸出為：

  'a' 'b'
1 123 230
2 321 NaN

Answer 1

您可以使用from_records然后進行pivot ：

df = pd.DataFrame.from_records(my_nparray, index=1).pivot(columns=0)

       2
0      a      b
1
1  123.0  230.0
2  321.0    NaN

這指定索引使用數組中的字段1 ，數據透視表將Series 0用於列。

然后，我們可以在列和索引上重置MultiIndex：

df.columns = df.columns.droplevel(None)
df.columns.name = None
df.index.name = None

       a      b
1  123.0  230.0
2  321.0    NaN

Answer 2

將DataFrame構造函數與DataFrame.pivot和DataFrame.rename_axis ：

df = pd.DataFrame(my_nparray).pivot(1,0,2).rename_axis(index=None, columns=None)
print (df)
       a      b
1  123.0  230.0
2  321.0    NaN

使用二維numpy數組有效填充熊貓數據幀

問題描述

2 個解決方案

解決方案1
0 2019-02-10 14:11:23

解決方案2
0 2019-02-10 14:23:01

使用二維numpy數組有效填充熊貓數據幀

問題描述

2 個解決方案

解決方案1 0 2019-02-10 14:11:23

解決方案2 0 2019-02-10 14:23:01

解決方案1
0 2019-02-10 14:11:23

解決方案2
0 2019-02-10 14:23:01