簡體   English   中英

更快速地修改numpy數組

[英]Faster way to modify a numpy array

我有一個大的numpy數組有400萬行和4列(形狀=(4000000,4))

我需要根據第四列中的值修改/減少行數。 例如,我的數據集中的少數幾行如下所示:

a = np.array([[1.32, 24.42, 224.21312, 0],[1.32, 24.42, 224.21312, 0],[1.32, 24.42, 224.21312, 1],[1.32, 24.42, 224.21312, 1],[1.32, 24.42, 224.21312, 0]]);

我的結果應該是以下內容(只有最后一列值= 1的行)

b = [1.32, 24.42, 224.21312, 1],[1.32, 24.42, 224.21312, 1]

遍歷每一行的for循環需要很長時間才能完成。

我有200個這樣的數組,所以我已經在為每個數組使用多處理。

尋找建議。

這對你有用嗎?

a[a[:,3] == 1]

得到:

array([[  1.32   ,  24.42   , 224.21312,   1.     ],
       [  1.32   ,  24.42   , 224.21312,   1.     ]])

您可以將其轉換為dataframe並在那里操作您的操作,然后轉換回數組:

df = pd.DataFrame(a)
df = df[df[3] == 1]
a = df.as_matrix()

輸出:

array([[  1.32   ,  24.42   , 224.21312,   1.     ],
       [  1.32   ,  24.42   , 224.21312,   1.     ]])

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM