Numpy：通過多維數組對多維數組進行排序

Question

如果這是多余的或超級基本的，請原諒我。 我是從R來到Python / Numpy並且很難在腦子里翻看東西。

我有一個維度數組，我想使用另一個索引值的n維數組進行排序。 我知道我可以將它包裝在一個循環中，但似乎應該有一個非常簡潔的Numpyonic方式來擊敗這個提交。 這是我設置n = 2的問題的示例代碼：

a1 = random.standard_normal(size=[2,5]) 
index = array([[0,1,2,4,3] , [0,1,2,3,4] ])

所以現在我有一個2 x 5的隨機數組和一個2 x 5的索引。 我現在已經閱讀了大約10次take()的幫助，但顯然我的大腦並不是在研究它。

我以為這可能會讓我在那里：

take(a1, index)

array([[ 0.29589188, -0.71279375, -0.18154864, -1.12184984,  0.25698875],
       [ 0.29589188, -0.71279375, -0.18154864,  0.25698875, -1.12184984]])

但這顯然只是重新排序第一個元素（我認為是因為扁平化）。

有關我如何從我所處的位置獲得的解決方案，該解決方案將索引的元素0對a1的元素0進行排序...元素n？

Answer 1

~~我想不出如何在N維度中使用它，但~~ 這里是2D版本：

>>> a = np.random.standard_normal(size=(2,5))
>>> a
array([[ 0.72322499, -0.05376714, -0.28316358,  1.43025844, -0.90814293],
       [ 0.7459107 ,  0.43020728,  0.05411805, -0.32813465,  2.38829386]])
>>> i = np.array([[0,1,2,4,3],[0,1,2,3,4]]) 
>>> a[np.arange(a.shape[0])[:,np.newaxis],i]
array([[ 0.72322499, -0.05376714, -0.28316358, -0.90814293,  1.43025844],
       [ 0.7459107 ,  0.43020728,  0.05411805, -0.32813465,  2.38829386]])

這是N維版本：

>>> a[list(np.ogrid[[slice(x) for x in a.shape]][:-1])+[i]]

以下是它的工作原理：

好的，讓我們從三維數組開始進行說明。

>>> import numpy as np
>>> a = np.arange(24).reshape((2,3,4))
>>> a
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

您可以通過指定沿每個軸的索引來訪問此數組的元素，如下所示：

>>> a[0,1,2]
6

這相當於a[0][1][2] ，如果我們處理的是列表而不是數組，那么你將如何訪問同一個元素。

Numpy允許您在切片數組時變得更加漂亮：

>>> a[[0,1],[1,1],[2,2]]
array([ 6, 18])
>>> a[[0,1],[1,2],[2,2]]
array([ 6, 22])

這些例子相當於[a[0][1][2],a[1][1][2]]和[a[0][1][2],a[1][2][2]]如果我們處理清單。

你甚至可以省略重復的指數，而numpy會找出你想要的東西。 例如，上面的例子可以等效地寫成：

>>> a[[0,1],1,2]
array([ 6, 18])
>>> a[[0,1],[1,2],2]
array([ 6, 22])

在每個維度中切片的數組（或列表）的形狀僅影響返回數組的形狀。 換句話說，numpy並不關心你是否正在嘗試使用一個形狀(2,3,4)的數組來索引數值，除非它會反饋一個形狀數組(2,3,4) 。 例如：

>>> a[[[0,0],[0,0]],[[0,0],[0,0]],[[0,0],[0,0]]]
array([[0, 0],
       [0, 0]])

在這種情況下，我們一遍又一遍地抓取相同的元素， a[0,0,0] ，但numpy返回的數組與我們傳入的形狀相同。

好的，你的問題。 你想要的是沿着最后一個軸index數組與index數組中的數字。 所以，對於你問題中的例子，你想要[[a[0,0],a[0,1],a[0,2],a[0,4],a[0,3]],a[1,0],a[1,1],...

正如我之前所說的，你的索引數組是多維的這一事實，並沒有說明你想要從哪里獲取這些索引的任何內容; 它只是指定輸出數組的形狀。 所以，在你的例子中，你需要告訴numpy前5個值是從a[0]拉出來a[0] ，而后5個是從a[1]拉出來a[0] 。 簡單！

>>> a[[[0]*5,[1]*5],index]

它在N維中變得復雜，但讓我們按照上面定義的方式對三維數組a處理。 假設我們有以下索引數組：

>>> i = np.array(range(4)[::-1]*6).reshape(a.shape)
>>> i
array([[[3, 2, 1, 0],
        [3, 2, 1, 0],
        [3, 2, 1, 0]],

       [[3, 2, 1, 0],
        [3, 2, 1, 0],
        [3, 2, 1, 0]]])

因此，這些值都是沿最后一個軸的索引。 我們需要告訴numpy這些數字取自第一軸和第二軸的索引; 即我們需要告訴numpy第一軸的索引是：

i1 = [[[0, 0, 0, 0],
       [0, 0, 0, 0],
       [0, 0, 0, 0]],

      [[1, 1, 1, 1],
       [1, 1, 1, 1],
       [1, 1, 1, 1]]]

而第二軸的指數是：

i2 = [[[0, 0, 0, 0],
       [1, 1, 1, 1],
       [2, 2, 2, 2]],

      [[0, 0, 0, 0],
       [1, 1, 1, 1],
       [2, 2, 2, 2]]]

然后我們可以這樣做：

>>> a[i1,i2,i]
array([[[ 3,  2,  1,  0],
        [ 7,  6,  5,  4],
        [11, 10,  9,  8]],

       [[15, 14, 13, 12],
        [19, 18, 17, 16],
        [23, 22, 21, 20]]])

生成i1和i2的方便numpy函數稱為np.mgrid 。 我在我的回答中使用了np.ogrid ，這在本案例中是等效的，因為我之前談過的是np.ogrid的魔法。

希望有所幫助！

Answer 2

今天玩了這個之后，我發現如果我使用了mapper函數，我可以解決2維版本真的很簡單：

a1 = random.standard_normal(size=[2,5]) 
index = array([[0,1,2,4,3] , [0,1,2,3,4] ]) 
map(take, a1, index)

我需要將take() map()到a1每個元素

當然，接受的答案解決了n維版本。 但回想起來，我確定我不需要n維解決方案，只需要2-D版本。

Numpy：通過多維數組對多維數組進行排序

問題描述

2 個解決方案

解決方案1
12 已采納 2012-06-06 21:11:17

解決方案2
3 2012-06-07 16:45:09

Numpy：通過多維數組對多維數組進行排序

問題描述

2 個解決方案

解決方案1 12 已采納 2012-06-06 21:11:17

解決方案2 3 2012-06-07 16:45:09

解決方案1
12 已采納 2012-06-06 21:11:17

解決方案2
3 2012-06-07 16:45:09