[英]Sorting a NumPy array
我有一个np数组,以下列方式构建为2个其他数组的交集:
第一个数组是:
[['! ! !' '! ! ! !']
['! ! !' '! ! ! "']
['! ! !' '! ! ! .']
...,
['}' 'was postponed']
['}' 'was']
['}' '{of']]
第二个数组是:
[['! ! !' '! ! ! !']
['! ! !' '! ! ! "']
['! ! !' '! ! ! .']
...,
['}' 'was postponed']
['}' 'was']
['}' '{of']]
实际上两个数组之间存在多个差异,但它们主要出现在中间行中。
用于构造交集的代码是:
def multidim_intersect(arr1, arr2):
arr1_view = arr1.view([('',arr1.dtype)]*arr1.shape[1])
arr2_view = arr2.view([('',arr2.dtype)]*arr2.shape[1])
intersected = np.intersect1d(arr1_view, arr2_view)
return intersected.view(arr1.dtype).reshape(-1, arr1.shape[1])
输出的数组是:
[['!' '!']
['!' '! !']
['!' '! ! !']
...,
['}' 'was']
['}' 'was postponed']
['}' '{of']]
正如您所看到的,我的新数组的排序与原始的两个数组(在单个感叹号之前排序有多个惊叹号,在LC_ALL = C排序中完成)的排序不同。 有没有办法像我的其他数组那样对输出的数组进行排序? 请注意,阵列的形状很重要。
@Mr E arr1和arr2最初是列表。 我不能给你完整的副本,但我会尽我所能构建一个例子来说明我需要的东西。
arr1 = [['! ! !' '! ! ! !']
['! ! !' '! ! ! "']
['! ! !' '! ! ! .']
['!' '!']
['}' 'was postponed']
['}' 'was']
['}' '{of']]
arr2 = [['! ! !' '! ! ! !']
['! ! !' '! ! ! "']
['! ! !' '! ! ! .']
['!' '!']
['}' 'was postponed']
['}' 'was']
['}' '{of']]
理想情况下,输出将是:
[['! ! !' '! ! ! !']
['! ! !' '! ! ! "']
['! ! !' '! ! ! .']
['!' '!']
['}' 'was postponed']
['}' 'was']
['}' '{of']]
但它是:
[['!' '!']
['! ! !' '! ! ! !']
['! ! !' '! ! ! "']
['! ! !' '! ! ! .']
['}' 'was postponed']
['}' 'was']
['}' '{of']]
或者那种效果。
我不太了解您的输入格式,但您可以根据自己的需要进行调整。
问题是numpy.intersect1d()
由于某种原因自动对输出进行排序。 幸运的是,使用numpy.in1d()
编写自己的交集函数并不困难。 你可以这样做:
import numpy as np
arr1 = np.array([['! ! !' '! ! ! !'],
['! ! !' '! ! ! "'],
['! ! !' '! ! ! .'],
['!' '!'],
['a' 'ad'], # Stuff you don't want to get back
['}' 'was postponed'],
['}' 'was'],
['}' '{of']])
arr2 = np.array([['! ! !' '! ! ! !'],
['! ! !' '! ! ! "'],
['! ! !' '! ! ! .'],
['!' '!'],
['b' 'ab'], # Stuff you don't want to get back
['}' 'was postponed'],
['}' 'was'],
['}' '{of']])
inarr = np.in1d(arr1, arr2)
arr3 = np.empty( shape=(0, 0) )
for i in np.arange(len(arr1)):
if (inarr[i]):
arr3 = np.append(arr3,arr1[i])
for i in np.arange(len(arr3)):
print(arr3[i])
输出:
! ! !! ! ! !
! ! !! ! ! "
! ! !! ! ! .
!!
}was postponed
}was
}{of
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.