[英]Compare two arrays and display the sum of the matches
我有2個相同形狀的Numpy數組。 現在,我想比較數組1和數組2的值。最后,將輸出條件值== 1的匹配的總和。
陣列1:
[1, 0, 1]
[1, 1, 0]
[0, 0, 1]
陣列2:
[0, 1, 1]
[1, 0, 0]
[0, 1, 1]
現在的結果應如下所示:
sum = 3
我的以下算法有效,但性能不佳且不夠優雅:
k = 0
for i in range(0,array1.shape[0],1):
for j in range(0, array1.shape[1], 1):
if array1[i][j] == array2[i][j] and array1[i][j] == 1:
k = k + 1
else:
continue
print k
如果確實是二進制數據,則可以執行
np.logical_and(a, b).sum()
3
這應該比(a==b) & (a==1)
快得多
這是組合兩個條件的一種方法。
import numpy as np
a = np.array([[1, 0, 1],
[1, 1, 0],
[0, 0, 1]])
b = np.array([[0, 1, 1],
[1, 0, 0],
[0, 1, 1]])
res = np.sum((a==b) & (a==1)) # 3
說明
a==b
返回一個布爾數組,它按元素測試兩個數組之間的相等性。 a==1
返回一個布爾數組,以按元素測試a
到1中的元素是否相等。 &
運算符用於表示必須同時滿足兩個條件。 np.sum
適用於布爾數組,因為bool
是int
的子類,即True
可以視為1, False
視為0。 我為上述解決方案做了一些時間安排...
第一名:np.logical_and()
第二名:np.sum(np.multiply())
第三名:np.sum(arr1 == arr2&arr1 == 1)
第四名:基本循環和比較。
這將輸出:
# Test 1 gives : 15.1819742985
# Test 2 gives : 14.9471218792
# Test 3 gives : 6.76537855828
# Test 4 gives : 9.16029915098
import numpy as np
import timeit
arr1 = np.array([[1, 0, 1], [1, 1, 0], [0, 0, 1]])
arr2 = np.array([[0, 1, 1], [1, 0, 0], [0, 1, 1]])
numberIterations = 1000000
def test_1(arr1, arr2):
return np.sum((arr1 == arr2) & (arr1 == 1))
def test_2(arr1, arr2):
summed = 0
for a1, a2 in zip(arr1, arr2):
for c1, c2 in zip(a1, a2):
if c1 == c2 and c1 == 1:
summed += 1
return summed
def test_3(arr1, arr2):
return np.logical_and(arr1, arr2).sum()
def test_4(arr1, arr2):
return np.sum(np.multiply(arr1, arr2))
# Testing time.
# Test 1
time1 = timeit.timeit(stmt='test_1(arr1, arr2)',
setup='from __main__ import test_1, arr1, arr2',
number=numberIterations)
# Test 2
time2 = timeit.timeit(stmt='test_2(arr1, arr2)',
setup='from __main__ import test_2, arr1, arr2',
number=numberIterations)
# Test 3
time3 = timeit.timeit(stmt='test_3(arr1, arr2)',
setup='from __main__ import test_3, arr1, arr2',
number=numberIterations)
# Test 4
time4 = timeit.timeit(stmt='test_4(arr1, arr2)',
setup='from __main__ import test_4, arr1, arr2',
number=numberIterations)
# Printing results.
print 'Test 1 gives : {}'.format(time1)
print 'Test 2 gives : {}'.format(time2)
print 'Test 3 gives : {}'.format(time3)
print 'Test 4 gives : {}'.format(time4)
>>> import numpy as np
>>> a=np.array([[1,0,1],[1,1,0],[0,0,1]])
>>> b=np.array([[0,1,1],[1,0,0],[0,1,1]])
>>> a==b
array([[False, False, True],
[ True, False, True],
[ True, False, True]], dtype=bool)
>>> c=np.array(a==b, dtype=int)
>>> c
array([[0, 0, 1],
[1, 0, 1],
[1, 0, 1]])
>>> np.sum(c)
5
>>> d=np.array(a*b, dtype=int)
>>> d
array([[0, 0, 1],
[1, 0, 0],
[0, 0, 1]])
>>> np.sum(d)
3
如果矩陣中只有0和1
import numpy as np
ar_1=np.array([[1, 0, 1],
[1, 1, 0],
[0, 0, 1]])
ar_2 = np.array([[0, 1, 1],
[1, 0, 0],
[0, 1, 1]])
np.sum(np.multiply(ar_1,ar_2))
np.multiply將是元素明智的乘法。 僅當給定的兩個參數均為1時,才會給您1。
不帶軸的np.sum將對矩陣的所有元素求和
這是另外四種快速方法:
1) np.dot
:
np.dot(a.ravel(), b.ravel())
# 3
2) np.bincount
:
np.bincount(a.ravel(), b.ravel())[1]
# 3.0
3) np.count_nonzero
:
np.count_nonzero(a * b)
# 3
4) np.repeat
:
np.count_nonzero(a.ravel().repeat(b.ravel()))
# 3
借用@IMCoins的測試腳本
Test 1 gives : 6.34505105019
Test 2 gives : 7.32884097099
Test 3 gives : 3.29451298714
Test 4 gives : 3.76608014107
Test 5 gives : 1.28572297096 <- np.dot
Test 6 gives : 1.3145699501 <- np.bincount
Test 7 gives : 0.984617948532 <- np.count_nonzero
Test 8 gives : 1.06798291206 <- np.repeat
如果我使用較大的數組( np.tile(arr[1/2], (100, 100))
)和較少的迭代np.tile(arr[1/2], (100, 100))
變成:
Test 1 gives : 0.253939151764
Test 2 gives : 34.9494478703
Test 3 gives : 0.190597057343
Test 4 gives : 0.139708995819
Test 5 gives : 0.0751769542694
Test 6 gives : 0.382376909256
Test 7 gives : 0.239590883255
Test 8 gives : 0.335343122482
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.