簡體   English   中英

將bitstring numpy數組轉換為整數base 2的最快方法

[英]fastest way to convert bitstring numpy array to integer base 2

我有一個由比特串組成的numpy數組,我打算將比特串轉換為整數2,以便執行一些xor按位運算。 我可以在python中將字符串轉換為帶有base 2的整數:

int('000011000',2)

我想知道是否有更快更好的方法在numpy中做到這一點。 我正在處理的numpy數組的一個例子是這樣的:

array([['0001'],
       ['0010']], 
      dtype='|S4')

我希望將其轉換為:

array([[1],[2]])

可以使用np.fromstring將每個字符串位分離為uint8類型數字,然后使用一些帶矩陣乘法的數學轉換/縮減為十進制格式。 因此,使用A作為輸入數組,一種方法就是這樣 -

# Convert each bit of input string to numerals
str2num = (np.fromstring(A, dtype=np.uint8)-48).reshape(-1,4)

# Setup conversion array for binary number to decimal equivalent
de2bi_convarr = 2**np.arange(3,-1,-1)

# Use matrix multiplication for reducing each row of str2num to a single decimal
out = str2num.dot(de2bi_convarr)

樣品運行 -

In [113]: A    # Modified to show more variety
Out[113]: 
array([['0001'],
       ['1001'],
       ['1100'],
       ['0010']], 
      dtype='|S4')

In [114]: str2num = (np.fromstring(A, dtype=np.uint8)-48).reshape(-1,4)

In [115]: str2num
Out[115]: 
array([[0, 0, 0, 1],
       [1, 0, 0, 1],
       [1, 1, 0, 0],
       [0, 0, 1, 0]], dtype=uint8)

In [116]: de2bi_convarr = 2**np.arange(3,-1,-1)

In [117]: de2bi_convarr
Out[117]: array([8, 4, 2, 1])

In [118]: out = str2num.dot(de2bi_convarr)

In [119]: out
Out[119]: array([ 1,  9, 12,  2])

可以建議另一種方法來避免np.fromstring 使用此方法,我們將在開始時轉換為int數據類型,然后將每個數字分開,這應該等同於前一個方法中的str2num 其余的代碼將保持不變。 因此,另一種實施方式是 -

# Convert to int array and thus convert each bit of input string to numerals
str2num = np.remainder(A.astype(np.int)//(10**np.arange(3,-1,-1)),10)

de2bi_convarr = 2**np.arange(3,-1,-1)
out = str2num.dot(de2bi_convarr)

運行時測試

讓我們計算到目前為止列出的所有方法來解決問題,包括@Kasramvd's loopy solution

In [198]: # Setup a huge array of such strings
     ...: A = np.array([['0001'],['1001'],['1100'],['0010']],dtype='|S4')
     ...: A = A.repeat(10000,axis=0)


In [199]: def app1(A):             
     ...:     str2num = (np.fromstring(A, dtype=np.uint8)-48).reshape(-1,4)
     ...:     de2bi_convarr = 2**np.arange(3,-1,-1)
     ...:     out = str2num.dot(de2bi_convarr)    
     ...:     return out
     ...: 
     ...: def app2(A):             
     ...:     str2num = np.remainder(A.astype(np.int)//(10**np.arange(3,-1,-1)),10)
     ...:     de2bi_convarr = 2**np.arange(3,-1,-1)
     ...:     out = str2num.dot(de2bi_convarr)    
     ...:     return out
     ...: 

In [200]: %timeit app1(A)
1000 loops, best of 3: 1.46 ms per loop

In [201]: %timeit app2(A)
10 loops, best of 3: 36.6 ms per loop

In [202]: %timeit np.array([[int(i[0], 2)] for i in A]) # @Kasramvd's solution
10 loops, best of 3: 61.6 ms per loop

由於KISS原則 ,我想建議使用列表理解的以下方法:

>>> np.array([[int(i[0], 2)] for i in a])
array([[1],
       [2]])

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM