Python：將numpy符號數組轉換為int和back

Question

我試圖從一個numpy數組的符號（即，一個nduy數組，其條目為1.或-1. ）轉換為整數，然后通過二進制表示。 我有一些有用的東西，但它不是Pythonic，我希望它會很慢。

def sign2int(s):
    s[s==-1.] = 0.
    bstr = ''
    for i in range(len(s)):
        bstr = bstr + str(int(s[i]))
    return int(bstr, 2)

def int2sign(i, m):
    bstr = bin(i)[2:].zfill(m)
    s = []
    for d in bstr:
        s.append(float(d))
    s = np.array(s)
    s[s==0.] = -1.
    return s

然后

>>> m = 4
>>> s0 = np.array([1., -1., 1., 1.])
>>> i = sign2int(s0)
>>> print i
11
>>> s = int2sign(i, m)
>>> print s
[ 1. -1.  1.  1.]

我擔心（1）每個中的for循環和（2）必須將中間表示構建為字符串。

最終，我會想要一些適用於2-d numpy數組的東西---例如，

>>> s = np.array([[1., -1., 1.], [1., 1., 1.]])
>>> print sign2int(s)
[5, 7]

Answer 1

對於1d數組，您可以使用這一個線性Numpythonic方法，使用np.packbits ：

>>> np.packbits(np.pad((s0+1).astype(bool).astype(int), (8-s0.size, 0), 'constant'))
array([11], dtype=uint8)

並且為了倒車：

>>> unpack = (np.unpackbits(np.array([11], dtype=np.uint8))[-4:]).astype(float)
>>> unpack[unpack==0] = -1
>>> unpack
array([ 1., -1.,  1.,  1.])

對於2D陣列：

>>> x, y = s.shape
>>> np.packbits(np.pad((s+1).astype(bool).astype(int), (8-y, 0), 'constant')[-2:])
array([5, 7], dtype=uint8)

並且為了倒車：

>>> unpack = (np.unpackbits(np.array([5, 7], dtype='uint8'))).astype(float).reshape(x, 8)[:,-y:]
>>> unpack[unpack==0] = -1
>>> unpack
array([[ 1., -1.,  1.],
       [ 1.,  1.,  1.]])

Answer 2

我將從sig2int開始。從符號表示轉換為二進制

>>> a
array([ 1., -1.,  1., -1.])
>>> (a + 1) / 2
array([ 1.,  0.,  1.,  0.])
>>>

然后你可以簡單地創建一個2的冪數組，乘以二進制和和。

>>> powers = np.arange(a.shape[-1])[::-1]
>>> np.power(2, powers)
array([8, 4, 2, 1])
>>> a = (a + 1) / 2
>>> powers = np.power(2, powers)
>>> a * powers
array([ 8.,  0.,  2.,  0.])
>>> np.sum(a * powers)
10.0
>>>

然后通過添加軸信息使其在行上運行並依賴於廣播。

def sign2int(a):
    # powers of two
    powers = np.arange(a.shape[-1])[::-1]
    np.power(2, powers, powers)
    # sign to "binary" - add one and divide by two
    np.add(a, 1, a)
    np.divide(a, 2, a)
    # scale by powers of two and sum
    np.multiply(a, powers, a)
    return np.sum(a, axis = -1)
>>> b = np.array([a, a, a, a, a])
>>> sign2int(b)
array([ 11.,  11.,  11.,  11.,  11.])
>>>

我在一個4乘100比特的陣列上嘗試了它，看起來很快

>>> a = a.repeat(100)
>>> b = np.array([a, a, a, a, a])
>>> b
array([[ 1.,  1.,  1., ...,  1.,  1.,  1.],
       [ 1.,  1.,  1., ...,  1.,  1.,  1.],
       [ 1.,  1.,  1., ...,  1.,  1.,  1.],
       [ 1.,  1.,  1., ...,  1.,  1.,  1.],
       [ 1.,  1.,  1., ...,  1.,  1.,  1.]])
>>> sign2int(b)
array([  2.58224988e+120,   2.58224988e+120,   2.58224988e+120,
         2.58224988e+120,   2.58224988e+120])
>>>

如果我能算出來，我會加上相反的。 - 我能做的最好的事情依賴於一些普通的Python而沒有任何numpy vectoriztion魔術，我還沒有想過如何讓它與一系列的int一起工作，而不是迭代它們並一次轉換它們 - 但時間仍然似乎可以接受

def foo(n):
    '''yields bits in increasing powers of two

    bit sequence from lsb --> msb
    '''
    while n > 0:
        n, r = divmod(n, 2)
        yield r

def int2sign(n):
    n = int(n)
    a = np.fromiter(foo(n), dtype = np.int8, count = n.bit_length())
    np.multiply(a, 2, a)
    np.subtract(a, 1, a)
    return a[::-1]

適用於1324：

>>> bin(1324)
'0b10100101100'
>>> a = int2sign(1324)
>>> a
array([ 1, -1,  1, -1, -1,  1, -1,  1,  1, -1, -1], dtype=int8)

似乎與1.2e305一起使用：

>>> n = int(1.2e305)
>>> n.bit_length()
1014
>>> a = int2sign(n)
>>> a.shape
(1014,)

>>> s = bin(n)
>>> s = s[2:]
>>> all(2 * int(x) -1 == y for x, y in zip(s, a))
True
>>>

Answer 3

以下是您的函數的一些矢量化版本：

def sign2int(s):
    return int(''.join(np.where(s == -1., 0, s).astype(int).astype(str)), 2)

def int2sign(i, m):
    tmp = np.array(list(bin(i)[2:].zfill(m)))
    return np.where(tmp == "0", "-1", tmp).astype(int)

s0 = np.array([1., -1., 1., 1.])

sign2int(s0)
# 11

int2sign(11, 5)
# array([-1,  1, -1,  1,  1])

要在二維數組上使用函數，可以使用map函數：

s = np.array([[1., -1., 1.], [1., 1., 1.]])

map(sign2int, s)
# [5, 7]

map(lambda x: int2sign(x, 4), [5, 7])
# [array([-1,  1, -1,  1]), array([-1,  1,  1,  1])]

Answer 4

經過一些測試后，不使用字符串的@wwii的Numpythonic方法似乎符合我最需要的方法。 對於int2sign ，我在指數上使用for循環，使用標准算法進行轉換---對於64位整數，最多有64次迭代。 Numpy的廣播非常有效地發生在每個整數上。

packbits和unpackbits限制為8位整數; 否則，我懷疑這將是最好的（雖然我沒有嘗試）。

以下是我測試的具體實現，遵循其他答案中的建議（感謝大家！）：

def _sign2int_str(s):
    return int(''.join(np.where(s == -1., 0, s).astype(int).astype(str)), 2)

def sign2int_str(s):
    return np.array(map(_sign2int_str, s))

def _int2sign_str(i, m):
    tmp = np.array(list(bin(i)[2:])).astype(int)
    return np.pad(np.where(tmp == 0, -1, tmp), (m - len(tmp), 0), "constant", constant_values = -1)

def int2sign_str(i,m):
    return np.array(map(lambda x: _int2sign_str(x, m), i.astype(int).tolist())).transpose()

def sign2int_np(s):
    p = np.arange(s.shape[-1])[::-1]
    s = s + 1
    return np.sum(np.power(s, p), axis = -1).astype(int)

def int2sign_np(i,m):
    N = i.shape[-1]
    S = np.zeros((m, N))
    for k in range(m):
        b = np.power(2, m - 1 - k).astype(int)
        S[k,:] = np.divide(i.astype(int), b).astype(float)
        i = np.mod(i, b)        
    S[S==0.] = -1.
    return S

這是我的測試：

X = np.sign(np.random.normal(size=(5000, 20)))
N = 100

t = time.time()
for i in range(N):
    S = sign2int_np(X)
print 'sign2int_np: \t{:10.8f} sec'.format((time.time() - t)/N)

t = time.time()
for i in range(N):
    S = sign2int_str(X)
print 'sign2int_str: \t{:10.8f} sec'.format((time.time() - t)/N)

m = 20
S = np.random.randint(0, high=np.power(2,m), size=(5000,))

t = time.time()
for i in range(N):
    X = int2sign_np(S, m)
print 'int2sign_np: \t{:10.8f} sec'.format((time.time() - t)/N)

t = time.time()
for i in range(N):
    X = int2sign_str(S, m)
print 'int2sign_str: \t{:10.8f} sec'.format((time.time() - t)/N)

這產生了以下結果：

sign2int_np:    0.00165325 sec
sign2int_str:   0.04121902 sec
int2sign_np:    0.00318024 sec
int2sign_str:   0.24846984 sec

Answer 5

我覺得numpy.packbits值得再看看。 給定一個實值符號數組a ，您可以使用numpy.packbits(a > 0) 。 解壓縮由numpy.unpackbits完成。 這會隱式地展平多維數組，因此如果您有多維數組，則需要在unpackbits后reshape unpackbits 。

請注意，您可以將位打包與常規壓縮（例如，zlib或lzma）結合使用。 如果您的數據存在模式或偏差，則可能會獲得有用的壓縮因子，但對於無偏差的隨機數據，您通常會看到適度的大小增加。

Python：將numpy符號數組轉換為int和back

問題描述

5 個解決方案

解決方案1
1 2016-08-27 01:05:00

解決方案2
1 2016-08-27 02:32:19

解決方案3
0 2016-08-27 00:58:04

解決方案4
0 2016-08-27 06:19:06

解決方案5
0 2016-08-27 20:02:12

Python：將numpy符號數組轉換為int和back

問題描述

5 個解決方案

解決方案1 1 2016-08-27 01:05:00

解決方案2 1 2016-08-27 02:32:19

解決方案3 0 2016-08-27 00:58:04

解決方案4 0 2016-08-27 06:19:06

解決方案5 0 2016-08-27 20:02:12

解決方案1
1 2016-08-27 01:05:00

解決方案2
1 2016-08-27 02:32:19

解決方案3
0 2016-08-27 00:58:04

解決方案4
0 2016-08-27 06:19:06

解決方案5
0 2016-08-27 20:02:12