簡體   English   中英

我正在嘗試實現:np.maximum.outer in Python 3x 但我收到此錯誤:NotImplementedError

[英]I´m trying to implement: np.maximum.outer in Python 3x but I´m getting this error: NotImplementedError

我有一個這樣的矩陣:

RCA = pd.DataFrame(
  data=[
    (1,0,0,0),
    (1,1,1,0),
    (0,0,1,0),
    (0,1,0,1),
    (1,0,1,0)],
    columns=['ct1','ct2','ct3','ct4'],
    index=['ind_1','ind_2','ind_3','ind_4','ind_5'])

我正在嘗試計算:

norms = RCA.sum()
norm = np.maximum.outer(norms, norms)

我收到了這個錯誤:

---------------------------------------------------------------------------
NotImplementedError                       Traceback (most recent call last)
<ipython-input-9-4fd04a55ad8c> in <module>
      4 
      5 norms = RCA.sum()
----> 6 norm = np.maximum.outer(norms, norms)
      7 proximity = RCA.T.dot(RCA).div(norm)
      8 

~/opt/anaconda3/envs/py37/lib/python3.7/site-packages/pandas/core/series.py in __array_ufunc__(self, ufunc, method, *inputs, **kwargs)
    746             return None
    747         else:
--> 748             return construct_return(result)
    749 
    750     def __array__(self, dtype=None) -> np.ndarray:

~/opt/anaconda3/envs/py37/lib/python3.7/site-packages/pandas/core/series.py in construct_return(result)
    735                 if method == "outer":
    736                     # GH#27198
--> 737                     raise NotImplementedError
    738                 return result
    739             return self._constructor(result, index=index, name=name, copy=False)

NotImplementedError: 

這在 Python 2.7 中完美運行,但我需要在 Python 3.x 中運行它

我需要找到解決這個問題的方法。 非常感謝。

In [181]: RCA
Out[181]: 
       ct1  ct2  ct3  ct4
ind_1    1    0    0    0
ind_2    1    1    1    0
ind_3    0    0    1    0
ind_4    0    1    0    1
ind_5    1    0    1    0
In [182]: norms = RCA.sum()
In [183]: norms
Out[183]: 
ct1    3
ct2    2
ct3    3
ct4    1
dtype: int64
In [184]: np.maximum.outer(norms,norms)
Traceback (most recent call last):
  File "<ipython-input-184-d24a173874f6>", line 1, in <module>
    np.maximum.outer(norms,norms)
  File "/usr/local/lib/python3.8/dist-packages/pandas/core/generic.py", line 2032, in __array_ufunc__
    return arraylike.array_ufunc(self, ufunc, method, *inputs, **kwargs)
  File "/usr/local/lib/python3.8/dist-packages/pandas/core/arraylike.py", line 381, in array_ufunc
    result = reconstruct(result)
  File "/usr/local/lib/python3.8/dist-packages/pandas/core/arraylike.py", line 334, in reconstruct
    raise NotImplementedError
NotImplementedError

有時將數據幀(或系列)傳遞給 numpy 函數可以正常工作,但顯然在這里我們需要顯式使用數組值:

In [185]: norms.values
Out[185]: array([3, 2, 3, 1])
In [186]: np.maximum.outer(norms.values,norms.values)
Out[186]: 
array([[3, 3, 3, 3],
       [3, 2, 3, 2],
       [3, 3, 3, 3],
       [3, 2, 3, 1]])

實際上查看回溯,顯然pandas ufunc適應其自身的用途。 np.maximum(norms,norms)有效,但顯然熊貓還沒有適應outer方法。 [186] 是純numpy ,返回一個數組。

普通np.maximum返回一個系列:

In [192]: np.maximum(norms,norms)
Out[192]: 
ct1    3
ct2    2
ct3    3
ct4    1
dtype: int64

outer返回一個二維數組,用pandas術語來說,它是一個數據框,而不是一個系列。 這可以解釋為什么 pandas 沒有實現outer

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM