一種計算每列或一行非零元素平均值的有效方法

Question

我有一個numpy數組用於電影用戶給出的評級。 評級介於1和5之間，而0表示用戶不對電影評分。 我想計算每部電影的平均評分，以及每個用戶的平均評分。 換句話說，我將計算每列或一行非零元素的平均值。

是否有一個高效的numpy數組函數來處理這種情況？ 我知道按列或行手動迭代評級可以解決問題。

提前致謝！

Answer 1

由於要丟棄的值為0，您可以通過沿軸進行求和然后除以非零元素的數量（沿同一軸）手動計算平均值：

a = np.array([[8.,9,7,0], [0,0,5,6]])
a.sum(1)/(a != 0).sum(1)

結果是：

array([ 8. ,  5.5])

正如您所看到的，零不被視為平均值。

Answer 2

在將所有0值轉換為np.nanmean之后，您可以使用np.nan 。 請注意， np.nanmean僅適用於numpy 1.8 。

import numpy as np

ratings = np.array([[1,4,5,0],
                    [2,0,3,0],
                    [4,0,0,0]], dtype=np.float)


def get_means(ratings):
    ratings[np.where(ratings == 0)] = np.nan

    user_means = np.nanmean(ratings, axis=1)
    movie_means = np.nanmean(ratings, axis=0)

    return {'user_means' : user_means, 'movie_means' : movie_means}

結果：

>>> get_means(ratings)
{'movie_means': array([ 2.33333333,  4.        ,  4.        ,         nan]), 

'user_means': array([ 3.33333333,  2.5       ,  4.        ])}

Answer 3

另一種方法是使用屏蔽數組，屏蔽0值。 例如（使用@ Akavali的示例數據）：

In [30]: ratings = np.array([[1,4,5,0],
   ....:                     [2,0,3,0],
   ....:                     [4,0,0,0]], dtype=np.float)

使用ratings==0作為掩碼創建蒙版的ratings ：

In [31]: mratings = np.ma.masked_array(ratings, mask=ratings==0)

In [32]: mratings
Out[32]: 
masked_array(data =
 [[1.0 4.0 5.0 --]
 [2.0 -- 3.0 --]
 [4.0 -- -- --]],
             mask =
 [[False False False  True]
 [False  True False  True]
 [False  True  True  True]],
       fill_value = 1e+20)

現在計算每個軸的平均值：

In [33]: mratings.mean(axis=0)
Out[33]: 
masked_array(data = [2.3333333333333335 4.0 4.0 --],
             mask = [False False False  True],
       fill_value = 1e+20)

In [34]: mratings.mean(axis=1)
Out[34]: 
masked_array(data = [3.3333333333333335 2.5 4.0],
             mask = [False False False],
       fill_value = 1e+20)

一種計算每列或一行非零元素平均值的有效方法

問題描述

3 個解決方案

解決方案1
8 2014-01-11 02:19:48

解決方案2
5 2014-01-11 03:26:36

解決方案3
2 2014-01-11 04:52:04

一種計算每列或一行非零元素平均值的有效方法

問題描述

3 個解決方案

解決方案1 8 2014-01-11 02:19:48

解決方案2 5 2014-01-11 03:26:36

解決方案3 2 2014-01-11 04:52:04

解決方案1
8 2014-01-11 02:19:48

解決方案2
5 2014-01-11 03:26:36

解決方案3
2 2014-01-11 04:52:04