如何計算熊貓中每個唯一值的出現次數

Question

我有大熊貓數據框，我想計算其中每個唯一值的出現次數，我嘗試遵循但需要花費大量時間和內存使用量。 我怎樣才能以pythonic的方式做到這一點？

pack=[]
for index,row in packets.iterrows ():
    pack.extend(pd.Series(row).dropna().values.tolist())

unique, count= np.unique(pack, return_counts=True)
counts= np.asarray((unique, count))

Answer 1

似乎您想計算所有列的值計數。 您可以將其展平為一個系列，刪除 NaN，然后調用value_counts 。 這是一個示例 -

df

     a    b
0  1.0  NaN
1  1.0  NaN
2  3.0  3.0
3  NaN  4.0
4  5.0  NaN
5  NaN  4.0
6  NaN  5.0

pd.Series(df.values.ravel()).dropna().value_counts()

5.0    2
4.0    2
3.0    2
1.0    2
dtype: int64

另一種方法是使用np.unique -

u, c = np.unique(pd.Series(df.values.ravel()).dropna().values, return_counts=True)
pd.Series(c, index=u)

1.0    2
3.0    2
4.0    2
5.0    2
dtype: int64

請注意，第一種方法按計數降序對結果進行排序，而后者則不然。

如何計算熊貓中每個唯一值的出現次數

問題描述

1 個解決方案

解決方案1
5 已采納 2017-12-28 19:16:35

如何計算熊貓中每個唯一值的出現次數

問題描述

1 個解決方案

解決方案1 5 已采納 2017-12-28 19:16:35

解決方案1
5 已采納 2017-12-28 19:16:35