在熊貓數據框中的一個列中有多個值時如何計算值計數

Question

df

Name
Sri
Sri,Ram
Sri,Ram,kumar
Ram

我正在嘗試計算每個值的值計數。 使用時我沒有得到輸出

 df["Name"].values_count()

我想要的輸出是

 Sri     3
 Ram     3
 Kumar   1

Answer 1

split列， stack為長格式，然后count ：

df.Name.str.split(',', expand=True).stack().value_counts()

#Sri      3
#Ram      3
#kumar    1
#dtype: int64

或者可能：

df.Name.str.get_dummies(',').sum()

#Ram      3
#Sri      3
#kumar    1
#dtype: int64

或在value_counts之前連接：

pd.value_counts(pd.np.concatenate(df.Name.str.split(',')))

#Sri      3
#Ram      3
#kumar    1
#dtype: int64

時間：

%timeit df.Name.str.split(',', expand=True).stack().value_counts()
#1000 loops, best of 3: 1.02 ms per loop

%timeit df.Name.str.get_dummies(',').sum()
#1000 loops, best of 3: 1.18 ms per loop

%timeit pd.value_counts(pd.np.concatenate(df.Name.str.split(',')))
#1000 loops, best of 3: 573 µs per loop

# option from @Bharathshetty 
from collections import Counter
%timeit pd.Series(Counter((df['Name'].str.strip() + ',').sum().rstrip(',').split(',')))
# 1000 loops, best of 3: 498 µs per loop

# option inspired by @Bharathshetty 
%timeit pd.value_counts(df.Name.str.cat(sep=',').split(','))
# 1000 loops, best of 3: 483 µs per loop

在熊貓數據框中的一個列中有多個值時如何計算值計數

問題描述

1 個解決方案

解決方案1
4 已采納 2017-10-29 02:47:07

在熊貓數據框中的一個列中有多個值時如何計算值計數

問題描述

1 個解決方案

解決方案1 4 已采納 2017-10-29 02:47:07

解決方案1
4 已采納 2017-10-29 02:47:07