如何基於其他列在Python中創建等級列

Question

我有一個看起來像以下的python數據框：

該數據框已按'transaction_count'降序排列。 我想在該數據幀中創建另一個列“ rank”，其中包含cust_ID的出現次數。 我的願望輸出如下所示：

對於cust_ID = 1234，transaction_count = 4，等級將為1，對於下一次出現的cust_ID = 1234，等級將為2，依此類推。

除其他外，我嘗試了以下方法：

df['rank'] = df["cust_ID"].value_counts()
df.head(10)

但是等級列會被創建為所有NaN值

任何有關如何解決此問題的建議將不勝感激！

Answer 1

使用groupby + cumcount ：

df['rank'] = df.groupby('cust_ID').cumcount() + 1
print(df['rank'])

輸出量

0    1
1    2
2    1
3    1
4    2
5    3
Name: rank, dtype: int64

Answer 2

你可以做：

df['rank'] = df.groupby('cust_ID')['transaction_count'].rank(ascending=False)

輸出：

    cust_ID     associate_ID    transaction_count   rank
0   1234           608          4                   1.0
1   1234           785          1                   2.0
2   4789           345          2                   1.0
3   3456           268          5                   1.0
4   3456           725          3                   2.0
5   3456           795          1                   3.0

請注意，這不僅基於transaction_count值給出計數，而且還給出交易的等級。

如何基於其他列在Python中創建等級列

問題描述

2 個解決方案

解決方案1
2 已采納 2019-01-07 19:19:04

解決方案2
2 2019-01-07 19:19:16

如何基於其他列在Python中創建等級列

問題描述

2 個解決方案

解決方案1 2 已采納 2019-01-07 19:19:04

解決方案2 2 2019-01-07 19:19:16

解決方案1
2 已采納 2019-01-07 19:19:04

解決方案2
2 2019-01-07 19:19:16