Pandas 創建一個新列，該列采用最常見的項目描述給定項目代碼

Question

我有一個看起來像這樣的 dataframe：

我想將項目的描述替換為基於組 # 的最常見描述，或者如果有平局，則使用第一個實例。

所以在上面的例子中：Chips Ketchup（1 個實例）被 Chips BBQ（2 個實例）替換，Cereal Chocolate 被 Cereal Honey（第一個實例）替換。

所需的 output 將是：

如果這太復雜了，我可以滿足於簡單地替換第一個實例而不考慮頻率。

提前致謝

Answer 1

您可以使用

df['Description'] = df.groupby('Group')['Description'].transform(lambda s: s.value_counts().index[0])

似乎Series.value_counts （與我也嘗試過的 Series.mode 不同）對第一次出現時出現相同次數的元素進行Series.mode 。 這種行為沒有記錄，所以我不確定你是否可以依賴它。