Pandas Dataframe：從另一列中唯一值最多的列中查找唯一值

Question

我有以下 pandas dataframe

df = pd.DataFrame([[99, 88, 88, 66, 66, 99, 66, 77, 77, 77, 66, 66, 99, 99], list('DAABBBBABCBDDD'), ['***','**','****','*','***','*','**','***','*','*','****','**','**','****']]).T
df.columns = ['col1','col2','col3']

假設 col1 是公司，col2 是產品類型。 我正在尋找擁有最多不同產品類型的公司。

所以我正在尋找 col1 中的哪個唯一值在 col2 中具有最大數量的唯一值

我嘗試了以下方法：

df.groupby(['col1'])['col2'].nunique()

返回：

現在我想從 col1 中獲取 col2 中最高值的值。 這是：

77    3

我努力了

df.groupby(['col2'])['col1'].nunique().max()

但是我只收到 col2 中唯一值的最大值

相反，我想知道 col2 的最大值和 col1 中的哪個值。 IE

 77    3

謝謝您的幫助！

Answer 1

我想知道 col2 的最大值和 col1 中的哪個值。

根據您的結果，同時調用：

result = df.groupby(['col1'])['col2'].nunique()
result.idxmax()  # 77
result.max()  # 3

您也可以在調用.loc[lambda d: d.idxmax()]之前將其轉換為 DataFrame 但我不知道您為什么要這樣做。

Answer 2

嘗試這個，

grouped=pd.DataFrame(df.groupby(['col1'])['col2'].nunique()).reset_index()
grouped[grouped['col2'] == grouped["col2"].max()]

Pandas Dataframe：從另一列中唯一值最多的列中查找唯一值

問題描述

2 個解決方案

解決方案1
0 已采納 2022-02-01 12:00:36

解決方案2
0 2022-02-01 12:14:55

Pandas Dataframe：從另一列中唯一值最多的列中查找唯一值

問題描述

2 個解決方案

解決方案1 0 已采納 2022-02-01 12:00:36

解決方案2 0 2022-02-01 12:14:55

解決方案1
0 已采納 2022-02-01 12:00:36

解決方案2
0 2022-02-01 12:14:55