按值排序 dataframe 返回“對於多索引，label 必須是一個元組，其中元素對應於每個級別。”

Question

Objective: 基於 dataframe 的 5 列，返回 dataframe 的 3 列，其中一列是計數，並按從最大到最小的計數排序。

我試過的：

df = df[['Country', 'Year','NumInstances']].groupby(['Country', 'Year']).agg(['count'])

df = df.sort_values(by='NumInstances', ascending=False)

print(df)

錯誤：ValueError：列 label 'NumInstances' 不是唯一的。 對於多索引，label 必須是一個元組，其元素對應於每個級別。

在這被標記為重復之前，我已經瀏覽了所有其他建議的重復，似乎它們都建議使用與我上面相同的代碼。

我正在做的一些小事情可能不正確嗎？

謝謝！

Answer 1

我想你需要刪除多索引 -

嘗試這個 -

df = df[['Country', 'Year','NumInstances']].groupby(['Country', 'Year']).agg(['count']).reset_index()

或者 -

df = df[['Country', 'Year','NumInstances']].groupby(['Country', 'Year'], as_index=False).agg(['count'])

Answer 2

發現問題。 向 NumInstances 列添加 agg 使 NumInstances 列名稱成為 ('NumInstances', 'sum') 的元組，因此我剛剛將排序代碼更新為：

df = df.sort_values(by=('NumInstances', 'sum'), ascending=False)

按值排序 dataframe 返回“對於多索引，label 必須是一個元組，其中元素對應於每個級別。”

問題描述

2 個解決方案

解決方案1
0 2021-04-17 18:31:41

解決方案2
0 2021-04-17 18:58:17

按值排序 dataframe 返回“對於多索引，label 必須是一個元組，其中元素對應於每個級別。”

問題描述

2 個解決方案

解決方案1 0 2021-04-17 18:31:41

解決方案2 0 2021-04-17 18:58:17

解決方案1
0 2021-04-17 18:31:41

解決方案2
0 2021-04-17 18:58:17